14.代表的な心理統計法 海保博之
●心理統計の枠組
心理統計は、記述統計と推測統計とに分かれる。記述統計は、集められたデータに基づいて、そのデータを発生させた集団や個の特性を記述することをねらいとする。
推測統計は、データを発生された集団(標本)が抽出された元になる集団(母集団)の特性を、一定の仮定と約束事に従って、推測することをねらいとする。推測統計のイメージは、図1のように示すことができる。
図1 統計的推論の枠組み
ここで、統計量とは、標本の分布の特性(平均や分散など)にかかわる数値指標である。仮想的に、そうした統計量を無限に採取したときに得られる分布が標本分布である。標本から得られた一個の数値指標が、この標本分布のどこに位置するかを調べることによって、母集団についての一般化された結論を出そうするのが、推測統計である。
●代表的な心理統計法
「記述統計」
1)平均と標準偏差——記述統計
たくさんのデータを小数個のカテゴリーにまとめあげることによって、度数分布が得られる。度数分布の特性を数値的に表現するものとして、代表値と散布度とがある。代表値は、分布を代表する値、散布度は、代表値のまわりにデータがどれくらいちらばっているかを示す値である。平均xと標準偏差SDは、一番よく使われる代表値と散布度の指標である。Nをデータ数とすると、
x=
SD=
2)相関係数——記述統計
1つの対象(人)から、たとえば、身長と体重と足のサイズというように、複数のデータを取ることがある。その時、2つのデータの間に、全体としてどれくらいの関連があるかを知りたいときに、ピアソンの相関係数rが計算される。相関計数がプラスで高いほど、一方の値が大きくなれば他方の値も大きくなる傾向が強くあることになる。
r=
3)因子分析——記述統計
相関を計算できる特性が10個以上になることがごく普通にある。たとえば、子どもの学業成績と健康診断と意識調査を一緒にするような場合である。10個あれば、45対の相関が計算できる。これを行列の形にしたものが相関行列と呼ばれる。
この相関行列の中から、特性間の類似性の構造を探り出す手法の一つとして因子分析がある。そして、特性間の類似性の基盤にある潜在因子を推定することによって、複雑に関係する特性間の本質的な関係が見えてくる。
「推測統計」
1)母散の推定値——統計的推定
標本分散は前述の標準偏差を2乗したものである。母分散は、Nの代わりに、(N—1)で平均平方を割ったものである。これが、標本から推定された母集団の散らばりの推定値、母分散になる。
ちなみに、母平均と母比率は、標本平均、標本比率と同じになる。
これは、統計的推定の中でも、点推定と呼ばれる。推定には、もうひとつ、区間推定がある。内閣支持率が45%というのは点推定、45%支持率は、信頼度95%(または99%)で、43%から47%の間にある、が区間推定になる。
2)t−検定、F−検定——統計的検定
たとえば、治療的な介入をした群と介入しない群との間に、統計的に有意な差があるかどうかを判定したい、というような時に、2つの平均値、分散を使って次のような統計量を計算し、それが、理論的に計算されている値よりも大きければ(棄却域に落ちれば)、「統計的に有意」という一般的な結論を出す。
t=
F=
3)分散分析——統計的検定
3個以上の平均値間の差が統計的に有意かどうかを知りたい時に使うのが分散分析である。t−検定を繰りかえす方法もありうるが、これ以上の分析ができるので、分散分析のほうが望ましい。
分散分析の原理は、複数個要因の平均値間の差の散らばりが、個体差など、偶然の散らばりより大きいかを判定するところにある。
分散分析の長所は、2つある。一つは、複数個の特性(要因)を同時に取り上げて差を分析できることである。たとえば、ある心理療法の効果を病歴の長短も考慮に入れて分析する、といったことができる。
もうひとつの長所は、交互作用効果の分析ができることである。ある心理療法の効果が病歴の長さによって違うかどうかを知ることができる。
4)ノンパラメトリック検定——統計的検定
以上述べた推定は、すべて標本分布に依存した検定であった。そこでは、前提を満たすための厳しい制約条件があった。とりわけ、標本数は、少なくとも20個以上が確保されなければならなかった。
ノンパラメトリック検定は、10個以下くらいの少数個のデータだけからも一般的な結論が引き出せるような工夫をした検定である。
写真
昔の広告
東芝科学館