このブログは「すぐに役立つ統計のコツ」(オーム社)でご紹介できなかった統計に関する色々な事を書いています。
今回は、前号に続き分割表形式における「相関」の求め方についてご紹介します。
今回は、前号に続き分割表形式における「相関」の求め方についてご紹介します。
それでは、「すぐに役立つ統計のコツ」第6章(66ページ)を開いて下さい。
本書の例題(データ)は下記の情報統計研究所(HP)からダウンロード出来ますのでご利用下さい。
前号は「2×2分割表」での関連をみる方法でした。今回はそれ以外の代表的な方法をご紹介します。
● 独立(C)係数(Contingency Coefficient)
分割表のカイ二乗値を下記の式に代入すれば求められます。
分割表のカイ二乗値を下記の式に代入すれば求められます。
C=√χ^2/(χ^2+N) :N=度数の合計、√=ルート
例題として、「本書49ページ(表5.16):年代別のコレステロールの比較」を用いてみましょう。
カイ二乗値と総度数は、
χ^2=6.624
N=100
N=100
ですので、
C=√6.624/(6.624+100)=0.249
となり、関連は小さいようです。
● クラメールのV 係数(Cramer's contingence coefficient)
分割表のカイ二乗値を下記の式に代入すれば求められます。
V=√χ^2/(N×k) :N=度数の合計、k=行数・列数の小さい方
C係数と同じ例題を用いてみましょう。
V=√6.624/(100×1)=0.257
C係数より、やや高くなっています。
● ポリコリック相関係数(Polychoric correlation ceefficient)
多分相関係数とか項目間多分相関係数とか言われるものです。
この特徴は、行・列ともに順序尺度の「L×M分割表」に適用します。
例題として、
あるアンケート集計で医師と看護師の評価が次の様であったとします。
あるアンケート集計で医師と看護師の評価が次の様であったとします。
この計算は、最尤推定法を用いるのでデータ解析環境「R」での方法を紹介します。
***
y<- matrix(c(30,15,5,25,30,10,10,15,20),3,3)
y
library(polycor)
polychor(y, ML=T, std.err=T)
y<- matrix(c(30,15,5,25,30,10,10,15,20),3,3)
y
library(polycor)
polychor(y, ML=T, std.err=T)
Polychoric Correlation, ML est. = 0.4474 (0.08314)
Test of bivariate normality: Chisquare = 2.311, df = 3, p = 0.5104
Row Thresholds
Threshold Std.Err.
1 -0.2393 0.09978
2 0.7730 0.11100
Threshold Std.Err.
1 -0.2393 0.09978
2 0.7730 0.11100
Column Thresholds
Threshold Std.Err.
1 -0.4897 0.1032
2 0.5753 0.1055
***
2 0.5753 0.1055
***
情報統計研究はここから