統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(14)

2016-09-02 12:12:19 | 日記・エッセイ・コラム
このブログは「すぐに役立つ統計のコツ」(オーム社)でご紹介できなかった統計に関する色々な事を書いています。
今回は、前号に続き分割表形式における「相関」の求め方についてご紹介します。
 
それでは、「すぐに役立つ統計のコツ」第6章(66ページ)を開いて下さい。
 
本書の例題(データ)は下記の情報統計研究所(HP)からダウンロード出来ますのでご利用下さい。
 
 
前号は「2×2分割表」での関連をみる方法でした。今回はそれ以外の代表的な方法をご紹介します。
 
● 独立(C)係数(Contingency Coefficient)
分割表のカイ二乗値を下記の式に代入すれば求められます。
 
C=√χ^2/(χ^2+N) :N=度数の合計、√=ルート
 
例題として、「本書49ページ(表5.16):年代別のコレステロールの比較」を用いてみましょう。
 
 
 
カイ二乗値と総度数は、
χ^2=6.624
N=100
 
ですので、
 
C=√6.624/(6.624+100)=0.249
 
となり、関連は小さいようです。
 
● クラメールのV 係数(Cramer's contingence coefficient)
分割表のカイ二乗値を下記の式に代入すれば求められます。
 
V=√χ^2/(N×k) :N=度数の合計、k=行数・列数の小さい方
 
C係数と同じ例題を用いてみましょう。
 
V=√6.624/(100×1)=0.257
 
C係数より、やや高くなっています。
 

● ポリコリック相関係数(Polychoric correlation ceefficient)
多分相関係数とか項目間多分相関係数とか言われるものです。
 
この特徴は、行・列ともに順序尺度の「L×M分割表」に適用します。
 
例題として、
あるアンケート集計で医師と看護師の評価が次の様であったとします。
 
 
この計算は、最尤推定法を用いるのでデータ解析環境「R」での方法を紹介します。
 
***
y<- matrix(c(30,15,5,25,30,10,10,15,20),3,3)
y
library(polycor)
polychor(y, ML=T, std.err=T)
 
Polychoric Correlation, ML est. = 0.4474 (0.08314)
Test of bivariate normality: Chisquare = 2.311, df = 3, p = 0.5104
 
  Row Thresholds
  Threshold   Std.Err.
1   -0.2393   0.09978
2    0.7730   0.11100
 

  Column Thresholds
  Threshold  Std.Err.
1   -0.4897     0.1032
2    0.5753   0.1055
***
 

情報統計研究はここから