情報統計研究所へのアクセスはここからお気軽に
適合度の検定の実例として、無作為に選ばれた40名の血液型と日本人の血液型の割合に偏りがあるかどうかの検定方法を出来る限り分かり易く説明しましょう。そして、
<<統計の出し方が全くわかりません。
「情報統計研究所」さんのやさしい医学統計手法を見てみましたが、全くやさしく無かったです。>>
に対して、多少ともご参考になれば幸いです。
まずは、
日本人の血液型の割合は、
A:B:O:AB=4:2:3:1 ですので、
40名に換算した日本人に血液型の度数は次の通りです。
A:B:O:AB=16:8:12:4
これを、図1の様にまとめます。
図1をもとに、図2の「計算-1」と「計算-2」を行います。
ここで、
「計算-1」=[(40名の度数)-(40名換算の日本人の度数)] を2乗します。
次に、
「計算-2」=[ 計算-1 ] / [ 40名換算の日本人の度数 ] 、すなわち、[ 計算-1 ] を [ 40名換算の日本人の度数 ] で割ります。
そして、
「 計算-2 」をすべて合計した値が求める統計値(量)となります。
40名の血液型と日本人の血液型の割合に統計学的な偏りがあるかどうかは、p 値をみって判定します。
最近は、統計表を見るより、MSエクセルの統計関数を使うことが多くなりました。
図2 の統計学的判定値が p 値であり、「= CHIDIST( 2.5, 3 ) 」で求める事が出来ます。
CHIDISTの「 2.5 」は図2 の統計値で、「3」は自由度です。自由度は「例数-1」で、ここでの例数とは血液型(A、B、O、AB)の 4つですので、自由度=4-1=3 となります。
図2の結果から、
統計学的判定値(p 値)は p=0.4753 で p>0.05 ですので、統計学的に「血液型の割合に差があるとは言えない」と推測します。
何故、「差がない」と結論付けないのかなど・・・、興味を持っていただければ幸いです。
「P.S.」
「R」環境では次により求めることが出来ます。
chisq.test ( x=c ( 12,10,12,6 ) , p=c( 0.4,0.2,0.3,0.1 ) )
Chi-squared test for given probabilities
data: c ( 12, 10, 12, 6 )
X-squared = 2.5 , df = 3 , p-value = 0.4753