統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(54)

2010-10-04 11:03:12 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここからお気軽に

適合度の検定の実例として、無作為に選ばれた40名の血液型と日本人の血液型の割合に偏りがあるかどうかの検定方法を出来る限り分かり易く説明しましょう。そして、

<<統計の出し方が全くわかりません。
「情報統計研究所」さんのやさしい医学統計手法を見てみましたが、全くやさしく無かったです。>>

に対して、多少ともご参考になれば幸いです。
まずは、
日本人の血液型の割合は、
 A:B:O:AB=4:2:3:1 ですので、

40名に換算した日本人に血液型の度数は次の通りです。
 A:B:O:AB=16:8:12:4

これを、図1の様にまとめます。

図1:40名の血液型と日本人の血液型の度数
Bludtype1_2

図1をもとに、図2の「計算-1」と「計算-2」を行います。

図2:統計値(量)の計算
Bludtype2_2

ここで、
 「計算-1」=[(40名の度数)-(40名換算の日本人の度数)] を2乗します。

次に、
 「計算-2」=[ 計算-1 ] / [ 40名換算の日本人の度数 ] 、すなわち、[ 計算-1 ] を [ 40名換算の日本人の度数 ] で割ります。

そして、
 「 計算-2 」をすべて合計した値が求める統計値(量)となります。

40名の血液型と日本人の血液型の割合に統計学的な偏りがあるかどうかは、p 値をみって判定します。
最近は、統計表を見るより、MSエクセルの統計関数を使うことが多くなりました。
図2 の統計学的判定値が p 値であり、「= CHIDIST( 2.5, 3 ) 」で求める事が出来ます。
CHIDISTの「 2.5 」は図2 の統計値で、「3」は自由度です。自由度は「例数-1」で、ここでの例数とは血液型(A、B、O、AB)の 4つですので、自由度=4-1=3 となります。
図2の結果から、
統計学的判定値(p 値)は p=0.4753 で p>0.05 ですので、統計学的に「血液型の割合に差があるとは言えない」と推測します。
何故、「差がない」と結論付けないのかなど・・・、興味を持っていただければ幸いです。

「P.S.」
「R」環境では次により求めることが出来ます。
chisq.test ( x=c ( 12,10,12,6 ) , p=c( 0.4,0.2,0.3,0.1 ) )

Chi-squared test for given probabilities
data:  c ( 12, 10, 12, 6 )
X-squared = 2.5 , df = 3 , p-value = 0.4753