情報統計研究所へのアクセスはここから.
ノンパラ検定と等分散について.
母集団の分布に関係なく検定できる ノンパラメトリック法として Wilcoxon Mann-Whitoney test(WMW) が良く用いられています.ところが、
ノンパラメトリック 検定は等分散、すなわち、バラツキが同じでなけでばいけないと言うのです.Wilcoxon test の教科書などを見ると、確かに、同じ母集団から取られたものかどうかを検定するものとあります.
下記の論文を見てみて下さい.
http://www.creative-wisdom.com/teaching/WBI/parametric_test.shtml
不等分散(unequal)でのWMWは not acceptable となっておりおります(詳しくは論文をお読み下さい).
そもそも医学において、正規分布する実験データはほとんどありませんし、極めて少数データを扱うことが稀ではないので、母集団の正規性や等分散性を満足させるなど、正直に言ってはなはだ困難と言えます.そもそも母集団って何だ・・・ってことですが、
ある病院の呼吸器科を受診した患者(咳や痰などの症状)の血中 IgE をランダムに調べました.表1は血中IgE値(RIST)の測定値です.
表1 呼吸器科受診患者の血中 IgE値
(non=アレルギーなし、AD=アレルギーあり)
ここでの IgE値は同一母集団からのものと言えますが、もし仮に、健常者と喘息患者(アレルギー疾患など)の血液を意識的に分けて採血し測定したなら、もちろん同一母集団からのデータとは言えません.
表1の IgE値の分布を見てみましょう(図1).
RIST 法で使用する検量線から求めた IgE 値は片側に尾を引く歪んだ分布になり、下記(表2) の等分散の検定結果からも等分散とは言えません.
この様な歪んだ分布では自然対数変換を試みます.そうすると、
IgE 値は図2 の様に正規分布近似となり正規性の検定(Shapiro-Wilks test)も満足できる結果を得ました.
また、等分散性の検定も表3 の様に正規性を仮定しても良さそうです.
表3 自然対数変換後の等分散性の検定結果
この様なデータ変換によって正規分布近似を満足できれば、対数変換値で通常の Student's t-test を行うことが出来ます.
「student's t-test」の結果は次の通りです.
t-value=4.1105、df=32、p-value<0.0001
しかし、
ここでは不等分散の WMW 検定をテーマにしていますので、Wilcoxon Mann-Whitoney test を行って見ましょう.
次回に続く!