統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(79)

2012-02-15 17:12:43 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから.

ノンパラ検定と等分散について(2).

前回はデータを自然対数変換で正規近似とし「Student's t-test」(等分散)を行いました.
それでは、同じデータを使って「Wilcoxon Mann-Whitney test 」を行って見ましょう.

SAS-JMP の結果
Sasjmp

「R」 program の結果
R

「R」program では、次の3法を用いて比較しました.
 Wilcox.test(x , y)
 
  library(exactRankTests)
  wilcox.exact(x, y)

 library(lawstat)
  brunner.munzel.test(x,y)

不等分散での「Wilcoxon Mann-Whitney test 」は上記の「brunner.munzel.test(x,y)」が薦められています.
ここでの p-value  は 「brunner.munzel.test」 が最も小さく有意になり易い様です(ここでは!).
正規分布でなければ当然のようにノンパラメトリック検定を無条件で選択していたのなら、この記事を見て「へ~~」と思われた方は今後の分析でチョット試してみて下さい.
比較的に大きい標本なら有意であることに変わりないじゃないかって・・・思われるかも知れませんが、小標本になると微妙なシーンも出てくると思われます.
それでは、その様なシーンを予想して、
「NONPARAMETRIC STATISTICS : FOR the Behavioral Sciences by Sidney Siegel」(1956, McGraw-Hill Book)
から引用させていただき、極めて小さな標本での結果を見てみましょう.

例題1
------------------------------------------------
experimental  score = 9, 11, 15
control  score = 6, 8, 10, 13

例題1の結果(両側検定)
Wilcoxon rank sum test
data:  x and y
W = 9, p-value = 0.4
   
Exact Wilcoxon rank sum test
data:  x and y
W = 9, p-value = 0.4
      
Brunner-Munzel Test
data:  x and y
Brunner-Munzel Test Statistic = -1.1619, df = 4.948,
p-value = 0.2982
------------------------------------------------

例題2
------------------------------------------------
experimental  mouse = 78, 64, 75, 45, 82
control  mouse = 110, 70, 53, 51

例題2の結果(両側検定)
Wilcoxon rank sum test
data:  x and y
W = 11, p-value = 0.9048

Exact Wilcoxon rank sum test
data:  x and y
W = 11, p-value = 0.9048

Brunner-Munzel Test
data:  x and y
Brunner-Munzel Test Statistic = -0.2093, df = 6.024,
p-value = 0.8411
------------------------------------------------


医学と統計(78)

2012-02-01 11:36:34 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから.

ノンパラ検定と等分散について.

母集団の分布に関係なく検定できる ノンパラメトリック法として Wilcoxon Mann-Whitoney test(WMW) が良く用いられています.ところが、
ノンパラメトリック 検定は等分散、すなわち、バラツキが同じでなけでばいけないと言うのです.Wilcoxon test の教科書などを見ると、確かに、同じ母集団から取られたものかどうかを検定するものとあります.

下記の論文を見てみて下さい.
http://www.creative-wisdom.com/teaching/WBI/parametric_test.shtml

Wmwtest

不等分散(unequal)でのWMWは not acceptable となっておりおります(詳しくは論文をお読み下さい).

そもそも医学において、正規分布する実験データはほとんどありませんし、極めて少数データを扱うことが稀ではないので、母集団の正規性や等分散性を満足させるなど、正直に言ってはなはだ困難と言えます.そもそも母集団って何だ・・・ってことですが、
ある病院の呼吸器科を受診した患者(咳や痰などの症状)の血中 IgE をランダムに調べました.表1は血中IgE値(RIST)の測定値です.

表1 呼吸器科受診患者の血中 IgE値
(non=アレルギーなし、AD=アレルギーあり)
Table1_ige_2 

ここでの IgE値は同一母集団からのものと言えますが、もし仮に、健常者と喘息患者(アレルギー疾患など)の血液を意識的に分けて採血し測定したなら、もちろん同一母集団からのデータとは言えません.

表1の IgE値の分布を見てみましょう(図1).

図1 IgEのヒストグラムとBoxPlot
Ige_histgram_2 

RIST 法で使用する検量線から求めた IgE 値は片側に尾を引く歪んだ分布になり、下記(表2) の等分散の検定結果からも等分散とは言えません.

表2 等分散性の検定結果
Table2_equaltest_2

この様な歪んだ分布では自然対数変換を試みます.そうすると、
IgE 値は図2 の様に正規分布近似となり正規性の検定(Shapiro-Wilks test)も満足できる結果を得ました.

図2 自然対数変換後のIgE値の分布
Logchange

また、等分散性の検定も表3 の様に正規性を仮定しても良さそうです.

表3 自然対数変換後の等分散性の検定結果
Table3_logequaltest

この様なデータ変換によって正規分布近似を満足できれば、対数変換値で通常の Student's t-test を行うことが出来ます.
「student's t-test」の結果は次の通りです. 
 t-value=4.1105、df=32、p-value<0.0001

しかし、
ここでは不等分散の WMW 検定をテーマにしていますので、Wilcoxon Mann-Whitoney test を行って見ましょう.

次回に続く!