統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(52)

2010-08-21 17:18:46 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここからお気軽に

筆者の若いころの話ですが、生体信号の伝送(テレメトリー)実験のため無線通信(国家試験)の勉強をしているときに、参考書で Receiver Operating Characteristic, ROC(受信者操作特性)と言う変わった名前? の信号処理の概念があったことを良く記憶しています。
もともとは、
第二次世界大戦中にレーダーレシーバーオペレータがシグナル(例えば、敵機、敵の目標、友好的な船など)をノイズ(例えば、鳥の群れ)と区別するオペレータの技量を見るためのものでしたが、1970 年代になって、医学での有用性が認められてから”受信者”は”受診者”となり、医学での意志決定において盛んに用いられる様になりました。その ROC については、
多くの商用統計ソフトやフリーソフトがあります。そこで、主な商用ソフトとフリーソフトについて、あまり単純でない 図 1(データ A)と 図 2(データ B)の ROC 曲線について、その統計量を比較してみました。
表1は図1と図2 の各ROCパッケージ の出力結果(Sensitivity 、Specifisity 、AUC)です 。

図1:データ AのROC曲線(GraphicPad)
Roc_acurve_2

図2:データ BのROC曲線(GraphicPad)
Roc_bcurve_2

表1 商用統計ソフトとフリーソフトの出力結果
Comparison_roc_soft_2

表1の様に、
著名な商用統計ソフト(SPSS、JMP、MedCalc、GraphicPad、ROCR)ではすべて一致していました。R-program では histgram とlogistic の当てはめでは違いがみられました。また、
フリーソフトの SPBS 、WROCfit(Bootstrap法)、Jhans Hopking でも、それぞれ違った結果となりました。それぞれの分析ソフトのアルゴリズムを詳しく調べた訳ではありませんので、何とも言えませんが、商用統計ソフトであれ、フリーソフトであれ、基本的には、”histgram などによる区分”、”logistic model などへの当てはめ”、あるいは、”bootstrap などによるシュミレーション”など、アルゴリズムに違いがあります。要するに、
統計ソフトのそれらの違いを納得して使用すべきではないでしょうか。

Note:
The quality of ROC according to this classification .

ROC curve AUC     Quallity
1.0 ~0.9          Excellent
0.9 ~0.8          Good
0.8 ~0.7          Fair
0.7 ~0.6          Poor
0.6~             Fail


医学と統計(51):Steel Dwass による多重比較

2010-08-10 10:16:24 | 日記・エッセイ・コラム

医学と統計(51):Steel Dwass による多重比較

情報統計研究所へのアクセスはここからお気軽に
http://kstat.sakura.ne.jp

前回のSteel test は対照群との比較であり、Steel dwass はすべての群と比較する検定で、Tukey のノンパラメトリック版と言えます。
前回と同じ仮想データを用いたSteel dwass はMS-Excelで次によりおこなうことが出来ます。

図1 MS-Exceによる方法(1)
無投与群と中度投与群の対比の場合:

「Rnk-1 , Rank-2」は「無投与群:中度投与群」を一つにして順位付けしたもので、
Excel関数では「=RANK.AVG()」を使うと便利でしょう.
 Rank-1:=RANK.AVG(A2,$A$2:$B$6,0)
 Rank-2:=RANK.AVG(B2,$A$2:$B$6,0)

 R1^2, R2^2:Rank-1の2乗、Rank-2の2乗

図2 MS-Exceによる方法((2):計算方法


  
 R (順位和):各列の合計値
 n (個数) :各列の個数
 N (総数) :全個数(nの合計)

 E (期待値):=D8*(E9+1)/2
 Calc-1   :=D8*E8/(E9*(E9-1))
 Calc-2   :=F7+G7
 Calc-3   :=E9*(E9+1)^2/4
 Calc-4   :=D12-D13

 Vr (分散) :=D11*D14

 t 0(統計量):=(D7-D10)/SQRT(D15)

そして、「無投与群:高度投与群」、「中度投与群:高度投与群」について行えば
検定統計量(t0)は次のようになります。

Steel dwass test:
--------------------------------------------------------------------------------
検定統計量(t0)    無投与群   中度投与群   高度投与群
   無投与群                   -
   中度投与群         2.4023              - 
   高度投与群         2.6112          2.4023                -
--------------------------------------------------------------------------------
検定統計量(t0) は「スチューデント化範囲の%点」から、
  q ( 3,∞,0.05 )/sqrt (2)=2.3437

ですので、
 t0 >= q ( 3,∞,0.05 )/sqrt(2)  から、すべての群で統計学的に有意と言えます。

前回と今回の StellとSteel dwass の方法をまとめると次のようになります。

パラメトリック法      ノンパラメトリック法
      Dunnett                          Steel
      Tukey                       Steel dwass

もし、群間にのみ注目するなら、ANOVA や Kruskal-Wallis を省略しても良いのではないかとの意見もあります。確かに、
ANOVA や Kruskal-Wallis で N.S. であっても、多重比較で有意になることもあります。最近では、
初めから多重比較をおこなっている論文も見受けられます。もし、わずかの水準で ANOVA や Kruskal-Wallis で有意差が認めらいなら、多重比較の結果を採用して良いと思います。

 




医学と統計(50)

2010-08-03 10:19:10 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここからお気軽に.
http://kstat.sakura.ne.jp

3群以上のノンパラメトリック法における多重比較において、Steel's test は対照群とその対照群と比較される他群との対比較検定です。Steel's test はセパレート型Dunnett ( separate type )と言われています。
用量に依存する実験データでのノンパラメトリックでは、セパレート型Dunnett である Steel を用います。

次の脂肪食餌を与えた群との血清 Cholesterol (mg%) の仮想データで検証してみましょう。

data:括弧内()は順位
  無  投与群 [ 135(1), 156(2), 178(3), 202(4), 226( 6) ]
  中度投与群 [ 208( 5), 244( 7), 254(8), 273(9), 317(11) ]
  高度投与群 [ 277(10), 333(12), 353(13), 357(14), 370(15) ]

図1 MS-Exceによる方法(1)


例えば、「無投与群:中度投与群」の比較だと、それぞれの順位の平均を次により求めます(詳しくはExcelマニュアルを参照)。
 Rank-1:=RANK.AVG(A2,$A$2:$B$6,0)
 Rank-2:=RANK.AVG(B2,$A$2:$B$6,0)

 R1^2:=(E2-$E$9)^2
 R2^2:=(F2-$E$9)^2

図2 MS-Exceによる方法((2):計算方法

 

n(n1, n2), N:各群の個数とその総和
E9(aveN):=(D9+1)/2
R2:=SUM(F2:F6), =SUM(G2:G6), =SUM(H2:H6)
S :=C10+D10
V2:=B12/C12

t2(統計量):=ABS((E9-B10/C9)/SQRT(D12))

「中度投与群:高度投与群」の組合せについても同様に行う。

ダネットの片側5%点(α=0.05)は d ( 3, ∞, 0.05 )=1.9163、 両側5%点(α=0.05)は d ( 3, ∞, 0.05 )=2.2121 ですので、
Steel's test ( セパレート型Dunnett )では次のようになりました。Steel's test ( separate type Dunnett ):
---------------------------------------------------------------
検定統計量(t0)     中度投与群     高度投与群
    無投与群              2.4023             2.6112
---------------------------------------------------------------
ダネットの片側5%点(α=0.05)は、d(3,∞,0.05)=1.9163、ダネットの量側5%点(α=0.05)は、d(3,∞,0.05)=2.2121(Rho;ρの補正なし)ですので、
中度及び高度投与群ともに統計学的に”有意差あり”と判断されます。