統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(39)

2010-01-23 17:07:41 | インポート

情報統計研究所へのアクセスはここから。

前回はカイ自乗検定での効果量(e.s.)と検出力(power)について考えました。今回は比率の差の検定での効果量などを考えて見ましょう。例題として、
前回と同様に、「やさしい医学統計手法」(下記URL)から引用します。
http://kstat.sakura.ne.jp/medical/med_008.htm

「例題10」の表15は次のようになっています。
      標本     検査総数     Ⅲ型分類数     分類率
    A施設       1058              642             60.68%
    B施設         218              112              51.38%

この例題は、
顕微鏡的細胞診検査で2つの施設間においてⅢ型分類の比率に差があるかを問うものです(Ⅲ型が多いと診断精度に疑問が生じます)。
 ・ 検定統計量Zによる検定では、
                Z0=2.4665、p=0.0136
 ・ 検定統計量カイ自乗による検定では、
                Chi-squared=6.094(Yatesの補正)、p=0.01356

となり、有意な差があると言えます。
その効果量はe.s.=0.1877、検出力はpower=0.449 ですので、Cohenの効果量の目安から「中~大」と言ったところでしょうか。
図1:BarPlot
Figure15

それでは、
次のような少数例題ではどうでしょうか。
           薬剤        改善        改善せず        計        非改善率
            A              20              15               35          0.4286
            B             25                 5               30          0.1667
(やさしい医学統計手法「表16」を改変使用)

この様な比率の差の検定は、Fisher's Exact Probabirity Test の対象となり、
 Pr=0.02098(片側)、Pr=0.03139(両側)

から、2つの薬剤の非改善率に有意な差があると言えます。
検出力は、
次のRプログラムから求めることが出来ます。
 Rプログラム
 library(statmod)
  power.fisher.test(0.4286, 0,1667, 35, 30, alpha=0.05, nsim=100)
  power=0.63

これを、前述の比率の差の検定と同じ方法で求めると、
 Chi-squared=4.0449(Yatesの補正)、p=0.0443(有意)
  効果量e.s.=0.5863、検出力power(α=0.05)=0.654

となり、Fisher's test の結果をほぼ同等の結果となりました。
図2:BarPlot
Figure16

 


医学と統計(38)

2010-01-02 12:29:44 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから。

前回に続き効果量と検出力について考えて見ましょう。
母平均の差の検定には、常に、2つの過誤(α-error と β-error)が付きものです。

図:2つの過誤
Photo

検出力は、検出力=1-β であり、本当に差がある場合に正しく検出できる確率です。
参照先(やさしい医学統計手法「3.1.3」)
URL:
  http://kstat.sakura.ne.jp/medical/med_001.htm

前回の例題における標本検出力は、検出力=f(Na , Nb , e.s. , α)から、適切な検出力があったか、どうかを知る事が出来ます。適切な検出力かどうかは、
「A Power Primer by Tacob. Cohen ( 1992 )」の「Table1; ES Indexes and Their values of Small , Medium and Large Effects」を参考にして下さい。t-test での e.s. のは、
      Small=0.20 , Medium=0.50 , Large=0.80

となっていますので、0.80を目安にすれば良いと思います。前回の例題から、
有意差のあったA年代間の有意水準(α=0.05)の検出力は次の通りです。

                                t-value(p-value)   e.s.   power
      A年代とB年代  3.297(0.0018)   0.952   0.898
      A年代とC年代  2.445(0.0325)   0.893   0.664

ここで、A年代とC年代間のPower を上げるには、C年代のデータ数(N)を増やす必要が有りそうです。C年代のデータ数を N=21 にしたとき、
       Welth t-value=3.278、p=0.002 となり、e.s.=0.933、Power=0.895

となりました。この様に、2つの平均値の差の検定結果に、e.s. と Power を併記するようになれば、検定結果の信頼性を高めるかも知れません。