> 「そもそも、21とか14という少ない検体数では偶然の産物である場合が多すぎて、科学的にどうということは論じられない。そのため検定を行うことはほと んど意味をもたず、だから発表では検定の結果を示さなかったのかもしれない。今後の計画では150人に検体を増やしていくらしいが、少なくとも現段階での データは科学的意味を全く持たない」
そんなばかなことはない。
得られているサンプルサイズにおいて結果を判断するのが検定だ。
サンプルサイズが小さいということは,誤差も大きいということ。
その誤差よりも測定結果の差が大きいかどうかをみるのが検定だ。
「ミルクティーを作るとき,ミルクに紅茶をいれるのと,紅茶にミルクをいれるのがおなじかどうか」という話を知らないとはいわせないぜ。
http://analyze1842.blog133.fc2.com/blog-entry-36.html
まさに,「両側F検定(プププッ,変な名称を使うなよ)」だぜ。
> 150人のHLAを調べた結果が14人のときと全く同じであるとは考えられない。
サンプリングに偏りがないならば,150 人のときの該当数は 14 人のときの該当数の 150/14 倍になることが期待される。もっとも,その場合には,期待される該当数はおおむね 11 ずつ変化するので,誤差は大きいだろうけど。
もし,そうならないということなら,(最初の14人と後の何人かにおいて)サンプリングに偏りがあったということだ(どちらがズレているかはわからないが)。時間経過で傾向が変わったとか,複数の母集団を対象にした(背景因子が異なる集団からサンプリングされた)とか,理由はいろいろ。
さらに,もし該当の割合が大きく変わらないならば,サンプルサイズが大きくなるということは p 値は小さくなるということになる。
サンプルを2倍集めただけで,結論は大きく変わる。
結局の所は,ちゃんとした結果を出すために,どれくらいのサンプルを取らないといけないかを事前に評価してからデータを集める必要があるということ。
「データが増えるとどうなるかわからない」というのは,「適当にデータを集めて検定する」というのと,本質的に同じだ。
> fisher.test(matrix(c(1139, 1827, 24, 18), 2))
Fisher's Exact Test for Count Data
data: matrix(c(1139, 1827, 24, 18), 2)
p-value = 0.01625
> fisher.test(matrix(c(1139, 1827, 24*2, 18*2), 2))
Fisher's Exact Test for Count Data
data: matrix(c(1139, 1827, 24 * 2, 18 * 2), 2)
p-value = 0.000886