> My Notes
> 統計学とかR(R言語)とかPython3とかプログラミングとかの覚え書きとか走り書きとか。 座右の銘にしたい: All work and no play makes Jack a dull boy.
> R(R言語) ノンパラメトリック検定(適合度検定、カイ二乗検定、基準値との比較、一様性の検定)、chisq.test()
http://my-notes.hatenablog.com/entry/2017/09/14/001050
で,観測値が理論比に従うかの検定についての記事がある。
============================================
コードは冗長であるが,要するに,
あるカテゴリー変数について母比率が p = c(0.4, 0.2, 0.3, 0.1) であるとき,
標本での観察値が x = c(152, 102, 58, 188) のとき,標本比率が母比率と同じか?という検定をすること。
筆者は,
> x = c(152, 102, 58, 188)
> chisq.test(x)
Chi-squared test for given probabilities
data: x
X-squared = 77.728, df = 3, p-value < 2.2e-16
としてしまっている。これでは,母比率が一様である,つまり p= c(0.25, 0.25, 0.25, 0.25) の検定をしていることになる。
> chisq.test(x, p= c(0.25, 0.25, 0.25, 0.25))
Chi-squared test for given probabilities
data: x
X-squared = 77.728, df = 3, p-value < 2.2e-16 # X-squared が同じ値
しかし,母比率は p = c(0.4, 0.2, 0.3, 0.1) なのだから,これは間違っている。
> chisq.test(x, p= c(0.4, 0.2, 0.3, 0.1))
Chi-squared test for given probabilities
data: x
X-squared = 448.87, df = 3, p-value < 2.2e-16
とすべき。
まあ,all or none の結論から言えばどちらも,帰無仮説を棄却することには成るんだが,間違いは間違い。
R を自習するということなら問題ないが,間違った自習結果を公表するのは問題がある。
些細なことではあるが,大きな問題は,「間違いを指摘しようにも,コメントを受け付ける態勢にない」ということ。
天上天下唯我独尊というのはいただけないなあ。(前には,コメントを受け付けていて,コメントしたこともあると思うのだが,それが不愉快だったのでコメント拒否にしたのかな)