日々の寝言～Daily Nonsense～

先手と後手の勝率の差の検定

2008-03-22 22:16:59

棋王戦の中継ブログを見ていたら、
ちょっとおもしろいデータが載っていた。

今年度の羽生二冠の戦績は、
先手番で24勝5敗、勝率0.83
後手番で19勝11敗、勝率0.63、だそうだ。

せっかくなので、先手と後手で勝率に差があるか、
先手勝率のほうが後手勝率よりも高いか、
を統計的に検定してみようと思った。

帰無仮説：先手と後手の勝率は等しく
0.73(43勝16敗)である

比の差の検定に使う統計量については、
たとえばここを参照。

ここに書いてあるZ値というのを計算してみる。
これは、先後の勝率の差を、全体勝率やデータ数で
正規化したような値だ。

結果は、Z=1.35 になった。
この値は平均0分散1の正規分布に従うとされているので
Zが1.35より大きな値を取る確率はおよそ 0.089 となる。

つまり、先後の勝率が等しいとした場合に、
そこからサンプルされたデータに、
今回の羽生さんの結果以上の偏りが生じる確率は、
8.9%くらいはある、ということだ。

したがって、
危険率（帰無仮説が正しいのに棄却してしまう確率）を
5%に設定すると、両側でも、片側でも、
「勝率が等しい」という帰無仮説を棄却できない。

危険率を10%に取れば、片側では有意になるが、
危険率10%は普通使われないので、
結論としては、上のデータにおける先手後手の勝率の差は
統計的には有意ではない、ということになるだろう。

一見するとかなり違っているように見えるのだが、
データ数がそれなりにあっても、
後手番の勝率が5割を切るくらいでないと、
統計的には有意にならない感じだ。

ところで、Z値のような正規化した統計量を使うのは、
その値を、正規分布などのよく知られた
数表のある確率分布と比較できるようにするためだ。

今は、コンピュータがあるのだから、
駒音でみなかみさんがやっているように、
直接的にシミュレーションをして、
今回の羽生さんのデータ以上の差が出る確率の
近似値を求めることもできるはずだ。

たとえば、先後の勝率が等しく 0.73 であるとして、
p=0.73 の二項分布から先手番29サンプル、
後手番30サンプルを生成する。
これを10,000回くらい繰り返して、
そのうちで、勝率の差が上記のデータ以上になった
ケースの割合を調べればよいのではないか？

いつか暇なときにやってみたい。

ところで、棋王戦の第４局は、
羽生二冠が後手番でごきげん中飛車を採用したが、
佐藤二冠の抑え込みにあって完敗した。

羽生二冠クラスでも、ちょっとうっかりすると
序盤でいきなり不利になってしまう、
というのが現代将棋。

このシリーズで、後手番ごきげん中飛車には、
引導が渡されてしまうのかもしれない。

それでも、ぎりぎりの攻防に持ってゆくところは
さすがに羽生さんだったのだが、
そこで、最後の力を振絞った
佐藤さんの終盤の踏み込みが素晴らしかった。

この二人の戦いは、ここにきて
ますます熟成してきた感じがある。

やっているほうはすごく大変なのだろうと思うが、
ほんとうに楽しそうというか、見ごたえがある。

最近の「将棋・ゲーム」カテゴリーもっと見る

Seminar with Professor Geoffrey Hinton, at the Royal Swedish Academy of Engineering Sciences (IVA)

2024年12月12日

ストリートピアノお遍路計画（２０）福井県

2024年12月12日

ストリートピアノお遍路計画（１９）石川県

2024年12月12日

ストリートピアノお遍路計画（１８）富山県

2024年12月12日

ストリートピアノお遍路計画（１７）新潟県

2024年12月11日

カテゴリー

バックナンバー

2024年