日々の寝言~Daily Nonsense~

先手と後手の勝率の差の検定

棋王戦の中継ブログを見ていたら、
ちょっとおもしろいデータが載っていた。

今年度の羽生二冠の戦績は、
先手番で24勝5敗、勝率0.83
後手番で19勝11敗、勝率0.63、だそうだ。

せっかくなので、先手と後手で勝率に差があるか、
先手勝率のほうが後手勝率よりも高いか、
を統計的に検定してみようと思った。

帰無仮説:先手と後手の勝率は等しく
0.73(43勝16敗)である

比の差の検定に使う統計量については、
たとえばここを参照。

ここに書いてあるZ値というのを計算してみる。
これは、先後の勝率の差を、全体勝率やデータ数で
正規化したような値だ。

結果は、Z=1.35 になった。
この値は平均0分散1の正規分布に従うとされているので
Zが1.35より大きな値を取る確率はおよそ 0.089 となる。

つまり、先後の勝率が等しいとした場合に、
そこからサンプルされたデータに、
今回の羽生さんの結果以上の偏りが生じる確率は、
8.9%くらいはある、ということだ。

したがって、
危険率(帰無仮説が正しいのに棄却してしまう確率)を
5%に設定すると、両側でも、片側でも、
「勝率が等しい」という帰無仮説を棄却できない。

危険率を10%に取れば、片側では有意になるが、
危険率10%は普通使われないので、
結論としては、上のデータにおける先手後手の勝率の差は
統計的には有意ではない、ということになるだろう。

一見するとかなり違っているように見えるのだが、
データ数がそれなりにあっても、
後手番の勝率が5割を切るくらいでないと、
統計的には有意にならない感じだ。

ところで、Z値のような正規化した統計量を使うのは、
その値を、正規分布などのよく知られた
数表のある確率分布と比較できるようにするためだ。

今は、コンピュータがあるのだから、
駒音でみなかみさんがやっているように、
直接的にシミュレーションをして、
今回の羽生さんのデータ以上の差が出る確率の
近似値を求めることもできるはずだ。

たとえば、先後の勝率が等しく 0.73 であるとして、
p=0.73 の二項分布から先手番29サンプル、
後手番30サンプルを生成する。
これを10,000回くらい繰り返して、
そのうちで、勝率の差が上記のデータ以上になった
ケースの割合を調べればよいのではないか?

いつか暇なときにやってみたい。

ところで、棋王戦の第4局は、
羽生二冠が後手番でごきげん中飛車を採用したが、
佐藤二冠の抑え込みにあって完敗した。

羽生二冠クラスでも、ちょっとうっかりすると
序盤でいきなり不利になってしまう、
というのが現代将棋。

このシリーズで、後手番ごきげん中飛車には、
引導が渡されてしまうのかもしれない。

それでも、ぎりぎりの攻防に持ってゆくところは
さすがに羽生さんだったのだが、
そこで、最後の力を振絞った
佐藤さんの終盤の踏み込みが素晴らしかった。

この二人の戦いは、ここにきて
ますます熟成してきた感じがある。

やっているほうはすごく大変なのだろうと思うが、
ほんとうに楽しそうというか、見ごたえがある。
  • Xでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

最新の画像もっと見る

最近の「将棋・ゲーム」カテゴリーもっと見る

最近の記事
バックナンバー
人気記事