ちょっとおもしろいデータが載っていた。
今年度の羽生二冠の戦績は、
先手番で24勝5敗、勝率0.83
後手番で19勝11敗、勝率0.63、だそうだ。
せっかくなので、先手と後手で勝率に差があるか、
先手勝率のほうが後手勝率よりも高いか、
を統計的に検定してみようと思った。
帰無仮説:先手と後手の勝率は等しく
0.73(43勝16敗)である
比の差の検定に使う統計量については、
たとえばここを参照。
ここに書いてあるZ値というのを計算してみる。
これは、先後の勝率の差を、全体勝率やデータ数で
正規化したような値だ。
結果は、Z=1.35 になった。
この値は平均0分散1の正規分布に従うとされているので
Zが1.35より大きな値を取る確率はおよそ 0.089 となる。
つまり、先後の勝率が等しいとした場合に、
そこからサンプルされたデータに、
今回の羽生さんの結果以上の偏りが生じる確率は、
8.9%くらいはある、ということだ。
したがって、
危険率(帰無仮説が正しいのに棄却してしまう確率)を
5%に設定すると、両側でも、片側でも、
「勝率が等しい」という帰無仮説を棄却できない。
危険率を10%に取れば、片側では有意になるが、
危険率10%は普通使われないので、
結論としては、上のデータにおける先手後手の勝率の差は
統計的には有意ではない、ということになるだろう。
一見するとかなり違っているように見えるのだが、
データ数がそれなりにあっても、
後手番の勝率が5割を切るくらいでないと、
統計的には有意にならない感じだ。
ところで、Z値のような正規化した統計量を使うのは、
その値を、正規分布などのよく知られた
数表のある確率分布と比較できるようにするためだ。
今は、コンピュータがあるのだから、
駒音でみなかみさんがやっているように、
直接的にシミュレーションをして、
今回の羽生さんのデータ以上の差が出る確率の
近似値を求めることもできるはずだ。
たとえば、先後の勝率が等しく 0.73 であるとして、
p=0.73 の二項分布から先手番29サンプル、
後手番30サンプルを生成する。
これを10,000回くらい繰り返して、
そのうちで、勝率の差が上記のデータ以上になった
ケースの割合を調べればよいのではないか?
いつか暇なときにやってみたい。
ところで、棋王戦の第4局は、
羽生二冠が後手番でごきげん中飛車を採用したが、
佐藤二冠の抑え込みにあって完敗した。
羽生二冠クラスでも、ちょっとうっかりすると
序盤でいきなり不利になってしまう、
というのが現代将棋。
このシリーズで、後手番ごきげん中飛車には、
引導が渡されてしまうのかもしれない。
それでも、ぎりぎりの攻防に持ってゆくところは
さすがに羽生さんだったのだが、
そこで、最後の力を振絞った
佐藤さんの終盤の踏み込みが素晴らしかった。
この二人の戦いは、ここにきて
ますます熟成してきた感じがある。
やっているほうはすごく大変なのだろうと思うが、
ほんとうに楽しそうというか、見ごたえがある。
最新の画像もっと見る
最近の「将棋・ゲーム」カテゴリーもっと見る
最近の記事
カテゴリー
バックナンバー
人気記事