皆さんすでにご存知だと思いますが、年末年始囲碁界を賑わせた
Masterの正体はAlphaGoの進化バージョンでした。
結局「東洋囲碁」で30連勝「野狐囲碁」で30連勝
合わせて60連勝無敗、しかも相手のほとんどが世界のトップ棋士という前代未聞の記録です。
その後、ディープマインドのCEOデミス・ハサビス氏はコメントを発表。
この60局は非公式の公開テストで、また今年中に公式のイベントをするそうです。
一体これ以上の驚きがどこにあるのかという感じですが
そこは楽しみに待つよりしょうがないですね。
持ち時間を長くすることは間違いないと思いますが、トップ棋士の相談碁や打ち込み制も考えられるでしょう。
この60局はほとんど1手30秒の早碁でした。人間はもうちょっと考えればミスを減らすことが出来るでしょう。
もっともAlphaGoも更に正確になると思いますので、時間を長くした方が人間に有利!とは言い切れません。
いくつかのインタビューも受けました。
勝率は60分の1以下で、この60局の中で優勢になった局面は無かったと思われます。
そう考えると大きく見積もっても勝率は1%でしょう。
1月22日と29日は日本棋院でMaster=AlphaGoの解説会を行います。時間は午後1時から、詳細は追ってまた告知します。
また碁ワールドで連載中の「IGOサイエンス」でも3月号(2月中旬発売)から詳しく解説する運びとなっています。
今回のMasterの驚くべきところは、従来の囲碁AIの弱点と言われていたところが、ものの見事に解決しています。
例えば、死活、攻め合い、正確さが必要な長手順の読み、左右両側から絡めるような複雑な手順、コウなどです。
コウの場合はコウ材作りまでやってるように見えました。
それに加えて・・・
従来の囲碁AIは人間の棋譜から学習しており、部分的な新手は少なめでしたが、
Masterは独創的な手を序盤から繰り出しています。
このようにいくつか書き出してみると、2016年のAlphaGoからも格段の進歩ですね。
何かもう一つブレイクスルーがあったのではないでしょうか?
私の予想としては人間の棋譜学習の次の段階で、AlphaGo自身の強化学習がかなり成功したのではないかと思っています。
せっかくなので一つだけMasterの手を紹介しましょう。
1図 黒がMasterです。白10まで何気ない布石です。ここで人間はほとんどの場合Aと打ってきました。
しかしMasterは多くの場合手抜きするようです。人間の棋譜学習の延長でここを手抜きするようになるのでしょうか?
2図 続いて下辺に布陣します。黒3、5も好きな打ち方のようです。
そして白8を待って黒9、11が得意です。1図6、8、10が低位置なのでさほど攻めは厳しくないということでしょうか。
何局か見ましたが、右上隅が一段落する頃には黒が優勢になっているのが不思議です。