昨日はMasterの嵐と題して、その猛威を観賞しましたが、
手を拱いているだけではあれなので、人間なりに囲碁AIの手を翻訳してみたいと思います。
まずは柯潔九段との碁です。
Master(白)vs潜伏〔柯潔九段〕(黒)
1図 ここで柯潔九段は黒1と打ちましたが、実はこの手は中国AI刑天との対局で実験済みでしたね。
悪くない感触があったのでMaster戦でも採用したのでしょう。刑天は白Aと打ちましたが、Masterは白2。
2図 その後は白4、6と縦横無尽のサバキです。
では朴廷桓九段との碁を見てみましょう。
Master(白)vs maker〔朴廷桓九段〕(黒)
3図 以前の記事でも紹介しましたが、やはり白1。
AlphaGoの自己対戦では白Aの碁が紹介されています。
その対局では4図 続いてこのような進行でした。
5図 実戦ではこのようになりました。雰囲気は似ていますが
4図白11よりも5図白7の方が石が中央に向かって躍動していて好ましいかもしれません。
MasterはAlphaGoという噂がありますが・・・4図の自己対戦は2016年2月末の棋譜です。
柯潔九段の1図黒1など中国流周辺はAlphaGo登場以来また改めて研究されるようになった背景があります。
しかしもしMasterがAlphaGoの進化系だったとしたら・・・10ヶ月前の棋譜の研究で対抗するのは厳しいですね
3図の時点で狭い小目周辺に入るのは人間には気づきにくいですが、その辺りが地になるかどうかが勝率と密接な関係があるのでしょう。
他にMasterがよく打つ形も紹介します。
6図 黒2までは人間の定石にありますが、Masterは白3からもりもり隅を地にします。
李世ドル九段の碁で白3を見たように記憶していますが、他に採用した人間はほとんどいませんでした。
7図 このような配石でも白3と打ちました。黒は6と単に切った碁もありました。
8図 普通の定石はこれ(白7でAもある)ですが、Zenもこれは打たないですね。白5で他の手を打つことが多かったはずです。
よくよく見れば白5は白△とサカレ形です。
普段、サカレ形はいけないと教えているのに、これに疑問を持たなかった自分が不思議ですね。言われてみれば確かに白5は良くなさそうです。
6図~8図ではどれもサカレ形風になってしまいますが、6、7図は白の先手なのが大きいですね。
もう一つだけ、面白いと思った場面を。
9図 なんでもないことですが、黒1の小ゲイマジマリがプチニュースでした。
それまでは黒A、もしくはBを打ってからAが多く、違う配石でも大ゲイマがほとんどで小ゲイマは少なかったのです。
しかしよく考えてみると、100万局単位で自己対戦するコンピューターにとって
「3局連続で2間にしまったから2間が良いと思ってる」なんて理屈は通用しません。
3万局ぐらい連続だったら信憑性が出てきますが・・・・
同じ局面でも違う手を打つことは多々ありますので、盲信しないで見ることが大切です。
しかし、方向性だけは掴んだ方が良いというのが現時点での私の考えです。
例えば1図、3図のような中国流の局面では小目から上辺にかけてがメインの戦場と認識しているんだな、とか9図でも小目近辺が大事なのかな
という感じです。
昨日の対局でMasterは50連勝。50連勝で正体を明かすかと思いきや
今日も普通に対局しています。
これは100までやるつもりでしょうか?
まだまだ目が離せませんね。
大変丁寧な回答ありがとうございます.確かに,あのサイトの記述は,アルファ碁のログを見たプロ棋士による解説であって,アルファ碁の開発チームの見解とは限らないというのは仰る通りだと思います.ただ,あのサイトを読んでいたこともあり,個人的には「アルファ碁は読めていた」という見方はかなり一般的だと思っていたので,大橋先生の見解を異端のように扱う週刊碁の記事の書き方には少し違和感を覚えました.大橋先生はアルファ碁を正当に評価しているのに,記事ではややアルファ碁を過小評価する(したい)ような書き方だな,と感じたのかもしれません.
しかし,新型アルファ碁Masterの力を見せつけられた今となっては,当時読めてたかどうかなんて瑣末なことですね..すでに始まっているMaster棋譜のウェブでの解説や出版予定の本,非常に楽しみにしています.コンピューター囲碁に精通したプロ棋士として,大橋先生この一年は引っ張りだこで忙しくなりそうですが,くれぐれもご自愛下さいませ.
ご指摘ありがとうございます。
もちろんそのサイトは知っています。
ただ示された図はAlphaGoの思考ログとFanプロ、古力九段、周九段の検討図が入り混じっていると解釈しています。
手があることが示されている=AlphaGoのログに残っている、とは必ずしも言えないかなと。。
誤解を招くかと心配していただきありがとうございます。じつは「独自の~」は表現を変えていただこうかと編集部とも相談を重ねました。
石塔シボリは自己対戦第1局の左辺、セドル9段との第2局左下の変化の中などでいずれもきれいに回避しているので、それらを総合してやはりAlphaGoは読めていると思います。ここまでが「私の見解」ということで、コメント欄で長くなりましたが補足とさせて頂きます。
masterはチャットで、alphagoの黄博士であるというような発言をしたように思います。alphagoの開発メンバーを存じあげないのではっきりしたことは言えませんが、alphagoとの関連は間違いなさそうですね。
簡単な数式を使って、先と2子のハンデ差は同じでないことを示したのですが、本文が長過ぎてコメント欄に蹴られてしまったようです。
前回コメントは本文が消えてしまいました。
先生のツィートについてブログのコメントに書くのもなんですが、当方ツィッターをやっておりませんので、こちらに失礼させていただきます。
結論から言うと、先と2子のハンデ差は等価でないと思います。
第n手目の価値をV(n)とすると、互いに最前手を尽くせば、価値の高い手から打つはずなので、
n>m ならば V(n) < V(m) となり
V(N) = 0 となると終局となります。
黒番(奇数手)と白番(偶数手)の打つ手の価値の総和を
S(黒) = V(1) + V(3) + …
S(白) = V(2) + V(4) + …
とすると、その差S(黒) -S(白) が黒と白の優位性の差で現在のコミに相当すると考えられます。
すなわち、
S(黒) -S(白) = 6.5
そして、この差が先のハンデ差と同じになります。
上の式を書き換えると
S(黒) -S(白) = V(1)-V(2) + V(3)-V(4) + … =6.5
となります。
これは黒白交互に打った場合の第n手目と第n+1手目の価値の微小な差の累積が黒の優位性になっていることを示しています。
もし、第n手目と第n+1手目の価値に差がなく、
常に V(n) - V(n+1) =0
ならば、先生の仮説通り先と2子のハンデ差は同じになります。
先のとき
S(黒) = V(1) + V(3) + V(5) + …
S(白) = V(2) + V(4) + …
S(黒) -S(白) = V(1) - (V(2) - V(3)) - (V(4) - V(5)) …
=V(1)
2子(黒が第1手目、第2手目を打つ)のとき、
S(黒) = V(1) + V(2) + V(4) + …
S(白) = V(3) + V(5) + …
S(黒) -S(白) = V(1) + (V(2) - V(3)) + (V(4) - V(5)) …
=V(1)
となり先も2子もともにハンデ差はV(1)になる。
おそらく、先生のツィートはこのことをおっしゃっているのでしょう。
しかし、この場合
S(黒) -S(白) = V(1)-V(2) + V(3)-V(4) + … = 0
となり、そもそもコミなしで黒白互角となりおかしいことになります。
長文になるので割愛しますが、この考えを進めていくと、結局先より2子の方がハンデ差が大きいことを示すことができます。
以上ですが、長文失礼しました。
結論からいうと、やはり等価でないと思います。
まず、第n手目の価値をV(n)とすると、お互い最善手を尽くせば、価値の大きい手から打たれていくので
m<n ならば V(m)<V(n)で
V(N)= 0 となったときが終局です。
黒番(奇数手)の価値の総和
S(黒)= V(1)+V(3)+…
と、白番(偶数手)の価値の総和
S(白)= V(2)+V(4)+…
の差が現在のコミの差、すなわち
S(黒)-S(白)= 6.5
だと考えられます。
また、先のハンデ差とはまさしくこの6.5の差です。
さて、S(黒)-S(白)を書き換えると
S(黒)-S(白)= V(1)-V(2) + V(3)-V(4) + … =6.5
となります。
つまり黒白交互に打った際の価値の差の微小な累積が先の優位性と同じだとも言えます。
n手目とn+1手目の価値に差がないとき、つまり
V(n+1)-V(n) = 0
なら、先生の仮説のように先も2子も等価になります。
が、それならそもそも
S(黒)-S(白)= 0
となり、コミなどなくても黒白互角となって、おかしいことが明らかです。
さて2子の場合、第1手V(1)と第2手V(2)を黒が打ったことになるので
S(黒)= V(1)+ V(2)+V(4)+…
S(白)= V(3)+V(5)+…
となり、
S(黒)-S(白)= V(1)+ V(2)-V(3) + V(4)-V(5) + …
となります。
V(1)-V(2) + V(3)-V(4) + … と
V(2)-V(3) + V(4)-V(5) + … が
近似的に同じ6.5なら、2子のハンデ差は
S(黒)-S(白)= V(1) + 6.5
で先の差より先着したV(1)の価値だけまるまる大きいことになります。
仮にV(2)-V(3) + V(4)-V(5) + … が6.5より小さいとしても、0より大きいのは自明で
空き隅先着のV(1)の価値が6.5より大きいのも明らかなので、
やはり2子のハンデは先より大きいと言えます。
ここでは、Vの定義やその他の細かい仮定を省いて単純化していますが、論の筋道は概ね間違ってないと思います。
以上ですが、長文を失礼いたしました。
記事の中で,「アルファ碁が石塔シボリを読めるのかどうか,開発チームからは何も明らかにされていません」とあるのですが,Deep MindによるAlphaGo紹介ウェブサイトに乗っているイ・セドル戦の解説に,まさにそれが読めているため,損に見える変化をしたことが書いてあるのですが..
(私は以下のサイトから英語版のコメンタリーを読みました.セドル戦5試合目の62手あたりに当該の変化が出ています.
参考URL: https://deepmind.com/research/alphago/alphago-games-english/
)
Fan Huiさんの解説という形ですが,「公式見解」と言っていいものだと思うので,「大橋六段独自の見解」という書き方は誤解を招くかと思いました.大橋先生はすでにご存知で,編集の過程でこういう記述の仕方になったのかもしれないですが,気になったので書き込ませていただきました.今後も囲碁AI関連の記事を楽しみにしております.
プロが3子置けば、神が相手でも安心・安全という固い手を打ち続けても余裕でリードを保てると信じたいのですが、、、