第2局も黒番のアルファ碁が圧勝。
いやー、恐ろしいほど強い・・・
YouTube 解説のレドモンドさんは、
もうちょっとお手上げという感じで、
「創造的な手を打った」と評していた(と思う)。
一見無謀そうに見えたが、
後になっていい手だったとわかった、
という手があったそうだ。
終局後の記者会見で、
「アルファ碁の弱点は?」と聞かれた
イ・セドル九段は、苦笑いしながら
「私にはわからない」と言っていた。
* * *
アルファ碁は、世間的には、Deep Learning(深層学習)
で強くなったと言われていて、まぁ確かにそうなのだが、
個人的には、深層学習と強化学習の組み合わせによって、
ついに強化学習が花開いた、という印象も強い。
強化学習は、少し前までは、どちらかというと、
おもちゃの問題か、理論的研究かしか無かったと思うのだが、
一昨年のアタリのゲームに続いて、囲碁でも、その有効性が
実証されてしまったのは、かなりのブレークスルーだと思う。
コンピュータ将棋が人間に勝ったときには、
基本的には教師あり学習だけで、
自己対戦的な強化学習は使われていなかったと思う。
(やねうら王は使っていると言われているが)
今回、囲碁はゲームで、完全にシミュレーションが可能
というのがうまくいった一つの理由と思うが、前のエントリーにも書いたように、
これまた進化している物理シミュレーションエンジン
と組み合わせれば、ロボットへの応用はすぐのような気がする。
と書いていたら Google のブログで既にロボットへの応用が・・・
(シミュレータは使っていないが、複数台で学習させている)
しかも、シミュレータというのは、要するに予測器なので、
人間のように厳密なシミュレーションが難しい場合は、
シミュレータ自体も Deep Learning などで作ればよいのだ。
これが実は、脳がやっていること、なのかもしれない・・・
というような妄想が湧いてくるくらい、
インパクトのある強さだった。
いやはや、まいったなぁ・・・
* * *
アルファ碁についての書き物では、
清水亮さんのブログが面白かった。
こちらのブログもちょっと偏っていて、結論としては正しくない(強化学習の部分を評価していない)が、でも面白い論点を提供していると思う。
確かに、強化学習部分がどれくらい効いているのかは、
検証されるべきことだろう。
日本のプロ棋士の感想のまとめページ。
これも面白い。さすが ITmadia だ。
2ch 名人のコメントの中で、面白かったのは
> こんなに世界のトッププレイヤーを打ち破る快挙をなしとげても
> 泣いたり笑ったりするわけじゃない
> なんで自分が対戦しているかすら理解できない
> これが人工知能の限界だよ
なるほど・・・
(人間にとって)最適な意思決定のために、
そういう要素が必要なのかどうか、も面白い問題だ。
最新の画像もっと見る
最近の「将棋・ゲーム」カテゴリーもっと見る
最近の記事
カテゴリー
バックナンバー
人気記事