マーちゃんの数独日記

かっては数独解説。今はつれづれに旅行記や日常雑記など。

ディープランニングとはなにか(その1)

2016年07月27日 | IT

 人工知能(α碁)が、経験豊かな棋士でも思いつかないような手をどうして指せたのか。計算の速さで勝負してきた今までの人工知能とは明らかに違う。如何にしてα碁は急速に進化を遂げたのか。羽生はその秘密の鍵を求めて、開発者をロンドンに訪ねた。
 グーグルが買収したのはディープマインド社。巨額600億円を投じてでも手に入れたかったのが、この会社の最高経営責任者で、コンピューター科学者のデミス・ハサビス(39歳)。彼は10代の頃から天才プログラマーとして名を馳せ、16歳の時に飛び級でケンブリッチ大学に入学。その後、人工知能の研究に没頭。きっかけは4歳から始めたチェスだった。実は羽生のチェスの腕前も日本トップクラス。二人の天才の会話はチェスの手合わせから始まった。二人は2番争い1勝1敗と引き分けた。(写真:対戦前談笑するふたり)



 その後、羽生は英語で問いを発した。「あなたの人工知能は実に革新的だと言われています。これまでと何が違うのですか」と。ハムサビは「私の人工知能は人間の脳の働きに着想を得た新しいもの。脳の仕組みはひとつの物理的システム。だとすればコンピューターでも真似できるはず。革命的な技術のディープランニングを可能にするほどにプログラムの技術が進歩して来たとも言えます」と語った。(写真:質問に丁寧に答えるハサビス)  




 ディープランニングの技術を使ってハサビスがまず開発したのが、かなり以前に爆発的に流行った、”ブロック崩し“ゲームを攻略する人工知能だった。ブロック崩しゲームが登場したときは私は吃驚する以上に懐かしかった。何度も遊んだが攻略できなかったゲーム。(写真:かの”ブロック崩し”)








 人工知能に
ゲームのやり方は一切教えない。与えたのは高得点を取れという目標だけ。最初は玉を打ち返すことさえ分からない。ところが偶然100プレイー目にボールを跳ね返し、ブロックに当たり得点が入った。(写真右上参照)
 すると人工知能は玉を跳ね返しブロックに球を当てれば得点出来ることを学んだ。その後は試行錯誤を繰り返し高得点につながるパターンを記憶していく。遂には端を崩して天井裏に球を送るという高度な技まで見つけ出した。ゲームを始めて僅か4時間で完全攻略した。(写真右は天井裏を攻撃する人工知能側=ボール)

 このブロック崩し攻略方法はディープランニングの本質に迫るものではないと思うが、ディープランニングとは何かを上手に説明していると思えた。玉を打ち返せばいいと人間は知っても、上手く打ち返すにはかなりの熟練を必要とする。しかし人工知能は玉を打ち返すことが得点に繋がると知れば、内部に持つ計算能力を駆使して効率よく玉を打ち返す方法をマスターし、その様に“振る舞う”ことが出来るのだ。
 さてα碁におけるディープランニングはこんなに簡単ではないはず。どの様に組み込まれたのかは次回に。