15期生の美宅です。
AlphaGO(アルファ碁)とは、Googleが開発した囲碁システムです。
先日、AlphaGOがプロ棋士にハンディキャップなし(互先)で勝利した、としてニュースになりました。(イギリスの科学雑誌「ネイチャー」 2016/1/26発表)
コンピューターがプロ棋士にハンディキャップなしで勝ったは初めてのことです。
私は囲碁を中学の時に覚えました。棋力は大したことなく、アマ初段くらいだったでしょうか。これまでソフトをいろいろ試してきましたが、意味不明のいかにもコンピューター的な着手が多くて臨場感がなく、遠ざかっていました。
しかし、2012年ころ、再びソフトを試してみたらものすごく「それっぽく」なっていて驚きました。今も使っている銀星囲碁13というものです。棋力もアマ6段クラスになっていて全く歯が立ちません(^^;
ちなみに、アマ初段はプロ初段に9子のハンディキャップをつけてようやく互角と言われています。1子=1段の差なので、銀星囲碁13ではプロ棋士には全く通用しないということになります。
囲碁はチェスや将棋と違って、盤上の石に「役割」はありません。
どれも同じただの石で、その価値、強弱...といったものは盤面全体の状況次第で刻々と変わります。こういうものはコンピューターが苦手とする領域に見えます。
何本か記事を読んでみて感じた事が3点あります。
1.上手い人の真似をすると上達が早い
AlphaGOは3,000万にのぼるプロの棋譜を用いてトレーニングし、その後、自分自身と対局を繰り返し強化学習を行いました。守⇒破ですね。
今、日本で一番強いと思っている井山裕太名人(26)が、AlphaGOとプロ棋士との対局を見て、
「すでにどちらが人間か分からない打ちぶりになった」
と話したそうです。
最初は徹底的に真似をすることが学習の王道のようです。
2.進化は連続的ではない
コンピューター囲碁はモンテカルロ法の登場により飛躍的に強くなりました。GoogleのAlphaGOではディープラーニングを取り入れることでブレークスルーを果たしました。飛躍的な進歩が起きるとき、根本的な部分の革新があります。
3.技術の進化が後押し
ディープラーニングのアイデア自体は1980年代以前から提唱されていましたが、当時はコンピューターの処理能力が追い付かず実現しなかったそうです。
Googleは囲碁システムを開発して何を狙っているのか?
「グーグルやトヨタなどの大企業が、ディープラーニングの手法を取り入れて車の自動運転を実現しようと、開発にしのぎを削っています。今回、グーグルが発表した、囲碁で人間のプロ棋士に勝つというのも、そうした研究開発の一環として行われたプロジェクトでした。」
(NHK NEWS WEB)
今後も注目したいと思います。
参考URL
Google Japan Blog AlphaGo: マシンラーニングで囲碁を
NHK NEWS WEB 人工知能グーグル囲碁の衝撃