アンダンテのだんだんと日記

ごたごたした生活の中から、ひとつずつ「いいこと」を探して、だんだんと優雅な生活を目指す日記

コンピュータが「神の一手」を目指す!?

2017年12月21日 | 生活
学生だったころ、パソコンソフトで将棋対局できるものが出てきたけど、当時はお話にならないくらい弱くて、私でも軽々ぼこぼこにできるくらいだった。

   にほんブログ村 教育ブログ 中高一貫教育へ←結局「学習」の方法がミソなの。それを考えてるのは人間だけどね。

当時、オセロだったらもうぜんぜん歯が立たない感じだったから、やっぱりオセロと将棋じゃ「広さ」が違うんだろうなぁって思ったけど、コンピュータで将棋を扱おうという試みは案外古くからあって、なんと私がゼロ歳だったとき(o_o) 「電子計算機で詰め将棋 アマ初段の腕前」(朝日新聞)という記事が出ている。
(「ルポ 電王戦 人間vs.コンピュータの真実」松本博文著より。以下同じ)

将棋そのものに比べると、王手を続けなきゃいけない詰め将棋ってフィールドははるかに「狭い」ので、当時のしょぼいコンピュータによる「読みつぶし」でかなりいけるわけだ。(本将棋の読みつぶしは今のスパコンでもできない)

時は流れて、我が家では第一子(またろう)が生まれて将棋どころじゃなくなったんで気が付いてなかったけど、1994年くらいに私はコンピュータ将棋に追いつかれ追い越された模様である(つまりアマ初段あたり)。

当時、強いコンピュータ将棋を作るポイントは、人間の知恵を取り込むということだった。

「私の作っているプログラムの基本方針は『自分が考えている事をすべてぶち込む』ことである」(1997年コンピュータ将棋選手権優勝、YSS将棋の山下氏)

また、「激指」(2002年コンピュータ将棋選手権優勝)は、羽生(はぶ)の棋譜を解析して、「駒得で取り返す」「駒得で駒を取る」「駒得で王手をかける」「飛車を成る」「角を成る」などが指される確率を調べ、実現する確率が高い局面を中心に読むなどの工夫をしていた。

そのように具体的なセオリーを取り込むことで強くする必要があるなら、開発者は将棋の強い人がいいってことになる。え? そんなの当たり前じゃないの、って?? いやそれが当たり前じゃなくなっていくんですよこのあと…

2005年に突然登場したBonanza。このソフトは、ネット上に無料で提供されて誰でもダウンロードして遊べるというところもすごいけれど、とにかくすごかったのはその強さ。強いアマチュアはコロコロ負ける。10秒将棋でやってみると奨励会員(注: プロのたまご)もころころ負ける(というかプロでもしばしば…)。

Bonanzaの特徴は「全幅探索」(広く浅く読む)と「機械学習」。つまり、形勢判断に関して人間のセオリーを教え込むのではなくて、コンピュータが評価項目とその基準を自動的に学習するのだ。学習の材料は、過去の棋譜データベース。というわけで、開発者の「将棋センス」は優れてなくてもかまわない(Bonanzaの開発者は弱いらしい)。

これはものすごく画期的なことで、しかも作り方が画期的だっただけではなくて、ソースコードを公開したところがすごくて、このあといろんなチームが開発競争してコンピュータ将棋の全体レベルが急速upした。なにしろ、Bonanzaのソースを持ってきて自分の改良を加えれば堂々とBonanza本人と対戦できるわけで。なんて太っ腹。

Ponanzaは、まぁ名前からしてもいかにもBonanzaのぱちもん(^^;; だけれど、やはりBonanzaに学んだソフトのひとつ。

ボンクラーズというソフトもあって、これは「ボナンザ・クラスタ」の略だそう。つまり、基本的な考え方はBonanza、そしてそれをえいやと多数つなげれば(クラスタ)強いだろう、どうだ!! みたいな(実際確かに強かったがたくさん並べて強くするってのもそれはそれで難しいものらしい)

その他も、いろんなソフトがBonanzaを母体として生まれ、さらなる進化を遂げていった。

Bonanzaは渡辺竜王に惜敗した(2007年)が、Ponanzaは屋敷九段に競り勝った(2014年)。

ここまで、コンピュータ将棋が強くなっていく流れは機械翻訳とよく似ている。機械翻訳の場合、当初は人間が知恵をまとめて教え込む方法(ルールベース)、それが統計学習を行うようになり(人間の翻訳をお手本とする自動学習)、さらに学習がニューラルネットになって格段に賢くなった。

しかしここからは将棋と翻訳の違うところで、翻訳は特に人間を超える意味がないというか、まぁベテラン翻訳者みたいに上手に訳してくれるうえに、しかもお腹が空かないし寝ないしうっかりミスもしない機械翻訳ができればそりゃ役には立つけれど、人智の及ばぬレベル(?)になるってことはない。人間が読むものだから。

一方、将棋は、人間より強いレベルを目指すということが当然考えられるわけで、ただそうすると人間からノウハウを教わってるんじゃ限界があるんだけれど、もう機械のほうが人間より強いなら、ってことで人間をあてにしない学習方法が編み出された。人間から知恵(ルール)を授かるのではなく、人間の成果物をお手本にする(統計学習)のでもなく、機械vs機械でひたすら対戦を重ねて強くなっていくという方法である。

この手で強くなったというElmoが2017年に世界コンピュータ将棋選手権で優勝。囲碁の世界でイ・セドルに勝ったAlpha碁もその方法で学習させたものだ。

さらに、Alpha碁の話には先があって、Alpha碁の場合いちおう人間が知っていること(定石)を教えたうえでそこから先は機械同士で学ばせたんだけど、ルール以外のノウハウを一切教えず、まっさら(ゼロ)から機械同士の対局で学ばせてみた(アルファゼロ)ところ、これがアルファ碁よりめっちゃ強くなってしまったという…

機械と機械があれば人間いらずで「神の一手」を追究していけるのですねぇ。おもしろいような寒いような。
#「神の一手」を目指すには優れた棋士が二人必要なのではなかったか…(←ヒカルの碁)

にほんブログ村 ピアノ  ←ぽちっと応援お願いします
にほんブログ村 ヴァイオリン ←こちらでも
にほんブログ村 中高一貫教育


「はじめての中学受験 第一志望合格のためにやってよかった5つのこと~アンダンテのだんだんと中受日記完結編」ダイヤモンド社 ←またろうがイラストを描いた本(^^)


「発達障害グレーゾーン まったり息子の成長日記」ダイヤモンド社
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする