いやはや、AIの世界は、とんでもないことになってきました。
**********
昨年3月、世界最強とされる韓国人棋士に圧勝した囲碁人工知能「アルファ碁」の改良版「アルファ碁ゼロ」が開発され、旧アルファ碁との対局で100戦100勝の成績を挙げた。旧アルファ碁は過去のプロ棋士の対局を学習し、アルファ碁同士の対局(自己対局)を繰り返して進化を遂げたが、アルファ碁ゼロは「お手本」を必要とせず、自己対局だけで世界最強の能力を身に付けた。論文は19日付の英科学誌ネイチャー電子版に掲載された。
人工知能(AI)はさまざまな分野で目覚ましい進化を遂げているが、最初の学習には人間の専門家による知識が必要で、データ化や入手が難しいなどの問題があった。
米グーグル傘下の英グーグル・ディープマインド社が開発したアルファ碁ゼロは、過去の対局などの学習用データ入力なしに、白紙の状態から自己対局を繰り返して、指し手や盤面の評価を自ら学んでいくプログラムを搭載。旧アルファ碁では、人間の指し手の学習と訓練に数カ月かかっていたのに対し、アルファ碁ゼロは数日間、約500万回の自己対局で性能を向上させた。プログラムの改良により、計算に用いるコンピューターチップの数も少なくて済むという。
最強AI「アルファ碁ゼロ」、人間の棋譜頼らず強くなる
朝日新聞 2017年10月19日03時05分
世界最強の人間の棋士より強い囲碁の人工知能(AI)を開発した英ディープマインド社が、さらに腕前を上げたAI「アルファ碁ゼロ」を開発した。人間の棋譜は学ばず、AIどうしが対局を繰り返して上達し、独自の「定石」も見つけたという。18日の英科学誌ネイチャーで発表する。
同社の囲碁AIはこれまで、人間の棋士による過去の膨大な棋譜を学習したうえでAIどうしが繰り返し対局する「強化学習」という手法で腕を磨いてきた。2016年には韓国の李世乭(イセドル)九段を4勝1敗で下し、注目を集めた。
アルファ碁ゼロは、棋譜のデータに頼らず、人間の初心者以下の状態から強化学習だけで上達する。490万回の自己対局の後、李九段に勝ったAIと対局して、100戦全勝。2900万回の自己対局の後では、今年初めまでに日本の井山裕太・現七冠を含むトップ棋士らに60戦全勝したAI「アルファ碁マスター」も圧倒した。
基本的な打ち方のパターンとされる定石の多くに自力で到達しただけでなく、これまで知られていない定石も見つけた。同社のデビッド・シルバー博士は、「(コンピューターに)『まっさら』の状態から学ばせる技術は、囲碁以外のどんな分野にでも応用できる」と話している。
論文はウェブサイト(http://nature.com/articles/doi:10.1038/nature24270別ウインドウで開きます)で読める。(小宮山亮磨)
新たな囲碁AI、人から学ばず、自ら試行錯誤、最強に―AlphaGo Zero(アルファゴゼロ)
AlphaGoは、Google傘下でAI研究を手掛ける企業DeepMindが開発した。世界1位の評判を持つ人間の棋士、柯潔氏を破り、最強の名を得た。ただしそれ以前に、碁の打ち方を学ぶために何千ものアマチュア、それにプロの棋士、既存の囲碁ソフトなどと試合をしている。
改良版であるAlphaGo Zeroはそうはせず、自分自身だけを相手に完全に無作為に碁を打って学習し、40日間で柯潔を倒した従来版のAlphaGoに勝利するまでに強くなった。これは「強化学習」という新たな技術を採用することで可能になった。
「もはや人間の知識の限界に制約されていない」とDeepMindは説明している。
なおAlphaGo Zeroの開発でつちかった技術は、人類社会のために役立つ新たな知識の発見に生かす考えだ。タンパク質の折りたたみ、エネルギー消費の削減、革新的な新素材の探索など、囲碁以外の構造化された問題にも応用したいとしている。
独習するAI「アルファ碁ゼロ」、英ディープマインドが開発 “定石”自力獲得
アルファ碁ゼロは初めはランダムに指すが自己対局を繰り返すたびに性能が上がる。学習3日で、韓国トップ棋士を下したときのアルファ碁には100戦全勝した。490万回自己対局を重ねると、すべての旧タイプのアルファ碁を破った。
アルファ碁ゼロは盤上の石の配置だけを学習データとして利用し、人間がデータを入力する必要はない。大型計算機などの計算資源は旧タイプの10分の1以下で済む。学習の過程で人間の棋士たちが長年紡いできた“定石”を見いだし、新しい“定石”を作ることにも成功した。
従来のAI研究は人間の研究者が“定石”などのルールをプログラムしてAIを強化してきた。アルファ碁は“定石”をデータから学び、アルファ碁ゼロは“定石”を自力で獲得したことになる。
成果は19日、英科学誌ネイチャーに掲載された。
【ファシリテーターのコメント】
AIの競争軸がデータからシミュレーションに移行したのだと思います。Data is new Oil、データの独占競争に負けるな、という記事を書いてきましたが、競争原理が変わろうとしています。完全にシミュレーションできる囲碁のような世界はAIはビッグデータに頼らず独力でどうにかできるようになります。データよりもアルゴリズムと計算力の比重が大きくなり、データが成長限界ではなくなると思います。ロボットの動作獲得はすぐ応用できると思います。ただこの世をシミュレーションできるのは極一部です。これからは、いかに上手いシミュレーションを作って反復学習させ、データ独占の壁を壊すか。サービスが価値を生むまでの流れのどこをシミュレーションで切り取るかが重要になります。データ同化をAIで回すことになります。ビジネスにおいてシミュレーション×AIとデータ×AIと人間の専門家、武器が増えたのは良いことです。アルファ碁ゼロのやっている強化学習を理解し、別問題に適応する力がほしいです。
小寺 貴之
※コメント投稿者のブログIDはブログ作成者のみに通知されます