夢と希望と笑いと涙の英語塾

INDECという名の東京高田馬場にある英語塾で繰り広げられる笑いと涙の物語
新入会員募集中!

史上最強のAIソフト、アルファ碁ゼロ誕生

2017年10月20日 04時37分17秒 | 囲碁

いやはや、AIの世界は、とんでもないことになってきました。

**********

アルファ碁、さらに進化=自己学習のみで最強に―グーグル

 昨年3月、世界最強とされる韓国人棋士に圧勝した囲碁人工知能「アルファ碁」の改良版「アルファ碁ゼロ」が開発され、旧アルファ碁との対局で100戦100勝の成績を挙げた。旧アルファ碁は過去のプロ棋士の対局を学習し、アルファ碁同士の対局(自己対局)を繰り返して進化を遂げたが、アルファ碁ゼロは「お手本」を必要とせず、自己対局だけで世界最強の能力を身に付けた。論文は19日付の英科学誌ネイチャー電子版に掲載された。

 人工知能(AI)はさまざまな分野で目覚ましい進化を遂げているが、最初の学習には人間の専門家による知識が必要で、データ化や入手が難しいなどの問題があった。

 米グーグル傘下の英グーグル・ディープマインド社が開発したアルファ碁ゼロは、過去の対局などの学習用データ入力なしに、白紙の状態から自己対局を繰り返して、指し手や盤面の評価を自ら学んでいくプログラムを搭載。旧アルファ碁では、人間の指し手の学習と訓練に数カ月かかっていたのに対し、アルファ碁ゼロは数日間、約500万回の自己対局で性能を向上させた。プログラムの改良により、計算に用いるコンピューターチップの数も少なくて済むという。 

最強AI「アルファ碁ゼロ」、人間の棋譜頼らず強くなる
朝日新聞 2017年10月19日03時05分

 世界最強の人間の棋士より強い囲碁の人工知能(AI)を開発した英ディープマインド社が、さらに腕前を上げたAI「アルファ碁ゼロ」を開発した。人間の棋譜は学ばず、AIどうしが対局を繰り返して上達し、独自の「定石」も見つけたという。18日の英科学誌ネイチャーで発表する。

 同社の囲碁AIはこれまで、人間の棋士による過去の膨大な棋譜を学習したうえでAIどうしが繰り返し対局する「強化学習」という手法で腕を磨いてきた。2016年には韓国の李世乭(イセドル)九段を4勝1敗で下し、注目を集めた。

 アルファ碁ゼロは、棋譜のデータに頼らず、人間の初心者以下の状態から強化学習だけで上達する。490万回の自己対局の後、李九段に勝ったAIと対局して、100戦全勝2900万回の自己対局の後では、今年初めまでに日本の井山裕太・現七冠を含むトップ棋士らに60戦全勝したAI「アルファ碁マスター」も圧倒した。

 基本的な打ち方のパターンとされる定石の多くに自力で到達しただけでなく、これまで知られていない定石も見つけた。同社のデビッド・シルバー博士は、「(コンピューターに)『まっさら』の状態から学ばせる技術は、囲碁以外のどんな分野にでも応用できる」と話している。

 論文はウェブサイト(http://nature.com/articles/doi:10.1038/nature24270別ウインドウで開きます)で読める。(小宮山亮磨)

新たな囲碁AI、人から学ばず、自ら試行錯誤、最強に―AlphaGo Zero(アルファゴゼロ)

人工知能(AI)技術を応用して囲碁を打つ「AlphaGo」の改良版「AlphaGo Zero」が発表になった。過去に人間の棋士の打ち方を学ばず、自分で発見、考案した手法だけで最強の存在になった。

AlphaGoは、Google傘下でAI研究を手掛ける企業DeepMindが開発した。世界1位の評判を持つ人間の棋士、柯潔氏を破り、最強の名を得た。ただしそれ以前に、碁の打ち方を学ぶために何千ものアマチュア、それにプロの棋士、既存の囲碁ソフトなどと試合をしている。

改良版であるAlphaGo Zeroはそうはせず、自分自身だけを相手に完全に無作為に碁を打って学習し、40日間で柯潔を倒した従来版のAlphaGoに勝利するまでに強くなった。これは「強化学習」という新たな技術を採用することで可能になった。

「もはや人間の知識の限界に制約されていない」とDeepMindは説明している。

なおAlphaGo Zeroの開発でつちかった技術は、人類社会のために役立つ新たな知識の発見に生かす考えだ。タンパク質の折りたたみ、エネルギー消費の削減、革新的な新素材の探索など、囲碁以外の構造化された問題にも応用したいとしている。
 

独習するAI「アルファ碁ゼロ」、英ディープマインドが開発 “定石”自力獲得

 米グーグルの親会社アルファベット傘下の英ディープマインドは、独学でゼロから囲碁を学ぶ人工知能(AI)「アルファ碁ゼロ」を開発した。2016年に韓国のトップ棋士を破った「アルファ碁」は人間が対局した棋譜を学習用データに利用した。これに対し、アルファ碁ゼロは自己対局で碁の打ち筋を学ぶ。学習開始3日で人間のトップ棋士を破る実力を身につけ、学習40日には旧タイプのアルファ碁などすべての知能に勝る力をつけた。

 アルファ碁ゼロは初めはランダムに指すが自己対局を繰り返すたびに性能が上がる。学習3日で、韓国トップ棋士を下したときのアルファ碁には100戦全勝した。490万回自己対局を重ねると、すべての旧タイプのアルファ碁を破った。

 アルファ碁ゼロは盤上の石の配置だけを学習データとして利用し、人間がデータを入力する必要はない。大型計算機などの計算資源は旧タイプの10分の1以下で済む。学習の過程で人間の棋士たちが長年紡いできた“定石”を見いだし、新しい“定石”を作ることにも成功した。

 従来のAI研究は人間の研究者が“定石”などのルールをプログラムしてAIを強化してきた。アルファ碁は“定石”をデータから学び、アルファ碁ゼロは“定石”を自力で獲得したことになる。

 成果は19日、英科学誌ネイチャーに掲載された。

【ファシリテーターのコメント】

 AIの競争軸がデータからシミュレーションに移行したのだと思います。Data is new Oil、データの独占競争に負けるな、という記事を書いてきましたが、競争原理が変わろうとしています。完全にシミュレーションできる囲碁のような世界はAIはビッグデータに頼らず独力でどうにかできるようになります。データよりもアルゴリズムと計算力の比重が大きくなり、データが成長限界ではなくなると思います。ロボットの動作獲得はすぐ応用できると思います。ただこの世をシミュレーションできるのは極一部です。これからは、いかに上手いシミュレーションを作って反復学習させ、データ独占の壁を壊すか。サービスが価値を生むまでの流れのどこをシミュレーションで切り取るかが重要になります。データ同化をAIで回すことになります。ビジネスにおいてシミュレーション×AIとデータ×AIと人間の専門家、武器が増えたのは良いことです。アルファ碁ゼロのやっている強化学習を理解し、別問題に適応する力がほしいです。
小寺 貴之
 
**********
 
凄いですねえ、アルファ碁ゼロ!先達を学ばずに、自力で強くなる。しかも、たった3日で世界トップの人間棋士に勝てるようになり、40日で世界最強のAI碁になってしまったのですから。
 
もうこうなったら、さすがに人間は「強化学習」できませんから、アルファ碁ゼロが見つけた新しい定石や布石を盗んで、それを応用して異次元の強さを身に着けてもらうしかないのでしょう。実際、先の名人戦では、井山七冠がAI碁の打ち方をまねた布石をやっていました。
 
とにもかくにも、アルファ碁ゼロの存在が、人間棋士の強さを増して、その価値を高めてくれることを願う次第です。
 

コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 嗚呼、社内全面禁煙化を行っ... | トップ | 外食大手が、店内全面禁煙化... »
最新の画像もっと見る

コメントを投稿

囲碁」カテゴリの最新記事