その他ニュース
画像認識や音声認識などに続き、文章読解の分野でも人工知能(AI)が人間の平均レベルを超え始めた。米グーグルの新AI技術「BERT(バート)」が壁を突き破った。検索や情報収集などの効率が飛躍的に高まる可能性が出てきた。AIに文章読解は不可能――。数年前までこれが常識だった。日本の国立情報学研究所(NII)が2011年に始めた「ロボットは東大に入れるか(東ロボ)」プロジェクトでも、AIは大学入試センター試験の英語試験で長文読解問題や単語の並べ替え問題に全く歯が立たなかった。東ロボのAIが16年にセンター試験の英語問題を解いた際の偏差値は「45.1」。東大合格はとうてい不可能なレベルだった。ところがグーグルが18年10月に発表したBERTで常識が一変した。文章読解問題を人間より高い正答率で解いたからだ。(中略)グーグルのBERTやその改良版によってAIが高い性能を発揮する仕組みを解説しよう。BERT以前の言語モデルは前にある単語から後ろに続く単語を予測したり、文章の中で近い距離にある単語同士の関係を把握したりするだけだった。それに対してBERTは文章中の遠い距離にある単語同士の関係を把握したり、文脈を基に文章の各所にあるべき単語を予測したりできるようになった。BERTの事前学習には、人間が正解データをタグ付けした「教師データ」は不要である。人間が書いた文章が大量にあればいい。BERTは文章の一部を機械的にマスクしたうえでその箇所の内容を予測する穴埋め問題や、ある文に続く文を予測する問題などを自分で作って解いて「言語らしさ」を学習する。AIが教師データを自ら用意する「自己教師あり学習」だ。BERTの事前学習には300万本の日本語ニュース記事を使用した。記事分類のファインチューニングには、分類ごとにそれぞれ200本の記事を教師データとして用意した。それだけでニュースを自動分類できるようになった。(中につづく)(日経 記事:日経コンピュータ より)
その他ニュース(01/01_夕) | ||||||||
国際 | ||||||||
企業 | ||||||||
IT | ||||||||
09_PayPayが火を付けたキャッシュレス決済戦争が向かう未来(上) | ||||||||
国内 | ||||||||
市場 |