AI研究の第一人者・松尾豊氏が語る「日本でDXやAIの活用が進まない理由」
@DIME より 210528
2021年4月に開催された「AI EXPO」で、日本ディープラーニング協会主催の「DX時代のAI(ディープラーニング)活用最前線」という講演が、同協会理事長、東京大学大学院教授の松尾豊氏によって行われた。その講演の概要とともに、日本でDXが進まない理由をインタビューした内容を紹介する。
⚫︎DX 時代の AI(ディープラーニング)活用最前線
データやデジタル活用の重要性は10~20年前から語られていたが、新しい要素としてAI、ディープラーニングが叫ばれている。
松尾氏は、データの活用がビジネス上でできていないことが今の日本が抱えている課題であり、AIを用いてイノベーションを起こしていかなければならないと考えているという。
現在は「ビジネスやDXの取り組みの中でどうディープラーニングを活用していくか」という課題をどう解決するかが昨今のテーマだ。
【プロフィール】松尾 豊氏 東京大学大学院工学系研究科 教授
1997年 東京大学工学部電子情報工学科卒業。2002年 同大学院博士課程修了。博士(工学)。産業技術総合研究所研究員、スタンフォード大学客員研究員を経て、2007年より東京大学大学院工学系研究科准教授、2014年より特任准教授、2019年より教授。専門分野は、人工知能、深層学習、ウェブマイニング。2014年から2018年まで人工知能学会 倫理委員長。2017年より日本ディープラーニング協会理事長。2019年よりソフトバンクグループ社外取締役。
1.具体的なディープラーニング活用事例
まずは具体的にディープラーニングがどのようにビジネスの中で活用されているのかが紹介された。
・施設入館者の体表温の測定(顔認識のディープラーニングによる画像認識の処理)
・医療系のディープラーニング活用によるワクチン開発
・製造業での外観検査や食品工場での変色したジャガイモの選別
・日立造船のAI超音波深傷検査システム
(化学プラントの熱交換器の傷を超音波によって検査し、翌日には報告できるシステム)
・農業における農薬を撒くドローンや収穫ロボット ・水産業における養殖のスマート給餌
・漫画の自動翻訳や静止画のアニメーション化
このように、幅広い分野でディープラーニングの活用が進んでいる。
2.ディープラーニングの最新の技術的トレンド
ディープラーニングは、どこまで技術が進んでいるのか。最新のトレンドが解説された。
●自然言語処理のTransformerモデル
2012年にディープラーニングの画像認識精度が大きく向上したことでブレークスルーになりましたが、2018年には自然言語処理の分野が大きく発展しました。
きっかけになったのがBERTであり、それを組み込んだTransformerモデルです。これはAttentionだけで構成されているのが特徴で、論文「Attention in All you need」で詳しく説明されています。
Transformerを実現する上で重要な要素が自己教師あり学習です。これは主に穴埋め問題のような形式で自己学習を進めます。画像認識でいえば、画像の一部が欠けた状態から正しい画像を推測する「目隠し問題」、画像をわざとバラバラに崩して元に戻す「ジグソー」、画像をわざとランダムに回転させて元に戻す回転、白黒にしたものをもとに戻す「着色」などの学習方法があります。
自己教師あり学習のメリットは、背後にある構造を学習することができること、目隠しする前の状態の教師データがあることで学習がどんどん進むということです。
●GPT-3
Transformerと自己教師あり学習の組み合わせが強力であることを示した例があります。GPT-3のリリースです。
GPT-3がビットコイン以来の技術革新であることを紹介する記事がネットに掲載されました。そして記事の文末には「この記事自体がGPT-3で書いたものだ」とネタばらしがされ、大変バズりました。人が書いた文章と大差ないものをコンピューターが書けるようになったのです。
GPT-3が人間が書いたような記事を書けるようになるには、巨大なモデルでの学習が必要でした。1,750億個のパラメータ、4兆個の単語を学習することで、人間レベルのクオリティが可能になりました。
また、英語の文を入力しHTMLで出力するといったツールもGPT-3で作ることができます。自然言語処理を学習するにあたってAIが使用するのはweb上の文章データです。
Transformerを実現する上で重要な要素が自己教師あり学習です。これは主に穴埋め問題のような形式で自己学習を進めます。画像認識でいえば、画像の一部が欠けた状態から正しい画像を推測する「目隠し問題」、画像をわざとバラバラに崩して元に戻す「ジグソー」、画像をわざとランダムに回転させて元に戻す回転、白黒にしたものをもとに戻す「着色」などの学習方法があります。
自己教師あり学習のメリットは、背後にある構造を学習することができること、目隠しする前の状態の教師データがあることで学習がどんどん進むということです。
●GPT-3
Transformerと自己教師あり学習の組み合わせが強力であることを示した例があります。GPT-3のリリースです。
GPT-3がビットコイン以来の技術革新であることを紹介する記事がネットに掲載されました。そして記事の文末には「この記事自体がGPT-3で書いたものだ」とネタばらしがされ、大変バズりました。人が書いた文章と大差ないものをコンピューターが書けるようになったのです。
GPT-3が人間が書いたような記事を書けるようになるには、巨大なモデルでの学習が必要でした。1,750億個のパラメータ、4兆個の単語を学習することで、人間レベルのクオリティが可能になりました。
また、英語の文を入力しHTMLで出力するといったツールもGPT-3で作ることができます。自然言語処理を学習するにあたってAIが使用するのはweb上の文章データです。
つまり、web上のHTMLコードと自然言語の関係性も学んでいます。そのため、英語での指示を入力するとそれをweb上で実行するHTMLコマンドをすぐ出すことが可能です。プログラマーの仕事がなくなる日も近いかもしれません。
●画像の自動生成
他にはOPEN-AIが開発した画像生成するツールも注目を集めています。これはAIが言葉からそれに合った画像を自動生成することができ、まさに自動イラストレーターです。
NeRFは正確な画像表現を可能にします。従来のピクセル等の画像だと拡大するとぼやけてしまい細部がわからなくなりますが、NeRFが見え方を学習することで「どこから見るか」を問わず常に鮮明な画像表示が可能です。NeRFの技術は人間の脳が画像を認識する方法に近いのではないかと考えています。
⚫︎企業がディープラーニング for DXを実現するには?
続いて企業がAIを含むDX化を実現するには,どうすれば良いかというテーマで語られた。
1.日本のDXの特徴
「ITの浸透が、人々の生活をあらゆる面でより良い方向に変化させる」という概念の元に進めていくのがDXです。
●画像の自動生成
他にはOPEN-AIが開発した画像生成するツールも注目を集めています。これはAIが言葉からそれに合った画像を自動生成することができ、まさに自動イラストレーターです。
NeRFは正確な画像表現を可能にします。従来のピクセル等の画像だと拡大するとぼやけてしまい細部がわからなくなりますが、NeRFが見え方を学習することで「どこから見るか」を問わず常に鮮明な画像表示が可能です。NeRFの技術は人間の脳が画像を認識する方法に近いのではないかと考えています。
⚫︎企業がディープラーニング for DXを実現するには?
続いて企業がAIを含むDX化を実現するには,どうすれば良いかというテーマで語られた。
1.日本のDXの特徴
「ITの浸透が、人々の生活をあらゆる面でより良い方向に変化させる」という概念の元に進めていくのがDXです。
DXはデジタイゼーションとデジタライゼーションの2つの側面に分けられます。デジタイゼーションは“アナログをデジタル化すること”、デジタライゼーションは“デジタル化したものを業務効率化や付加価値向上に活用すること”です。
日本のDXの特徴はもともとあるものをデジタイゼーションして、そこからさらにデジタライゼーションするという流れが得意なこと。例えばタクシーの配車でいえばもともと客、オペレーター、ドライバー間の連絡はすべて人力で行われていました。AIによる配車の自動化を実現するにあたり、データ化して効率化してから新モデルを作るというやり方が採用されています。
しかし、海外だといきなりUberのような新しいモデルを作ってしまいます。
小売の場合でも日本の場合は紙をデータ化して、顧客データを個別化するという流れが一般的です。しかし海外だとAmazon GOのようにアプリや商品・顔認識等のディープラーニング技術を活用して、いきなり新モデルの店舗を実現しました。
DXが実現するのは、今ある業務の改善ではなく新モデルです。今後は全ての業務が単純化されほぼすべて自動化されます。
ディープラーニングが企業に導入されることで、これまで十分に活用できていなかったようなデータも大幅に扱えるようになります。例えば顔、文字、画像といったリアル状況の活用、データを用いた予想の精度が上がる、自然言語生成や機械制御の自動化も可能です。
従来技術でもDXは可能ですが、AIによってさらに可能性が広がっていくということ。AIからDXにキーワードが変わったというよりは、DXのなかにAIやディープラーニングという要素が加わったと考えるべきでしょう。
DXによる単純化と自動化が進めばサプライサイドとデマンドサイドが近くなります。消費者にとっては早くなり安くなる、パーソナライズされたサービスを受けられるといったメリットが生まれる。DXによって今までできなかったことの実現や新しい付加価値が発見できるのです。この変化はあらゆる業界、産業で今後起こります。
2.企業はDXの中でAIをどう活用していくか
企業がDXを進めるにあたっては、DXで何を目指すのかということ。最終的な目標設定とDXに関するリテラシーの強化が行われなければうまくいきません。
特に開発やITに直接関わりのない経営陣や一般社員に対する働きかけは重要です。AIやDXのプロジェクトを進め技術に活用し、ソリューションにするには、全社の理解度を高める必要があります。
一般社団法人 日本ディープラーニング協会(JDLA)では、こういった経営層や全社員へ向けた新AI基礎講座「AI For Everyone」を2021年5月6日に開講します。企業のDX実現に向けて経営層の目標設定、全社員のリテラシーの向上に寄与する講座です。
JDLAが提供しているG検定(Deep Learning for GENERAL)はビジネスパーソン向け、E資格(Deep Learning for ENGINEER)はエンジニア向けの資格です。これらは取得したい資格の中でも近年上位にランクインしています。
ただ、これらは非常に難易度が高い資格なので、すべての人が目指すには敷居が高いです。そのためJDLAは新たに「AI For Everyone」を設けることとしました。一般のビジネスパーソンや経営者がAIやディープラーニングをどのようにビジネス活用するかを理解する入り口になる講座です。
今後もディープラーニングは大きく発展していきます。AI EXPOに来られているような意識の高い皆さんが企業で活躍しやすいような環境を作っていく必要があると考えており、JDLAではその支援を行なっていきます。
⚫︎松尾氏へのインタビュー
ここからは、今回の講演の結果を受け、松尾氏へインタビューした内容を紹介する。
―企業としてAI活用の最大のメリットはどんなことですか?
松尾氏:効率化と付加価値の創造という二つの要素です。
日本のDXの特徴はもともとあるものをデジタイゼーションして、そこからさらにデジタライゼーションするという流れが得意なこと。例えばタクシーの配車でいえばもともと客、オペレーター、ドライバー間の連絡はすべて人力で行われていました。AIによる配車の自動化を実現するにあたり、データ化して効率化してから新モデルを作るというやり方が採用されています。
しかし、海外だといきなりUberのような新しいモデルを作ってしまいます。
小売の場合でも日本の場合は紙をデータ化して、顧客データを個別化するという流れが一般的です。しかし海外だとAmazon GOのようにアプリや商品・顔認識等のディープラーニング技術を活用して、いきなり新モデルの店舗を実現しました。
DXが実現するのは、今ある業務の改善ではなく新モデルです。今後は全ての業務が単純化されほぼすべて自動化されます。
ディープラーニングが企業に導入されることで、これまで十分に活用できていなかったようなデータも大幅に扱えるようになります。例えば顔、文字、画像といったリアル状況の活用、データを用いた予想の精度が上がる、自然言語生成や機械制御の自動化も可能です。
従来技術でもDXは可能ですが、AIによってさらに可能性が広がっていくということ。AIからDXにキーワードが変わったというよりは、DXのなかにAIやディープラーニングという要素が加わったと考えるべきでしょう。
DXによる単純化と自動化が進めばサプライサイドとデマンドサイドが近くなります。消費者にとっては早くなり安くなる、パーソナライズされたサービスを受けられるといったメリットが生まれる。DXによって今までできなかったことの実現や新しい付加価値が発見できるのです。この変化はあらゆる業界、産業で今後起こります。
2.企業はDXの中でAIをどう活用していくか
企業がDXを進めるにあたっては、DXで何を目指すのかということ。最終的な目標設定とDXに関するリテラシーの強化が行われなければうまくいきません。
特に開発やITに直接関わりのない経営陣や一般社員に対する働きかけは重要です。AIやDXのプロジェクトを進め技術に活用し、ソリューションにするには、全社の理解度を高める必要があります。
一般社団法人 日本ディープラーニング協会(JDLA)では、こういった経営層や全社員へ向けた新AI基礎講座「AI For Everyone」を2021年5月6日に開講します。企業のDX実現に向けて経営層の目標設定、全社員のリテラシーの向上に寄与する講座です。
JDLAが提供しているG検定(Deep Learning for GENERAL)はビジネスパーソン向け、E資格(Deep Learning for ENGINEER)はエンジニア向けの資格です。これらは取得したい資格の中でも近年上位にランクインしています。
ただ、これらは非常に難易度が高い資格なので、すべての人が目指すには敷居が高いです。そのためJDLAは新たに「AI For Everyone」を設けることとしました。一般のビジネスパーソンや経営者がAIやディープラーニングをどのようにビジネス活用するかを理解する入り口になる講座です。
今後もディープラーニングは大きく発展していきます。AI EXPOに来られているような意識の高い皆さんが企業で活躍しやすいような環境を作っていく必要があると考えており、JDLAではその支援を行なっていきます。
⚫︎松尾氏へのインタビュー
ここからは、今回の講演の結果を受け、松尾氏へインタビューした内容を紹介する。
―企業としてAI活用の最大のメリットはどんなことですか?
松尾氏:効率化と付加価値の創造という二つの要素です。
要するに、コストを下げると売り上げを伸ばすことの両方です。
日本の企業は効率化のほうに目が行きがちですが、新しいビジネスというのはほとんどの場合、従来の仕事を、例えばアプリのような形で提供して、その中でAIで活用しながら提供します。そして、従来(AIを)やらなかったような層の人たちまで認知させるといったものになります。
―我々一人一人がAIを勉強していかなければならないでしょうか。
松尾氏:日本では、勉強しなきゃとか、小学生、中学生、初等中等教育にどうやって入れるのとか、そういう話になってしまうのですが、実はもっとシンプルで『経済で儲けること』なんです。
―我々一人一人がAIを勉強していかなければならないでしょうか。
松尾氏:日本では、勉強しなきゃとか、小学生、中学生、初等中等教育にどうやって入れるのとか、そういう話になってしまうのですが、実はもっとシンプルで『経済で儲けること』なんです。
そう考えると今の時代の儲け方というのは、方向性としては1つしかなくて、どうやってデジタルを使って今までになかった形を作り出すのかという一点なんです。それを世界中の人たちがやっているので、日本の個人や会社も、どうやったらもっと儲かるんだろうと、もっと真剣に考えたほうがいい。
そのために「しょうがないから勉強する」ということではなくて、人事では明らかに自分の人材としての付加価値が上がるので、自分の稼ぎを増やしていって、もっと良い環境で仕事をしたいと思うのであれば、勉強したほうがいい、というのは当然のことだと思います。
―AIに対する認識という点では、アメリカの企業に比べると日本は遅れているのですね。
松尾氏:AIだけでなく、デジタル全般に遅れています。根源的には、そのような『経済の戦い』をしていることに対して、なんでそんな形式的なことばっかり言ってるの?みたいなことを僕はよく感じています。
―AIに対する認識という点では、アメリカの企業に比べると日本は遅れているのですね。
松尾氏:AIだけでなく、デジタル全般に遅れています。根源的には、そのような『経済の戦い』をしていることに対して、なんでそんな形式的なことばっかり言ってるの?みたいなことを僕はよく感じています。
中国人はもっとアグレッシブじゃないですか。それはそれで非常に良いことだと思います。シリコンバレーもそうですし。
―データの活用がビジネス上でできていないことが今の日本が抱えている課題とのことですが、なぜ日本は、データが活用できていないのでしょうか。
松尾氏:ITの活用が全産業で遅れてしまったこと、インターネットの世界的な企業が育たなかったこと(言語や文化の問題もあり)、年功序列が強く若い人が意思決定権を持てていないことなどが主な原因だと思います。
―日本は、海外のようにいきなり新しいモデルを作るのではなく、今後も順次、デジタライゼーションしていくのでしょうか。
松尾氏:いきなり新しいモデルを作るのは、新規事業的・スタートアップ的で、うまくいけば巨大な事業を作り上げられますが、確率は低いです。
日本の大企業の多くがそうであるように、ある程度の売り上げのある歴史的・伝統的な事業があれば、それを自己否定するような破壊的な事業を作り出すのは苦手なので、デジタイゼーションして、デジタライゼーションするというステップを踏むやり方しか取れないことが多い、ということだと思います。
『両利きの経営(※)』で主張されているように、現状の事業の連続的な進化と、自己否定にもつながる新規事業の創出の両面を、しっかりやるべきだと思います。
(※世界的な経営学者であるスタンフォード大学のチャールズ・オライリー教授とハーバード大学のマイケル・タッシュマン教授による著書(2019))
―AIの言語と画像の処理能力は、今後どこまで上がっていくと思われていますか。
松尾氏:あんまり限界がないと考えています。
―データの活用がビジネス上でできていないことが今の日本が抱えている課題とのことですが、なぜ日本は、データが活用できていないのでしょうか。
松尾氏:ITの活用が全産業で遅れてしまったこと、インターネットの世界的な企業が育たなかったこと(言語や文化の問題もあり)、年功序列が強く若い人が意思決定権を持てていないことなどが主な原因だと思います。
―日本は、海外のようにいきなり新しいモデルを作るのではなく、今後も順次、デジタライゼーションしていくのでしょうか。
松尾氏:いきなり新しいモデルを作るのは、新規事業的・スタートアップ的で、うまくいけば巨大な事業を作り上げられますが、確率は低いです。
日本の大企業の多くがそうであるように、ある程度の売り上げのある歴史的・伝統的な事業があれば、それを自己否定するような破壊的な事業を作り出すのは苦手なので、デジタイゼーションして、デジタライゼーションするというステップを踏むやり方しか取れないことが多い、ということだと思います。
『両利きの経営(※)』で主張されているように、現状の事業の連続的な進化と、自己否定にもつながる新規事業の創出の両面を、しっかりやるべきだと思います。
(※世界的な経営学者であるスタンフォード大学のチャールズ・オライリー教授とハーバード大学のマイケル・タッシュマン教授による著書(2019))
―AIの言語と画像の処理能力は、今後どこまで上がっていくと思われていますか。
松尾氏:あんまり限界がないと考えています。
AIは今、インターネットにおける2001年ぐらいの状態なんですよ。インターネットは1990年代後半にバブルになって、ネットバブルで2000年くらいに崩壊しているんですけど、それで終わりではなくて、そこからまた着実に進歩や進化をして今になりました。
AIもほぼ一緒で、ディープラーニングという意味では、いったん落ち着いた気がしているんですが、そこからまた着実に伸びていくはず。
AIもほぼ一緒で、ディープラーニングという意味では、いったん落ち着いた気がしているんですが、そこからまた着実に伸びていくはず。
インターネットが2000年、2010年、2020年と社会に浸透していったように、AIやディープラーニングも2020年から30年、40年というスパンで、上昇基調でどんどん使われるようになっていくと思います。いずれは、なくてはならないものになる。教育も大事だと思いますし、企業が早く活用してやってみるということもすごく大事だと思います。
企業では現在、DX化が求められているが、AI(ディープラーニング)の活用も含めて検討すべきであることがわかった。
企業では現在、DX化が求められているが、AI(ディープラーニング)の活用も含めて検討すべきであることがわかった。
「勉強しなきゃ」などの形式的な視点よりも、「経済的に儲ける」という考え方を持つことが分岐点となるのかもしれない