◯ 競争激化で急拡大する「生成AI」、ELYZAから見るLLMの進化とビジネスの現状。
生成AI(人工知能)のブームで、大規模言語モデル(LLM)を巡る競争が非常に激しくなっている。一方で、LLMを活用したビジネスの開拓はまだこれからという状況でもある。KDDI傘下となった新興のAI関連企業であるELYZA(イライザ)の取り組みから、生成AIの進化の現状とビジネスの方向性を確認してみよう。
日本語で「GPT-4」を超えるLLMを開発。
現在は、いわゆる「生成AI」ブームのまっただ中にあるといって間違いないだろう。その火付け役となった「ChatGPT」を提供する米OpenAI(オープンAI)や米Google(グーグル)などAI技術に直接関係する企業だけでなく、ありとあらゆる企業が生成AIに関する取り組みを打ち出してアピールしている。この様子からも、ブームの過熱ぶりを見て取ることができる。
その生成AIに必要不可欠なのがLLMである。LLMの開発を巡ってはオープンAIやグーグルなどのIT大手だけでなく、国内のいくつかの企業も取り組みを進めている。そのLLMを開発するスタートアップとして注目を高めているのがELYZAだ。
ELYZAは東京大学発のスタートアップ。非常に大きなコンピューティングパワーが求められる、一般的な言語や知識を得るための事前学習はオープンなLLMに任せる。その上で、日本語に特化した事後学習に注力することで、性能の高いLLMの開発を進めているのが大きな特徴だ。
実際同社は2024年3月、日本語の性能が大手のLLMに匹敵する700億パラメーターのLLMを開発。スタートアップながら海外の主要なLLMと同水準の精度を誇るLLMを開発したことで大きな注目を集めた。その開発力が評価され、2024年3月18日には通信大手のKDDIと資本業務提携を締結。大手企業の後ろ盾を得たことで開発を一層強化しているようだ。
そのELYZAが2024年6月26日に発表会を実施し、新たに2つのLLMを開発したと発表した。発表されたのは、700億パラメーターの後継となる「Llama-3-ELYZA-JP-70B」と、より軽量な80億パラメーターの「Llama-3-ELYZA-JP-8B」の2つである。
このうち積極的にアピールされたのは、前者のLlama-3-ELYZA-JP-70Bである。なぜならその日本語性能が、オープンAIのLLM「GPT-4」など主要なLLMと同等あるいはそれ以上だったからだ。
ベースLLMの進化に独自の取り組みを追加。
GPT-4は2023年3月に公開されて以降、その精度の高さで非常に高い評価を獲得している。加えて、テキストだけでなく画像や音声など複数のデータを処理できる「マルチモーダル」に対応するなど性能向上も図られたことで、大きな注目を集めた。だがELYZAの新しいLLMは、日本語性能に関する複数のベンチマークでそのGPT-4を超えるスコアを記録したという。
同社の曽根岡侑也CEO(最高経営責任者)は、「オープンAIにしかつくれないと思っていたGPT-4に対し、(ELYZAのLLMが)一気にジャンプアップしてグローバルのトップラインに立てた」と話す。海外大手のLLMは、短期間のうちに大幅に性能を向上させている。ELYZAのLLM開発がその状況に追随できていることが大きな意味を持つといえるだろう。
それだけ急速にLLMを進化させられたのには、ベースとなるLLMの進化が大きく影響している。2024年3月に開発した700億パラメーターのLLMには、ベースのLLMとして米Meta(メタ)がオープンソースで提供しているLLM「Lama 2」を採用していた。今回のLLMには、その進化版となる「Lama 3」を用いている。
ただ曽根岡CEOは、Lama 3の性能向上がLLMの性能向上に影響していることは認めながらも、独自の事後学習やデータのチューニングなどによってより性能を高めていると説明。以前のLLM開発で蓄積されたデータやノウハウを活用できたことも、開発スピードの加速には大きく影響しているようだ。
それに加えてKDDIの傘下に入ったことも、開発には大きく影響したという。大手企業の傘下に入ったことで財務基盤が安定しただけでなく、LLMに欠かせない計算基盤に大胆な投資ができるようになった。スタートアップのELYZAに大きなメリットとなったことは確かだろう。
LLMの進化は分野特化型に移るか。
オープン化されているLLMをベースとすれば、スピーディーに開発できる。しかし一方で、巨大な計算基盤を用いて一からLLMを開発しているオープンAIなどを追い抜くのは難しいようにも思える。この点について曽根岡CEOは、「どうやって勝てるかはもう少し考える必要があるが、トップラインは体感で変わらないようになってきている」と話す。今後、LLMの進化スピードが落ち着いてくることが1つのチャンスと見ているようだ。
同社ではそうした状況になるまで諦めず追従し続けた上で、グローバルに展開するLLMでは難しい特定の分野に特化し、高い精度を持つLLMを開発することが勝ち筋と考えているようだ。日本の文化やビジネスルール、あるいは特定の業界などに特化したLLMの開発に力を注ぎ、それぞれの分野で必要不可欠な存在となることで競争を勝ち抜こうとしている。
そのためにも同社では、企業や業界に特化したLLMの開発に今後力を入れていくとしている。経済産業省らが主導する、生成AI開発力強化に向けたプロジェクト「GENIAC」において、日本の知識や表現にフィットするLLMの開発を既に進めているという。
またKDDIの傘下となったことを生かし、コールセンター業務などを担うKDDI傘下のアルティウスリンクと連携しながら、コールセンター向けLLMの開発を進めることも検討しているようだ。
それに加えて、ELYZAのLLMをAPIサービスとして提供することも今後進めるとしている。現状、企業などがAPI経由で生成AIをサービスに取り入れるには、ChatGPTやグーグルの「Gemini」など海外製のサービスしか選択肢がない状況にある。そこに国内企業が提供するLLMの選択肢を加え、ビジネスにつなげることも考えているという。
そしてもう1つ、今回発表されたLLMの1つである軽量のLlama-3-ELYZA-JP-8Bに関しては、商用利用可能な形で一般公開するとしている。これにより、日本語に強いLLMを手元のパソコンやエッジデバイスなどで活用できるようになる。ビジネスや研究などに幅広く使えるという。軽量のLLMをオープンにしてELYZAのショーケースとすることで、より高性能なLLMの販売につなげる狙いがありそうだ。
LLMを巡っては、オープンAIも2024年4月に日本への進出を打ち出している。日本語に特化したGPT-4のカスタムモデルの提供を打ち出すなど、日本での事業強化を進めている状況にある。またNTTやNECなど、いくつかの国内企業も独自のLLMを開発し、企業向けに提供を開始している。法人向けを主体として、サービス同士の競争が加速している様子がうかがえる。
そうした中で、スタートアップのELYZAがどのように立ち回って事業を拡大していくのかは関心を呼ぶところだ。ただ生成AI自体まだ注目されて間もなく、ビジネスのスタイルが確立しているとはいえない。企業向けビジネスに強いKDDIの力を借りながら、技術だけでなくビジネスの枠組みをいかに整えていくのか。ELYZAにとって問われるところだろう。