前回までデータセンター向けのAI(人工知能)半導体を念頭に議論してきたが、AI半導体はデータセンター向けのGPU(画像処理半導体)だけではない。
例えば以下の図1に示すようなエッジデバイスにおいてもAI半導体は活用される。今回は、データセンター以外の競争について考察する。
図1 エッジ向けAI半導体の開発状況
NVIDIAの強みが発揮できないエッジ領域
既に5nm世代以降のAI半導体の活用が始まっているのは、スマートフォンやPCなどの情報/通信機器・車載・通信網の3領域である。
これらの領域は、プロセスノードの縮小によって演算能力・省電力性能向上といった製品性能の向上や価格低下と、開発コスト回収可能な出荷量が見込めることが特徴である。
エッジ領域においては、データセンターにおけるNVIDIAのような独占構造はなく、半導体大手を中心として、特化型のプレーヤーを含む比較的まだら模様の市場となっている(図2)。
例えば、通信では米Qualcomm(クアルコム)、米Broadcom(ブロードコム)、米Cisco Systems(シスコシステムズ)、NVIDIA傘下のMellanox Technologies(メラノックステクノロジーズ)などのプレーヤーが存在する。
これらの企業を分類すると、Ciscoなどのように自社のスイッチ/ルーターなどのために半導体を内製化するパターンと、Qualcommなどのように半導体に特化し、通信機器ベンダーに販売するパターンがある。
情報/通信機器(主にスマホ)では米Apple(アップル)、韓国Samsung Electronics(サムスン電子)、Broadcom、Qualcomm、台湾MediaTek(メディアテック)、米Google(グーグル)といったプレーヤーが存在する。
やはりこちらも、Apple、Samsung、Googleのようにデバイスメーカーが自社製品のために半導体を内製しているパターンと、Qualcomm、MediaTekのようにスマホメーカーに半導体を提供するパターンに分類される。ただし、Broadcomのように、Googleのようなデバイスメーカー向けに半導体設計を支援するプレーヤーも存在する。
車載ではQualcomm、NVIDIA、オランダNXP Semiconductors(NXPセミコンダクターズ)など、古くから実績を有するプレーヤーだけではなく、イスラエルHailo(ハイロ)やカナダTenstorrent(テンストレント)のような新興プレーヤーが現れていることも特徴である。
用途に応じた対応が重要に
では、なぜエッジ領域ではNVIDIAが1強となっていないのだろうか。その理由は2つある。まず、データセンターとエッジでメインとなるAI処理が異なることだ。エッジでは推論がメインの処理となるため、開発環境の重要度が相対的に低下し、AIモデル作成に必須とも言えるCUDAが必ずしも求められない。
エッジのAI半導体で学習が行われない主な理由は、AI半導体のコストやスペースを抑えるためである。また、学習モデルを効率良くアップデートするために、各エッジで学習を行うのではなく、データセンターで1つの学習モデルを管理する方が好ましい。
もう1つの理由は、アプリケーションが多様なことだ。エッジ向けAI半導体には、アプリケーションごとにハードウエア特有の要件が求められる。
例えば、スマホや車載では長期間安定して動作するために、データセンターとは異なり、耐衝撃性や耐熱性といった耐環境性が求められる。
これらの要件を満たすためには、その業界で半導体を提供した経験に基づく、ドメインナレッジ(領域知識)を有することが重要なため、エッジ向けではデータセンター向けGPUのように、NVIDIAによる独占構造が発生しにくい。
車載ならではのニーズで食い込む
次に、具体的に車載向けの推論用AI半導体とデータセンターの学習用AI半導体のKBF(Key Buying Factor、重要購買決定要因)を比較していきたい(図3)。
図3 車載ではレイテンシーや消費電力、耐環境性が需要に