今週は月曜日に中国の新興企業DeepSeekが低コストでOpenAIのChatGPTに匹敵する人工知能を開発したというニュースで、NVIDIAなどチップメーカーを初めとするハイテク株が売り込まれるという騒動で始まった。
翌日の火曜日には押し目買いでハイテク株は反発した。また押し目買いに加えて「DeepSeekはOpenAIの利用規約に違反する方法で大量のデータを抽出し、低コストでAIモデルを構築した」というニュースもDeepSeek熱に少し冷やし水をさしたようだ。
WSJを読んでみるとOpenAIの広報担当者は「DeepSeekが蒸留distillationというプロセスを使って、自社の技術を発展させるために、OpenAIのツールから大量のデータをextricate(抽出・解放)したという兆候を調査している」という記事があった。
OpenAIの利用規約では顧客がOpenAIモデルからの出力データを競合する自社製品の開発に使うことを禁止しているから、もし蒸留というプロセスがそれに該当すると利用規約違反になる訳だ。
ということで話の大筋はつかめたが、それがどれほど大きな問題なのか?は蒸留というプロセスがどういう作業なのか分からないので、ピンとこない。
さらにいうと生成型AIの開発は、世の中にある膨大なデータベースを色々な形で取り込み、モデルを教育することで進んできた。
DeepSeekの行為が、どれほど悪質な行為に該当するのかはこれまたもう少し勉強しないと分からない。しかしこの問題は政治・外交問題化する可能性が高いので話はより複雑化しそうだ。
※コメント投稿者のブログIDはブログ作成者のみに通知されます