OpenAI、「GPT-4o」発表 高速応答で音声・画像・テキスト対応(ImpressWatch)
アメリカOpenAI社が、5月13日に同社の最新AIモデル「GPT-4o」を発表しました。
・Hello GPT-4o(OpenAI)
上記の発表の通りですね。
GPT-4o (「オムニ」の「o」) は、人間とコンピューターのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。音声入力にはわずか 232 ミリ秒 (平均 320 ミリ秒) で応答できます。これは、人間の会話における応答時間 (新しいウィンドウで開きます) とほぼ同じです。英語のテキストおよびコードでは GPT-4 Turbo のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、API でははるかに高速で 50% 安価です。 GPT-4o は、既存のモデルと比較して、特に視覚と音声の理解に優れています。
期待出来ますね。また、楽しんでみたいと思います。
#ニュース