まだ公開されたサービスではなく
研究開発段階だが、
文章や画像、動画を入力して、
1分程度の非常に
リアルな動画を生成できるという。
上記のサイトに
いろいろな生成例が示されている。
画像、文章の次は動画、となるのは自然で、
いろいろな組織が動画生成 AI を
研究しているが、長さも含めて、
生成された動画の品質が
圧倒的に高いという印象だ。
同時に公開された
テクニカルレポートによると、
ベースとなっている技術は
2022/12 に arXiv に発表された
Diffusion Transformer らしい。
Transformer で動画をパッチ化して
学習、生成するので、
同じ潜在空間から、
いろいろなサイズ、
アスペクト比、長さの動画を
生成できるとしている。
物理的制約を事前知識として
使わなくても、大量のデータで
学習することで、物理的な法則が
自然に獲得されているということで、
メンタルイメージのように、
世界をシミュレーションするのにも
使えるかもしれない。
その一方で、ガラスが割れる様子や
物を食べる様子など、まだ生成の精度や
一貫性が低いものもあるようだ。
現在は、サービスの公開に向けて、
生成の精度を上げるとともに、
安全面についての検討を進めているという。
最新の画像もっと見る
最近の「PC、IT、AI」カテゴリーもっと見る
アマゾン「Alexa」が生成AI対応に進化!
PIVOT【2025年超予測:生成AI(前篇・後編)】(落合陽一氏、原一将氏)
OpenAIが実現した Operator 画期的な自律型AI!人間のようにブラウザを操作する未来型アシスタントの全貌(2025-01)【トレンド解説シリーズ】
NVIDIA CEO Jensen Huang Keynote at CES 2025
Seminar with Professor Geoffrey Hinton, at the Royal Swedish Academy of Engineering Sciences (IVA)
Google DeepMind のハサビス博士らが 2024年のノーベル化学賞を受賞!
最近の記事
カテゴリー
バックナンバー
人気記事