先端技術とその周辺

ITなどの先端技術サーベイとそれを支える諸問題について思う事をつづっています。

人物の絵から、しゃべる動画を生成VASAー1

2024年04月27日 07時55分56秒 | 日記

CNNがマイクロソフトのVASA-1という、人の絵や写真から、しゃべる動画を生成できるAIを紹介していたが、言語も多くの国の言葉をしゃべり、悪用されると恐ろしい。

CNNの解説。右クリックで「リンクを新しいウィンドウで開く」などで再生。

CNNの記者が米マイクロソフトのAIモデルを解説 - CNN.co.jp

 

モナリサと中国人男性の絵から動画だけの抽出は以下のURL参照。

https://vasavatar.github.io/VASA-1/video/o1.mp4

https://vasavatar.github.io/VASA-1/video/o5.mp4

 

どういう手順で作成しているかを、MSは下記Youtubeで紹介していた。文章を右クリックし、「リンクを新しいウィンドウで開く」とかで再生。

 顔写真と音声ファイルからリアルな話し顔の映像を作成できるMicrosoftのAIモデル「VASA-1」のデモンストレーション動画 - YouTube