Googleは、入力された文章から音楽を生成するAIモデル「MusicLM」を発表した。Webサイトにて実際にAIが生成した音楽のサンプルを公開している。
MusicLMは、入力した単語や文章を元に、それに忠実な音声や音楽を生成できるAIモデル。楽器名で音声を生成できるほか、複雑な文章を元にした音楽など、さまざまな形のテキスト入力から音声を出力できる。数分間に渡る長時間の音声も生成でき、従来の同様のシステムと比べ、音質と文章への忠実さの両面で優れているとしている。
時間経過で変化する指示に応じてシームレスに曲調を変えたり、アカペラやギターソロなどといった指示にあわせて与えられたメロディを変化させたり、絵画とその説明を元に音楽を生成するといったことも可能。また、同じ文章でもさまざまなパターンの音声を出力できるという。
※コメント投稿者のブログIDはブログ作成者のみに通知されます