「Gemini」で音楽が生成可能に、日本語の歌詞もOK、最新モデル「Lyria 3」搭載

「Gemini」で音楽が生成可能に、日本語の歌詞もOK、最新モデル「Lyria 3」搭載

米Googleは2月19日(日本時間)、「Gemini」アプリ(gemini.google.com)に音楽生成機能を追加したと発表した。Google DeepMindが開発した最新モデル「Lyria 3」が搭載されており、テキストや画像をもとに数秒で高品質な楽曲を生成できる。

 音楽生成モデル「Lyria 3」の特徴は、歌詞も自動生成できること。プロンプト(指令文)をもとに、自然な歌詞を生成する。また、スタイル、ボーカル、テンポなどを細かく指定することも可能。リアリティと複雑性が向上しており、より豊かでリアルな音楽表現を実現する。音楽に造詣の深いユーザーでなくても、ジャンルやムード、テーマなどをテキストで説明すれば、それに従って「Lyria 3」が本格的な楽曲を生成してくれるわけだ。テキストでの表現が難しくても、写真や動画をアップロードすれば、その雰囲気にあう楽曲を生成させることができる。

 生成できる楽曲の長さは30秒で、音楽パートのみをMP3形式で保存したり、カスタムカバーアート付きのMP4動画としてダウンロードできる。公開リンクを生成することもできるので、SNSでの共有も簡単だ。

 「Gemini」アプリの音楽生成機能は、現在ベータ版として提供中。日本語を含む複数の言語に対応しており、18歳以上のユーザーが利用可能だ。無償版でも利用できるが数には制限があるようで、「Google AI」の有料サブスクリプション(Plus/Pro/Ultra)に加入していれば、生成可能な楽曲数の制限が緩和される。

 なお、「Lyria 3」で生成した楽曲には電子透かし「SynthID」が埋め込まれる。「Gemini」アプリにアップロードして「この音声はGoogle AIで生成されたか」たずねれば、「Lyria 3」で生成したものかどうかを簡単に判別できる。

グーグル、Geminiで音楽を生成できるように

グーグルは2月19日、Geminiアプリに音楽生成機能のベータ版を順次提供すると発表した。Google DeepMindの生成音楽モデル「Lyria 3」を搭載し、テキストや画像から30秒の楽曲を自動生成できるようになる。18歳以上のユーザーを対象に、日本語を含む複数言語で提供する。「Google AI Plus」などサブスクリプション利用者は、生成可能な楽曲数が増える。

 Lyria 3は、従来モデルから機能を強化した最新版。プロンプトに基づく歌詞の自動生成に対応し、スタイルやボーカル、テンポなどの詳細なコントロールも可能。音のリアリティや楽曲構成の複雑性も向上し、より音楽的に豊かな表現を実現したという。

 ユーザーがGeminiに「運命の相手に出会ったときに流れるコミカルなR&B」といったイメージを文章で入力すると、数秒で歌詞付きの楽曲やインストゥルメンタル曲を生成する。さらに写真や動画をアップロードすれば、その内容や雰囲気をもとに楽曲を構成することもできる。生成されるのはカスタムカバーアート付きの30秒楽曲で、ダウンロードや共有リンク作成も可能だ。

 Geminiで生成されたすべての楽曲には、AI生成コンテンツを識別する電子透かし「SynthID」が埋め込まれている。加えて、音声ファイルをアップロードしてAI生成かどうかを確認できる検証機能も導入した。GeminiがSynthIDを検出し、独自の推論も踏まえて判定する仕組みだという。

 著作権にかんする取り組みとして、Lyria 3は既存アーティストの模倣ではなく、オリジナル表現を目的に設計されている。特定アーティスト名が入力された場合も、広義のインスピレーションとして解釈し、似た雰囲気の楽曲を生成する仕組みだ。

🍎たったひとつの真実見抜く、見た目は大人、頭脳は子供、その名は名馬鹿ヒカル!🍏