グーグルは2月19日、Geminiアプリに音楽生成機能のベータ版を順次提供すると発表した。Google DeepMindの生成音楽モデル「Lyria 3」を搭載し、テキストや画像から30秒の楽曲を自動生成できるようになる。18歳以上のユーザーを対象に、日本語を含む複数言語で提供する。「Google AI Plus」などサブスクリプション利用者は、生成可能な楽曲数が増える。
Lyria 3は、従来モデルから機能を強化した最新版。プロンプトに基づく歌詞の自動生成に対応し、スタイルやボーカル、テンポなどの詳細なコントロールも可能。音のリアリティや楽曲構成の複雑性も向上し、より音楽的に豊かな表現を実現したという。
ユーザーがGeminiに「運命の相手に出会ったときに流れるコミカルなR&B」といったイメージを文章で入力すると、数秒で歌詞付きの楽曲やインストゥルメンタル曲を生成する。さらに写真や動画をアップロードすれば、その内容や雰囲気をもとに楽曲を構成することもできる。生成されるのはカスタムカバーアート付きの30秒楽曲で、ダウンロードや共有リンク作成も可能だ。
Geminiで生成されたすべての楽曲には、AI生成コンテンツを識別する電子透かし「SynthID」が埋め込まれている。加えて、音声ファイルをアップロードしてAI生成かどうかを確認できる検証機能も導入した。GeminiがSynthIDを検出し、独自の推論も踏まえて判定する仕組みだという。
著作権にかんする取り組みとして、Lyria 3は既存アーティストの模倣ではなく、オリジナル表現を目的に設計されている。特定アーティスト名が入力された場合も、広義のインスピレーションとして解釈し、似た雰囲気の楽曲を生成する仕組みだ。







