Googleは、AI音楽生成モデル「Lyria 3」を基盤に、テキストや画像のプロンプトから30秒の音源を作れる機能を案内しています。ジャンルやムード、時代の組み合わせに対応し、インストゥルメンタルに加えて歌詞とボーカルも生成可能です。Geminiアプリから利用でき、生成したトラックはダウンロードや共有にも対応します。写真や動画にプロンプトを添えて、その瞬間に合う歌詞付きサウンドトラックを作るワークフローも示されています。テンプレートギャラリーを使った作成支援が用意され、安全対策として全トラックにSynthIDの透かしが埋め込まれると説明されています。
30秒トラックを簡単プロンプトで生成、ジャンルや楽器、ボーカル条件を細かく指定可能
Lyria 3は、高品質な音楽生成をうたうAIモデルで、幅広いジャンルに対応し、歌詞とボーカルを含むコンテンツの生成に対応します。Geminiアプリでは30秒のトラックを作成でき、カスタムのカバーアートも付与されます。作り方はシンプルで、ジャンル、ムード、時代などを組み合わせて指示するほか、テンポやリズム、使用したい楽器、ボーカルの声質や音域、歌詞の内容などを具体的に盛り込んだプロンプトが推奨されています。たとえば、インディーフォークでアコースティックギターとソフトなピアノ、軽めのパーカッションを指定し、曇りの日の犬の散歩を歌詞に、女性ボーカルでといった詳細な要件も受け付けます。結果は環境により変動し、制限事項が適用されると明記されています。
写真や動画からの生成も可能で、カメラロールのメディアにプロンプトを加えると、当該シーンに合った歌詞付きトラックを生成する流れが示されます。さらに、テンプレートギャラリーから最適な型を選び、詳細を入力して高忠実度のサウンドトラックへ変換する機能も案内されています。作成した音源はダウンロードや各種プラットフォームへの共有が可能で、気軽に友人と楽しめるユースケースが想定されています。GeminiアプリのAI音楽生成は、アプリが利用可能なすべての国で18歳以上が対象と案内されています。加えて、Googleは責任ある利用を求め、利用規約に準じた使用を促しています。
安全性と透明性の取り組み SynthIDで全トラックに透かし、AI生成の識別・検証手段も提供
安全性に関して、Geminiアプリで生成されたトラックには、GoogleのAIに関する原則に沿って、目に見えない透かし技術「SynthID」が埋め込まれると説明されています。これにより、音声を含む生成コンテンツの識別性を高めます。あわせて、AIコンテンツを識別するためのツールが用意され、ファイルをアップロードしてGoogle AIによる生成かどうかの検証を行えると案内されています。ユーザーはSynthIDのチェック結果に基づく回答を得られ、透明性の確保と誤用の抑止に資する仕組みです。生成体験を最大化するためのプロンプト作成のコツも公開されており、ジャンルや時代、テンポ、楽器、ボーカル、歌詞の6要素を具体化して指示することが推奨されています。これらを踏まえることで、狙い通りの楽曲スタイルに近づける実践的な手がかりになります。
なお、Lyria 3は高品質な音楽生成モデルとして紹介され、Geminiアプリでの楽曲生成は30秒に限定される一方、カバーアートはNano Bananaで生成されると案内されています。利用は18歳以上が対象で、結果は環境によって異なる可能性があるとされています。Googleは、生成AIの責任ある取り扱いを求めており、ユーザーはガイドラインに沿って適切に活用することが求められます。写真や動画と組み合わせて作るサウンドトラックや、友人と共有したくなる短尺の楽曲制作など、日常のシーンに合わせた幅広い活用例が示されています。
詳しくは「Google」の公式ページまで。 レポート/DXマガジン編集部






















