Googleの音楽生成AIモデル「Lyria 3」を試した。テキスト、譜面画像、コード進行といった複数の入力方法で検証したところ、編曲面の完成度は高かった。一方で、細部にはなお不自然さが残り、全体としては「音楽を文章から学習した」ような印象も拭えなかった。
Lyria 3はGoogle DeepMindが開発した音楽生成AIで、2026年2月にGeminiアプリへ搭載された。テキストや画像の入力から、ボーカルと歌詞を含む約3分の音声を生成できる。イントロやサビ、転調などの曲構成もプロンプトで指定でき、44.1kHzのステレオ音声で出力する。
まず、米ラッパーKendrick Lamarの「HUMBLE」を想起させる楽曲を生成した。プロンプトに落とし込みやすいよう、最初に楽曲の特徴を分解して整理させたところ、ハードコア・ヒップホップやトラップといったジャンル説明に加え、BPM150、808ベース、ディストーションをかけたピアノなどの要素を盛り込んだ指示文が出力された。参照元は、ナムウィキやウィキペディアなど公開情報だったとみられる。
原曲の複製に近づくのを避けるため、調性は変イ短調からイ短調へ変更するよう指示した。生成されたのは、ディストーションの効いたグランドピアノに、アタックの強いスネア、鋭いハイハットを組み合わせたトラップ系ヒップホップだった。ただ、低音域のピアノが単音で反復され、全体としては原曲を強く想起させる仕上がりになった。
ラップの歌詞も付与されたが、内容の正確な聞き取りは難しかった。ラップ特有の韻やライムも明確には確認しにくい。声のトーンもKendrick Lamar本人というより、白人男性ラッパーのEminemを思わせた。GoogleはLyria 3について「幅広いインスピレーションから音源を作る」と説明しているが、ジャンルの文法は踏まえつつ、声質などアーティスト固有の特徴は意図的に避けているように見える。
さらに変奏も試した。Aメロとサビの後に変イ長調へ転調し、米R&B歌手H.E.R.を思わせる女性ボーカルのアドリブとオーケストラ伴奏を加えるよう指示したところ、力強いヒップホップから叙情的なオーケストラへ自然につながった。編曲力は想定以上だった。
■譜面入力も検証
次に、有名ジャズ曲「Misty」の譜面画像を添付して試した。ジャズのリードシートには、通常、メロディーとコードだけが記されている。今回はジャズ・トリオ編成、BPM80のバラードで、サビに入ってすぐピアノのアドリブを始めるよう求めた。
生成結果は、良く言えば「あるシンガーソングライターを想起させる」1980年代歌謡だった。歌詞も付き、「古い紙の上に残った名前一つがコーヒーの染みのようににじんでいく」といったフレーズが盛り込まれた。押韻しているようには見えるものの、メロディーとのかみ合わせは弱く、音の置き方による強弱のツボをつかみ切れていない印象を受けた。
譜面解釈の精度をさらに確かめるため、24小節分のコード進行を直接入力した。「maj7」はメジャーセブンス、「Eb」は変ホ、縦線「|」は小節区切りを意味するものとして、4分の4拍子での演奏を依頼した。
出来上がった演奏は、「ジャズピアノを習い始めて6カ月の学生」のようだった。筆者の経験では、受験準備の段階でも半年ほど学べば、テンションを含むジャズコードと基本的なモードスケールは身に付く。ただ、その2つだけを頼りに即興すると、まさにこの種の演奏になりやすい。和声的に誤った音ではないのに、どこか野暮ったく聞こえる。
そう聞こえる理由を追うと、メロディーで7度音が繰り返し強調されていた。7度音はコード構成音の一つで、和声上は誤りではない。ただ、正拍で目立ちすぎると不自然になりやすい。3度音と並んでコードの性格を強く示す音であるため、響きの色が前面に出過ぎるからだ。特にジャズの基本的なリズムである8分音符のスイングでは、正拍と裏拍のバランスが重要になる。そこが崩れたことが違和感につながったようだ。
■創造性は示すが違和感が残る
10年前にAlphaGoと対局したプロ棋士は、序盤の3・3への着手に衝撃を受けたと語っている。幼いころから「打つな」と教わる手だったが、AlphaGoは定石の枠内で人間が選びにくい一手を選び、勝利した。
囲碁は勝敗で優劣を示せるが、音楽は最終的に耳で評価される。Lyria 3も和声のルールの中で一定の創造性を見せた一方、随所にコンピューター的なぎこちなさが残った。
とりわけ惜しいのは、モチーフの弱さだ。モチーフは音楽を音楽らしく成立させる核になる。たとえばモーツァルトの「きらきら星変奏曲」では、「ドドソソララソ」という単純な動機を、トリルや分散和音、より細かな音型へと変奏しながら反復していく。これに対し、Lyria 3の生成曲は、モチーフが十分に感じられないまま音を並べたように聞こえ、起承転結も薄かった。
もっとも、著作権リスクを抑えたいYouTube向けBGMの用途では使い勝手がよさそうだ。条件次第では、低予算の商業広告向け音楽に活用できる可能性もある。