Stability AI、6分20秒の楽曲生成に対応した「Stable Audio 3.0」発表

生成中...

Chi-gyu Hwang

公開 2026-05-21 06:28:28

この記事を共有

Stability AIは、6分20秒の楽曲生成に対応した新たなオーディオモデル群「Stable Audio 3.0」を発表した。TechCrunchが20日（現地時間）に報じた。

Stable Audio 3.0は、「Small SFX」「Small」「Medium」「Large」の4モデルで構成する。最上位モデルは6分を超える楽曲生成に対応し、プロ向けの音楽制作を想定している。

Small SFXとSmallはいずれも4億5900万パラメータで、オンデバイスで最大2分のサウンドや音楽を生成できる。Mediumは14億パラメータ、Largeは27億パラメータの規模となる。

MediumとLargeはともに6分20秒の楽曲を生成でき、楽曲構成やメロディーの一貫性も維持できるという。Stability AIによれば、これは2024年に公開した「Stable Audio 2.0」と比べて2倍超の長さに当たる。

同社は、Small SFX、Small、Mediumのモデル重みを公開した。一方、LargeはAPIと有償のセルフホスティングでのみ提供する。年間売上高100万ドルを超える企業は、別途エンタープライズライセンスが必要になる。

Stability AIは、今回のモデル群が適切にライセンスを取得したデータに基づいて構築されたと説明している。同社は昨年、Warner Music GroupおよびUniversal Music Groupと、モデルや音楽制作ツールの開発に関する契約を締結した。

また、プロのミュージシャン向けの新製品群も開発中という。具体的な機能は明らかにしていないが、Universal AudioとFenderで最高デジタル責任者を務めたイーサン・キャプランがStability AIに加わり、プロ向け音楽製品の開発を主導しているとTechCrunchは伝えている。

Chi-gyu Hwang delight@d-today.co.kr

生成中...

AI要約

Stability AIは新たな音楽生成モデル群「Stable Audio 3.0」を発表した。4モデルで構成し、最上位は6分20秒の楽曲生成に対応。Small SFX、Small、Mediumのモデル重みも公開した。