Stability AIは、6分20秒の楽曲生成に対応した新たなオーディオモデル群「Stable Audio 3.0」を発表した。TechCrunchが20日(現地時間)に報じた。
Stable Audio 3.0は、「Small SFX」「Small」「Medium」「Large」の4モデルで構成する。最上位モデルは6分を超える楽曲生成に対応し、プロ向けの音楽制作を想定している。
Small SFXとSmallはいずれも4億5900万パラメータで、オンデバイスで最大2分のサウンドや音楽を生成できる。Mediumは14億パラメータ、Largeは27億パラメータの規模となる。
MediumとLargeはともに6分20秒の楽曲を生成でき、楽曲構成やメロディーの一貫性も維持できるという。Stability AIによれば、これは2024年に公開した「Stable Audio 2.0」と比べて2倍超の長さに当たる。
同社は、Small SFX、Small、Mediumのモデル重みを公開した。一方、LargeはAPIと有償のセルフホスティングでのみ提供する。年間売上高100万ドルを超える企業は、別途エンタープライズライセンスが必要になる。
Stability AIは、今回のモデル群が適切にライセンスを取得したデータに基づいて構築されたと説明している。同社は昨年、Warner Music GroupおよびUniversal Music Groupと、モデルや音楽制作ツールの開発に関する契約を締結した。
また、プロのミュージシャン向けの新製品群も開発中という。具体的な機能は明らかにしていないが、Universal AudioとFenderで最高デジタル責任者を務めたイーサン・キャプランがStability AIに加わり、プロ向け音楽製品の開発を主導しているとTechCrunchは伝えている。