画像=Googleブログ

Googleは、動画生成AIモデル「Veo 3.1」の低価格帯API「Veo 3.1 Lite」を公開した。テキストや画像を入力に、音声付きの動画を生成できる。

Gigazineの報道によれば、Veo 3.1 Liteは、テキストから動画を生成する「T2V」と、画像から動画を生成する「I2V」に対応する。テキストプロンプトや画像を基に、音声を含む動画を作成できる。

出力解像度は720pと1080pに対応する。動画の長さは、720pが4秒、6秒、8秒から選択可能で、1080pは8秒固定となる。

上位モデルより機能を絞る一方、低コストで利用できるようにしたモデルとみられる。テキスト入力と画像入力の両方に対応することから、比較的シンプルな動画制作やプロトタイプ用途を想定した位置付けとみられる。

一方で、上位モデルの「Veo 3.1」と「Veo 3.1 Fast」が備える4K動画生成、動画参照ベース生成(V2V)、動画延長機能には対応しない。高解像度出力や既存動画を基にした編集、長尺シーケンスの生成といった高度な機能は利用できない。

料金は720pが1秒当たり0.05ドル、1080pが1秒当たり0.08ドル。高機能よりもコスト効率を重視する開発者やサービス事業者にとって、導入しやすい選択肢になりそうだ。

GoogleはVeo 3.1シリーズを、高性能モデルと低価格モデルに分けて展開している。動画生成AI市場でも、性能重視とコスト重視の両面をにらんだ戦略を進めている形だ。各モデルの詳細な機能や利用方法は、Gemini APIのドキュメントで確認できる。

キーワード

#Google #Veo 3.1 Lite #Veo 3.1 #動画生成AI #Gemini API #T2V #I2V
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.