画像=Google

Google DeepMindは1月29日(現地時間)、テキストや画像を基に、ユーザーが探索・操作できる仮想世界を生成する実験ツール「Project Genie」を公開した。対象は米国の18歳以上のGoogle AI Ultra加入者で、実際の利用環境でワールドモデル技術の性能検証を進める。

TechCrunchとGoogleのブログによると、今回の公開は、2025年8月に披露した汎用ワールドモデル「Genie 3」の研究プレビューに続く取り組み。よりインタラクティブな体験を通じてフィードバックと学習データを集め、実用性の検証につなげる考えだ。

Project Genieは、Genie 3を中核に、画像生成モデル「Nano Banana Pro」と言語モデル「Gemini」を組み合わせたWebベースの実験アプリ。テキストプロンプトや、生成・アップロードした画像から「ワールドスケッチ」を作成し、キャラクターや移動方法、視点(1人称・3人称)を設定したうえで仮想世界に入れる。

まずNano Banana Proでビジュアル構成を確認・修正し、その内容を基にGenie 3が環境や進行ルートをリアルタイムで生成する。ユーザーの行動に応じて世界が拡張していく仕組みだという。

Google DeepMindは、主な機能として「ワールドスケッチ」「ワールド探索」「ワールドリミックス」を挙げる。移動や相互作用に応じて生成される環境を探索できるほか、既存の世界に新たな解釈を加えることも可能としている。

また、キュレーション済みの世界やランダム生成ツールを通じて、多様な環境を体験できる。生成した世界や探索の過程は動画ファイルとしてダウンロードでき、創作内容の記録や共有にも活用できるとしている。

同社は本プロジェクトを通じて、単一環境に特化したAIエージェントを超え、現実世界の多様な状況や変化に対応できる汎用人工知能の開発を目指すとしている。

Genie 3は、ユーザーの行動に応じた経路のリアルタイム生成に加え、物理や相互作用のシミュレーション、高い整合性を保てる点が特徴だ。用途としては、ロボット訓練、アニメーションやフィクションの制作、実在の場所や歴史空間の探索などを想定して設計したという。

一方、Project Genieは研究用プロトタイプで、生成と探索の時間は最大60秒に制限される。生成された世界が現実の物理法則やプロンプトを完全には反映しない場合があるほか、キャラクター操作の遅延や制御の不安定さが生じる可能性もある。

Google DeepMindは、こうした制約を継続的に改善し、将来的には対応ユーザーと提供地域を拡大していく方針を示した。

キーワード

#Google DeepMind #Project Genie #Genie 3 #ワールドモデル #Google AI Ultra #生成AI
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.