写真=Shutterstock

Alibaba Cloudが、AI動画生成ツール「Vidu」を手掛けるShengShuのシリーズBラウンドを主導し、同社は2億9000万ドルを調達した。CNBCが10日(現地時間)に報じた。

出資にはTAL EducationとBaidu Venturesも参加した。

今回の資金調達は、テキスト中心の大規模言語モデル(LLM)の限界をにらみ、動画や物理的なシナリオを扱う「ワールドモデル」開発へ資金が向かう流れを映す事例の一つとみられる。

ShengShuは調達資金を、ゲームやAI動画などのデジタル世界と、自動運転やロボットが対象とする物理世界をつなぐ「汎用ワールドモデル」の開発に充てる方針だ。

同社は、視覚・音声・触覚などのマルチモーダルデータを基盤に汎用ワールドモデルを構築している。こうしたモデルは、LLMに比べて物理世界の挙動をより自然に捉えられると説明する。創業者のジュ・ジュン(Zhu Jun)氏は、知覚と行動を結び付けることで、AIシステムが現実世界の挙動を一貫してモデル化し、予測できるようにするのが目標だと述べた。

CNBCによると、ShengShuの最新モデル「Vidu Q3 Pro」は、テキストと画像から動画を生成するAIモデル分野でトップ10に入るという。同社は、OpenAIが「Sora」を公開する数カ月前から、Viduを世界展開していた。

Alibabaは関連スタートアップへの投資を拡大している。先月にはBaidu Venturesとともに、写真から3Dデジタルモデルを生成するTripo AIに5000万ドルを投資した。2025年9月には、AIワールドモデルを投入したPixVerseに6000万ドルを出資している。自社でも動画生成のオープンソースAIモデルを投入しており、2026年2月にはロボット向けモデルを公開した。

ワールドモデルは、とりわけロボティクス分野で重要になるとの見方もある。米IT誌Wiredの共同創業者、ケビン・ケリー(Kevin Kelly)氏は、人間レベルの人工知能の実現には、推論、物理世界の理解、継続学習の3要素が必要で、ワールドモデルがその中核となる技術的ブレークスルーになると述べた。

キーワード

#Alibaba Cloud #ShengShu #Vidu #ワールドモデル #生成AI #LLM #自動運転 #ロボット
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.