写真=SCMP。Ant Groupが公開したロボットAIモデル「LingBot-VLA」

中国のAnt Groupが、ロボット向けAIモデル「LingBot-VLA」を初めてオープンソース化した。あわせてWorld Model「LingBot-World」も公開し、研究段階にとどまりがちなロボットAIの実運用を後押しする。

South China Morning Post(SCMP)は1月30日(現地時間)、今回の公開によって、デジタル領域にとどまらず物理環境で認識・推論・行動する「エンボディドAI」を巡る競争が一段と加速すると報じた。

報道によると、杭州市に本社を置くAnt Groupは、純粋なデジタル空間ではなく、現実の物理環境で認識・推論・行動するAIシステムの開発に注力している。

Alibaba Group Holding傘下のフィンテック企業であるAnt Groupは、ロボット部門のAntlingbo Technology(Robbyant)を通じて、ロボットの汎用的な頭脳を支えるビジョン・言語・行動(VLA)モデル「LingBot-VLA」を公開した。幅広い産業分野で、拡張性の高い実用展開を実現することを目指す。

Robbyantの最高経営責任者(CEO)、ジュ・シン氏(Zhu Xing)は「エンボディドAIを大規模に普及させるには、実機ハードウェア上で安定して動作する高性能かつ低コストの基盤モデルが必要だ」と説明した。その上で、「AIの物理世界への統合を加速し、実質的な価値をより早く提供することが目標だ」と強調した。

中国は産業用ロボットやヒューマノイドの普及で世界の先頭集団に位置付けられる一方、Unitree Roboticsなど一部のヒューマノイドは、ダンスや宙返りを披露していても、事前にプログラムされたルーチンに依存するケースが多いと指摘されてきた。自律性や汎用作業の実行にはなお限界があり、実際の生産性向上につながる「ロボットの頭脳」の高度化が主要課題として浮上している。

Ant Groupは技術文書で、LingBot-VLAをAgiBotのデュアルアームロボットのほか、Galaxea DynamicsやAgileX Roboticsの実機で検証したと説明した。ボトルのふた開け、ダンベルへのプレート装着、レモンの皮むきなど100種類のタスクで、他のVLAモデルと比べて汎化性能と学習効率が向上したとしている。

一方で同社は、実ロボットのデータ不足が依然としてボトルネックだと認めた。約2万時間分の実世界データで学習したものの、米スタートアップPhysical IntelligenceのVLAモデル「PI*0.6」と同程度の水準だったとし、プラットフォームに依存しない汎用的なロボット頭脳の実現には、さらなるデータの蓄積が必要だと付け加えた。

この課題を補う手段として期待されているのが、仮想環境でロボットが学習と試行を重ねる「World Model」だ。Ant Groupは今回、初のWorld Model「LingBot-World」も公開し、業界の先行システムとして知られるGoogle DeepMindの「Genie 3」と同等水準の能力を備えると説明した。

これによりAnt Groupは、TencentやSenseTimeなどと並び、World ModelベースのエンボディドAI開発を進める中国ビッグテックの一角に加わった。

業界では、今回のオープンソース化がロボットソフトウェアのエコシステム拡大を促し、産業現場への導入を早める触媒になり得るとの見方が出ている。その一方で、実機での安定稼働やデータ拡充が伴わなければ、本格的な現場投入のハードルはなお高いままだとの指摘もある。

キーワード

#Ant Group #ロボットAI #AI #VLA #エンボディドAI #オープンソース #World Model
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.