画像=NC AIのWFMが予測した映像(左)と、シミュレーター上でのロボット動作

NC AIは3月16日、ロボット知能の中核技術と位置付けるワールドモデル(WFM)の研究成果を公開した。これを足掛かりに、世界のフィジカルAI市場への参入を進める。

ワールドモデルの研究は大規模な計算インフラを必要とするが、同社は自社の研究インフラを用いて学習と検証を実施した。主要タスクでは、実用化を視野に入れられる水準の成功率を確認したとしている。

同社によると、従来のWFMは映像を生成し、その内容をビジョン言語モデル(VLM)で推論して行動を選択する方式が主流だった。これに対しNC AIのWFMは、映像生成前の情報である潜在空間(Latent Space)から直接行動を生成する構成を採用。効率性と精度の両立を図ったという。

今回の成果の特徴の1つは、資源効率の高さにある。NC AIは、グローバルのSOTAモデルの微調整に必要なGPU資源の25%でWFMの学習に成功したとしている。

性能面でも一定の水準を示した。ロボットアームの複雑な動作を制御する24の高難度ロボット操作タスクで、シミュレーター上の精密な予測性能を検証した結果、全24タスクではSOTA比70%の性能を確保したという。

さらに、実運用や商用化に近い18の主要タスクに絞って評価したところ、NVIDIA Cosmosなど最高性能モデルの80%に相当する高いタスク成功率を記録したとしている。

NC AIは今後、ロボット学習で課題となるデータ不足の解消に向け、ワールドモデルを活用した大規模な合成データ生成パイプラインも構築する計画だ。降雪下の工場、消灯した夜間の物流センター、予期しない人の介入といった現実の変数を実写データとして収集するには、多大な時間とコストがかかっていた。

同社は、WFM環境ではプロンプト入力だけで、こうした極限環境の動画データを大量に生成できると説明する。

これを基に、半導体クリーンルーム、鉄鋼工程、造船所のブロック工程など、韓国の製造業の特性に合わせたドメイン特化型の合成データを供給し、現場データの不足を補う方針だ。

NC AIは「NC AIの独自ワールドモデル技術を基盤に、K-フィジカルAIアライアンスとともに韓国産業に特化したロボットエコシステムを強化し、グローバルなフィジカルAI競争を主導する中核競争力へと育てていく」と述べた。

キーワード

#NC AI #ワールドモデル #WFM #フィジカルAI #ロボット #潜在空間 #VLM #GPU #合成データ
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.