机器人初创公司Physical Intelligence发布新一代机器人模型π0.7。与传统上围绕单一任务训练的机器人系统不同,该模型瞄准的是“组合式泛化”能力,即通过组合已掌握的动作与知识,完成训练数据中未覆盖的新任务。这也被视为通用机器人迈出的又一步。
据科技媒体TechCrunch当地时间16日报道,π0.7在早期实验中展示了“组合式泛化”(Compositional Generalization)能力。所谓组合式泛化,是指机器人能够将过去学到的单项技能和知识重新组合,用于应对此前未接触过的环境和任务。
传统机器人训练通常依赖大量面向特定任务的数据,让系统反复学习同一类动作。相比之下,π0.7并不只是记住单个任务,而是将互联网预训练知识与机器人行为数据结合,尝试把能力扩展到陌生任务。Physical Intelligence将其视为迈向通用机器人“大脑”的早期探索。
一个代表性案例是空气炸锅实验。研究团队表示,与空气炸锅直接相关的训练数据几乎仅有两条。即便如此,π0.7仍在未追加训练的情况下尝试使用空气炸锅烹饪红薯,并在研究人员逐步下达语言指令后完成了整套操作。
联合创始人Sergey Levine表示,当系统从“只能完成精确训练过的任务”迈向“能够以新的方式组合执行任务”时,能力提升会更加明显,这一点与语言模型和视觉模型的发展路径相似。
团队认为,π0.7的核心意义在于,机器人进入新环境后,无需额外采集数据或重新训练,也能在现场优化任务执行效果。不过,该模型距离完全自主仍有明显差距:仅凭一次高层级指令,仍难以完成复杂的多步骤任务;目前只有在获得分步指令时,系统运行才更为稳定。
研究团队也提到,机器人行业目前仍缺乏统一的标准化基准测试,这也给外部独立验证带来困难。因此,Physical Intelligence将π0.7与公司既有的专用模型进行对比,并称其在咖啡制作、衣物折叠和箱体组装等复合任务上的表现已接近后者。
值得注意的是,任务表现并不完全由模型本身决定。研究员Ashwin Balakrishna透露,早期空气炸锅实验的成功率仅约5%,但在大约30分钟内调整任务指令的表述方式后,成功率升至95%。他表示,很多失败并不一定源于机器人本身,而是出在人类如何描述任务,这也进一步凸显了提示设计的重要性。
团队还观察到一些超出预期的结果。Balakrishna称,在向机器人提供一组随机齿轮并要求其转动后,系统无需额外学习也能完成任务。Levine则提到,早期大语言模型也曾出现超预期输出,他认为类似的“涌现”能力正在机器人领域显现。
不过,团队也强调,π0.7距离商业化仍有一段距离。论文将其定位为机器人泛化能力的早期信号,以及新能力的初步展示,现阶段仍属于研究成果验证阶段。
尽管仍处研究早期,资本市场对Physical Intelligence的预期已持续升温。该公司迄今累计融资已超过10亿美元,最新估值约为56亿美元。业内同时也在讨论,其是否会通过新一轮融资将估值进一步推高至110亿美元。