Physical Intelligence发布机器人模型π0.7：可通过能力组合完成未覆盖训练数据的任务

机器人初创公司Physical Intelligence发布新一代机器人模型π0.7。与传统上围绕单一任务训练的机器人系统不同，该模型瞄准的是“组合式泛化”能力，即通过组合已掌握的动作与知识，完成训练数据中未覆盖的新任务。这也被视为通用机器人迈出的又一步。

据科技媒体TechCrunch当地时间16日报道，π0.7在早期实验中展示了“组合式泛化”（Compositional Generalization）能力。所谓组合式泛化，是指机器人能够将过去学到的单项技能和知识重新组合，用于应对此前未接触过的环境和任务。

传统机器人训练通常依赖大量面向特定任务的数据，让系统反复学习同一类动作。相比之下，π0.7并不只是记住单个任务，而是将互联网预训练知识与机器人行为数据结合，尝试把能力扩展到陌生任务。Physical Intelligence将其视为迈向通用机器人“大脑”的早期探索。

一个代表性案例是空气炸锅实验。研究团队表示，与空气炸锅直接相关的训练数据几乎仅有两条。即便如此，π0.7仍在未追加训练的情况下尝试使用空气炸锅烹饪红薯，并在研究人员逐步下达语言指令后完成了整套操作。

联合创始人Sergey Levine表示，当系统从“只能完成精确训练过的任务”迈向“能够以新的方式组合执行任务”时，能力提升会更加明显，这一点与语言模型和视觉模型的发展路径相似。

团队认为，π0.7的核心意义在于，机器人进入新环境后，无需额外采集数据或重新训练，也能在现场优化任务执行效果。不过，该模型距离完全自主仍有明显差距：仅凭一次高层级指令，仍难以完成复杂的多步骤任务；目前只有在获得分步指令时，系统运行才更为稳定。

研究团队也提到，机器人行业目前仍缺乏统一的标准化基准测试，这也给外部独立验证带来困难。因此，Physical Intelligence将π0.7与公司既有的专用模型进行对比，并称其在咖啡制作、衣物折叠和箱体组装等复合任务上的表现已接近后者。

值得注意的是，任务表现并不完全由模型本身决定。研究员Ashwin Balakrishna透露，早期空气炸锅实验的成功率仅约5%，但在大约30分钟内调整任务指令的表述方式后，成功率升至95%。他表示，很多失败并不一定源于机器人本身，而是出在人类如何描述任务，这也进一步凸显了提示设计的重要性。

团队还观察到一些超出预期的结果。Balakrishna称，在向机器人提供一组随机齿轮并要求其转动后，系统无需额外学习也能完成任务。Levine则提到，早期大语言模型也曾出现超预期输出，他认为类似的“涌现”能力正在机器人领域显现。

不过，团队也强调，π0.7距离商业化仍有一段距离。论文将其定位为机器人泛化能力的早期信号，以及新能力的初步展示，现阶段仍属于研究成果验证阶段。

尽管仍处研究早期，资本市场对Physical Intelligence的预期已持续升温。该公司迄今累计融资已超过10亿美元，最新估值约为56亿美元。业内同时也在讨论，其是否会通过新一轮融资将估值进一步推高至110亿美元。

Jinju Hong hongjj@d-today.co.kr