人形机器人“炫技”视频不断刷屏,但业内普遍认为,仅凭视频画面,远不足以判断机器人真实的作业能力。
据 Ars Technica 4日(当地时间)报道,机器人行业和学界人士指出,网上爆红的视频,与机器人在现实场景中的实际表现之间,往往存在不小落差。判断一台机器人是否真正“能干活”,关键不在一两次成功演示,而在于它能否在不同环境中稳定、重复地完成同类任务。
报道指出,不少企业会通过高难度动作或家务场景演示吸引关注,但这些展示能否在工业场景或家庭环境中稳定复现,仍需进一步验证。
Agility Robotics 联合创始人、Oregon State University 机器人研究人员 Jonathan Hurst 表示,人形外观本身就容易引发外界过高期待。公众看到机器人像人一样跳舞,往往会进一步推断它也具备类似人类的其他能力,但“事实并非如此”。他还提到,一些初创企业也会借助这种认知落差进行融资。
University of California, Berkeley 计算机科学家、Physical Intelligence 联合创始人 Sergey Levine 认为,机器人技术真正棘手的问题在于“通用性”。他说,即便机器人能够倒一杯酒,也不意味着它可以面对任意酒瓶、任意杯子、任意环境都完成同样的动作;相比一次舞台式的后空翻演示,这类能力实现起来要困难得多。
因此,业内更看重的并不是吸睛视频本身,而是机器人在真实环境中是否经过量化、充分且具备一定规模的验证。Levine 也指出,演示所呈现的效果与机器人真实能力之间,始终存在差距。
除了通用性,机器人是否真正实现自主运行,同样是观察演示视频时必须首先确认的问题。Purdue University 计算机科学博士生、美国陆军开发司令部陆军研究所研究助理 Deepam Patel 表示,很多演示实际上仍依赖远程操控;如果论文或企业说明中没有明确写出“完全自主”,就应当对此保持高度审慎。他说:“如果没有清楚说明是完全自主,就应该打上一个很大的问号。”
演示发生在什么样的环境中,也会直接影响判断。若机器人是在首次接触的陌生环境中完成任务,其通用自主能力更具说服力;如果只是在人为布置或已经训练过的熟悉场景中重复表演,那么参考价值就会打折扣。
此外,视频是否经过加速处理,也会影响外界判断。Patel 指出,出于安全等因素考虑,机器人通常移动得较慢。一些企业会在视频中标注为 2 倍速或 4 倍速播放,这也意味着同一任务的实际完成时间,可能是画面呈现的两倍或四倍。换言之,看上去动作敏捷,并不等于真实作业效率足够高。
报道还指出,不同演示视频的目的和透明度差异很大:有些更偏向社交媒体传播,有些则是面向客户或投资者的宣传材料;也有部分视频会展示机器人学习和试错过程,从而让外界看到其能力边界。
总体来看,互联网上走红的人形机器人视频,只能反映技术全貌中的一部分。即便视频制作精良、发布方看似可靠,也很难据此对机器人真实水平下结论。业内认为,真正值得关注的指标,不是某条“爆款”视频完成得有多漂亮,而是机器人在真实场景中的自主性、通用性、作业速度、重复表现,以及支撑这些判断的验证规模。