Nota VLA模型演示画面(图片来源:NotaAI)

AI模型轻量化与优化公司Nota于29日表示,已在Qualcomm边缘AI设备上完成面向“物理AI”应用的视觉—语言—动作(VLA)模型优化。该公司称,优化后机器人动作生成环节耗时缩短约85.8%,推理提速最高可达7倍。

VLA模型对算力要求较高,可通过摄像头等传感器感知真实环境,理解人类指令并生成机器人动作。这类模型通常部署在GPU服务器环境中,完全依赖嵌入式设备实现实时运行的案例并不多见。

Nota表示,公司已在Qualcomm边缘AI设备Dragonwing IQ-9075上运行VLA模型SmolVLA 0.45B,并完成优化适配。

此次优化在识别和理解环节基本不变的情况下,重点针对机器人动作生成这一末端环节展开。Nota称,公司通过减少重复计算,并结合基于神经网络处理器(NPU)的计算图优化,将动作生成模块(Action Head)处理时间从218毫秒降至31毫秒,整体推理时间也从505毫秒缩短至310毫秒。任务成功率则由86%微降至85%,总体保持在相近水平。

Nota已在美国圣克拉拉举行的“Embedded Vision Summit 2026”上展示上述成果,并进行了实时互动演示。现场由观众选择物品,优化后的VLA模型完成识别后,机器人臂将物品抓取并放入篮筐。

Nota首席执行官Myungsoo Chae表示,AI需要在边缘AI设备上快速、稳定地完成“看见—理解—行动”的闭环处理。此次VLA优化结果表明,Nota相关技术有望在物理AI时代发展为关键基础能力。

关键词

#Nota #Qualcomm #边缘AI #VLA模型 #SmolVLA 0.45B #Dragonwing IQ-9075 #NPU #机器人 #物理AI #Embedded Vision Summit 2026
版权所有 © DigitalToday。未经授权禁止转载或传播。