Nota完成Qualcomm边缘AI设备Dragonwing IQ-9075上VLA模型优化，推理提速最高达7倍

生成中...

Seulgi Son

发布时间 2026-05-29 14:57:45

搜索关键词

AI模型轻量化与优化公司Nota于29日表示，已在Qualcomm边缘AI设备上完成面向“物理AI”应用的视觉—语言—动作（VLA）模型优化。该公司称，优化后机器人动作生成环节耗时缩短约85.8%，推理提速最高可达7倍。

VLA模型对算力要求较高，可通过摄像头等传感器感知真实环境，理解人类指令并生成机器人动作。这类模型通常部署在GPU服务器环境中，完全依赖嵌入式设备实现实时运行的案例并不多见。

Nota表示，公司已在Qualcomm边缘AI设备Dragonwing IQ-9075上运行VLA模型SmolVLA 0.45B，并完成优化适配。

此次优化在识别和理解环节基本不变的情况下，重点针对机器人动作生成这一末端环节展开。Nota称，公司通过减少重复计算，并结合基于神经网络处理器（NPU）的计算图优化，将动作生成模块（Action Head）处理时间从218毫秒降至31毫秒，整体推理时间也从505毫秒缩短至310毫秒。任务成功率则由86%微降至85%，总体保持在相近水平。

Nota已在美国圣克拉拉举行的“Embedded Vision Summit 2026”上展示上述成果，并进行了实时互动演示。现场由观众选择物品，优化后的VLA模型完成识别后，机器人臂将物品抓取并放入篮筐。

Nota首席执行官Myungsoo Chae表示，AI需要在边缘AI设备上快速、稳定地完成“看见—理解—行动”的闭环处理。此次VLA优化结果表明，Nota相关技术有望在物理AI时代发展为关键基础能力。

Seulgi Son sageson@d-today.co.kr