图片来源:Xiaomi

据VentureBeat当地时间6月24日报道,Xiaomi研究团队发布AI代理自动演进框架HarnessX,目标是在无需调整底层模型的情况下,持续优化代理系统表现。

所谓“哈内斯”,是指连接大语言模型与外部环境的一套软件框架,通常包括提示词、工具调用、记忆管理和执行流程等部分。随着企业级AI代理开始承担更复杂、周期更长的任务,这类框架的设计愈发关键,但以往大多仍依赖人工设计和反复迭代。

HarnessX采用模块化架构,使“哈内斯”各组成部分可以独立替换和持续演进。其核心是名为AEGIS的自动优化引擎,整个流程由四个阶段组成:首先分析代理运行日志,其次规划改进方向,再生成代码级修改方案,最后通过评审与门控机制控制潜在副作用。

测试结果显示,在15组模型—基准测试组合中,HarnessX有14组实现性能提升,平均增幅为14.5%。其中,开源模型Qwen3.5-9B在规划类基准测试中提升44%,在软件工程基准测试中提升18.2%。

HarnessX还支持“协同演进”机制,即在优化“哈内斯”的同时,将改进过程中产生的运行数据用于强化学习,从而进一步提升模型表现。研究团队称,这一机制可额外带来平均4.7%的性能增幅,但目前仅适用于开源模型。

在具体配置上,研究团队使用Claude Opus 4.6作为元代理,执行实际任务的代理则采用Claude Sonnet 4.6和GPT-5.4。报道指出,当前元代理仍需依赖性能较强的前沿模型,这也是该方案现阶段的限制之一。

研究团队表示,后续更新将公开相关代码。

关键词

#Xiaomi #HarnessX #AI代理 #AEGIS #大语言模型 #自动优化 #强化学习 #基准测试
版权所有 © DigitalToday。未经授权禁止转载或传播。