画像=Xiaomi

Xiaomiの研究チームは、AIエージェントのハーネスを自動的に改良するフレームワーク「HarnessX」を公開したとVentureBeatが24日(現地時間)に報じた。AIモデル自体を改変せず、エージェントの性能向上を図るアプローチとしている。

ハーネスは、大規模言語モデルを外部環境と接続するためのソフトウェア層を指す。プロンプト、ツール連携、メモリ管理、実行フローなどで構成される。企業向けAIエージェントが複雑で長期にわたるタスクを担うほど、ハーネス設計の重要性は増すが、これまでは手作業での構築や改善が必要だった。

HarnessXは、ハーネスを独立したモジュールとして差し替え・改良できるよう設計した。中核となる自動最適化エンジン「AEGIS」は、実行ログを分析する「ダイジェスター」、改善方針を探る「プランナー」、コードレベルの修正を生成する「エボルバー」、副作用を抑える「クリティック・ゲート」の4段階パイプラインで構成される。

15のモデル・ベンチマークの組み合わせで検証した結果、HarnessXは15組中14組で性能を改善し、平均14.5%の向上を記録した。オープンソースモデル「3.5-9B」は、実装計画に関するベンチマークで44%、ソフトウェアエンジニアリングのベンチマークで18.2%改善した。

HarnessXは、ハーネスの進化とモデル学習を並行して進める共進化にも対応する。ハーネス改善の過程で生成された実行データをモデルの強化学習に活用し、さらに平均4.7%の性能改善を確認した。ただし、共進化を適用できるのはオープンソースモデルに限られる。

研究チームは、メタエージェントにClaude Opus 4.6、実作業エージェントにClaude Sonnet 4.6とGPT-5.4を用いた。一方で、メタエージェント側に高性能なフロンティアモデルを必要とする点は制約として残る。コードは今後のアップデートで公開する予定だ。

キーワード

#Xiaomi #AIエージェント #HarnessX #AEGIS #大規模言語モデル #強化学習
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.