Sakana AI发布多模型协同系统Fugu，部分项目基准成绩领先Anthropic Fable5

生成中...

Chi-gyu Hwang

发布时间 2026-06-23 06:40:42

搜索关键词

据NDTV当地时间23日报道，日本AI初创公司Sakana AI发布多模型协同系统Fugu。该系统并非依赖单一模型，而是通过单一API统一调度多款AI模型，以处理复杂任务。

Sakana AI表示，在工程、科学和推理等多项基准测试中，Fugu Ultra整体表现与Anthropic Fable5、Mythos Preview相当，部分项目成绩领先Fable5。

从公开结果来看，在评估编码能力的LiveCodeBench中，Fugu Ultra得分93.2，Fugu得分92.9，均高于Fable5的89.8。在涵盖生物、物理、化学等研究生难度题目的GPQA-D测试中，Fugu Ultra和Fugu均获得95.5分，高于Mythos Preview此前的94.6分。

此次Sakana AI共推出Fugu和Fugu Ultra两个版本。其中，Fugu主要面向编码、对话等日常任务；Fugu Ultra则聚焦更复杂的应用场景，包括AI研究、论文复现、网络安全分析和专利检索等。

Sakana AI还表示，根据公司自测结果，Fugu系列在自动化研究、机械设计、日语手写分析、国际象棋、魔方求解以及金融时间序列预测等任务中，表现超过Google Gemini 3.1 Pro、OpenAI GPT-5.5和Anthropic Opus 4.8。

Sakana AI总部位于东京，由Llion Jones与David Ha于2023年共同创立。Llion Jones是2017年Google论文《Attention Is All You Need》的共同作者之一，David Ha曾担任Stability AI研究负责人。

Chi-gyu Hwang delight@d-today.co.kr

Sakana AI发布多模型协同系统Fugu，部分项目基准成绩领先Anthropic Fable5

通过单一API统一调度多款模型处理复杂任务，提供Fugu和Fugu Ultra两个版本

生成中...

AI摘要

日本AI初创公司Sakana AI推出多模型协同系统Fugu，可通过单一API统一调度多款AI模型，以完成复杂任务。公开基准测试结果显示，Fugu Ultra在LiveCodeBench中获得93.2分，部分测试成绩高于Anthropic Fable5。