图片来源:Sakana AI

据NDTV当地时间23日报道,日本AI初创公司Sakana AI发布多模型协同系统Fugu。该系统并非依赖单一模型,而是通过单一API统一调度多款AI模型,以处理复杂任务。

Sakana AI表示,在工程、科学和推理等多项基准测试中,Fugu Ultra整体表现与Anthropic Fable5、Mythos Preview相当,部分项目成绩领先Fable5。

从公开结果来看,在评估编码能力的LiveCodeBench中,Fugu Ultra得分93.2,Fugu得分92.9,均高于Fable5的89.8。在涵盖生物、物理、化学等研究生难度题目的GPQA-D测试中,Fugu Ultra和Fugu均获得95.5分,高于Mythos Preview此前的94.6分。

此次Sakana AI共推出Fugu和Fugu Ultra两个版本。其中,Fugu主要面向编码、对话等日常任务;Fugu Ultra则聚焦更复杂的应用场景,包括AI研究、论文复现、网络安全分析和专利检索等。

Sakana AI还表示,根据公司自测结果,Fugu系列在自动化研究、机械设计、日语手写分析、国际象棋、魔方求解以及金融时间序列预测等任务中,表现超过Google Gemini 3.1 Pro、OpenAI GPT-5.5和Anthropic Opus 4.8。

Sakana AI总部位于东京,由Llion Jones与David Ha于2023年共同创立。Llion Jones是2017年Google论文《Attention Is All You Need》的共同作者之一,David Ha曾担任Stability AI研究负责人。

关键词

#Sakana AI #Fugu #Fugu Ultra #多模型协同 #API #基准测试 #LiveCodeBench #GPQA-D #Anthropic #OpenAI
版权所有 © DigitalToday。未经授权禁止转载或传播。