Sakana AIは、複数のAIモデルを単一API上で組み合わせ、複雑なタスクに対応するマルチモデルAIシステム「Fugu」の提供を開始した。23日付のNDTV報道が伝えた。
同社によると、上位モデルの「Fugu Ultra」は、コーディング、科学、推論関連のベンチマークで、Anthropicの「Claude Fable 5」や「Mithos Preview」と同等の性能を示し、一部項目ではClaude Fable 5を上回った。
同社が公表したベンチマークでは、コーディング性能を測る「LiveCodeBench」でFugu Ultraが93.2、Fuguが92.9を記録し、Claude Fable 5の89.8を上回った。生物学、物理学、化学の大学院レベルの問題で構成される「GPQA-D」でも、Fugu UltraとFuguはいずれも95.5を記録し、Mithos Previewの94.6を超えた。
Sakana AIは、FuguとFugu Ultraの2モデルを展開する。Fuguはコーディングやチャットなど日常的な用途を想定し、Fugu UltraはAI研究、論文の再現、サイバーセキュリティ分析、特許調査といった、より複雑な業務向けに位置付ける。
同社は社内テストの結果として、Fuguが自動化研究、機械設計、日本語の手書き分析、チェス、ルービックキューブの解法、金融時系列予測の分野で、Google Gemini 3.1 Pro、OpenAI GPT-5.5、Anthropic Opus 4.8を上回ったとも説明している。
Sakana AIは東京に本社を置くAIスタートアップ。Googleの2017年論文「Attention Is All You Need」の共著者であるリリオン・ジョーンズ氏と、Stability AIで研究責任者を務めたデイビッド・ハ氏が、2023年に共同設立した。