Anthropicは5月28日(現地時間)、新たなAIモデル「Claude Opus 4.8」の提供を開始した。コーディングと推論の性能を引き上げた一方、価格は従来水準を維持した。あわせて高速モードや開発者向けツール「Claude Code」、Message APIも刷新した。
ITメディアの9to5Macなどによると、今回の更新は4月16日に「Opus 4.7」を公開してから約6週間で実施された。
Anthropicは今回の改良について、性能向上と応答方式の見直しが柱だと説明している。従来モデル以上に、ユーザーの作業を支える共同作業相手として機能するよう設計したという。
Opus 4.7をベースに判断の精度を高め、不確実な点はより明確に示せるようにしたほか、長時間にわたって自律的に作業を進める能力も強化したとしている。
初期テストでは、作業の過程で不確実性を示す頻度が増えた一方、根拠の乏しい主張は減少したという。Anthropicは、新モデルについて「信頼性と判断力が向上し、事実に裏付けられない主張を行う傾向も低下した」と説明した。
コーディング面では、モデル自身が生成したコードの欠陥を見落とす可能性が、Opus 4.7比で4分の1の水準まで低下した。コードレビューや反復的な修正が多い開発環境で、誤りの検出精度を高めたとしている。
アライメント評価でも改善があった。Anthropicは、社会的に望ましい特性を測る指標で新たな最高水準を記録し、Opus 4.7と比べて非整列行動の比率も大きく低下したと公表した。作業能力を高めながら、制御可能性と安全性も向上させたとしている。
ベンチマークでは、エージェント型コーディングが64.3%から69.2%に上昇した。ツール活用を伴う多分野推論も54.7%から57.9%に伸びた。
このほか、エージェント型のコンピュータ利用は82.8%から83.4%、知識労働の指標は1753から1890、エージェント型金融分析は51.5%から53.9%にそれぞれ改善した。
価格は据え置く。Anthropicは、Opus 4.7とOpus 4.8の料金を同一にすると明らかにした。一方で、高速モードについては性能とコスト構造を見直した。
通常料金は、入力100万トークン当たり5ドル、出力100万トークン当たり25ドル。Opus 4.8向けの高速モードは、入力100万トークン当たり10ドル、出力100万トークン当たり50ドルとした。
Anthropicによると、高速モードは従来比で約2.5倍高速化し、コストは3分の1の水準に下がったという。
開発者向けの「Claude Code」も刷新した。Opus 4.8は基本的に高い計算リソース設定で動作し、コーディング作業ではOpus 4.7と同程度のトークン使用量で、より高い性能を発揮するとしている。
Anthropicは、より高い処理設定に対応して、Claude Codeの利用上限も引き上げる計画だ。
大規模作業向けの機能も追加した。研究プレビューとして提供する「Dynamic Workflows」は、Claude Codeがより大規模な作業を処理できるよう支援する機能だとしている。
「Claude Cowork」とclaude.aiには、モデル選択画面の横で、応答に投入する計算リソースの水準を調整できる制御機能も追加した。
Message APIも変更した。メッセージ配列内でシステムメッセージを受け取れる構造に改め、開発者はユーザーの発話を挟まずに、処理の途中で指示を修正できるようになった。プロンプトキャッシュとルーティング機能も維持できるとしている。
今後の計画も明らかにした。Anthropicは、同程度の性能を備えた低コストモデルを準備しているほか、Project Glasswingに基づく強化版のサイバー安全対策を適用したうえで、今後数週間以内に「Mythos」級モデルの提供範囲を広げる計画だという。
OpenAIとの競争が激しさを増すなか、今回の更新は実利用での性能改善を重視した動きとみられる。コーディング時の誤り検出や長時間の自律作業、不確実性の明示といった点を打ち出し、開発者や企業顧客の獲得競争を加速させる可能性がある。