中国のAI企業DeepSeekが、新たなAIモデル「V4」を公開した。オープンソースで先端モデル級の性能をうたいながら、Opus 4.7やGPT-5.5を大きく下回る価格設定を打ち出しており、市場では昨年の推論モデル「R1」を上回るインパクトを与える可能性があるとの見方が出ている。
公開したのは「V4 Pro」と「V4 Flash」の2モデル。V4 Proは総パラメータ数が1兆6000億、アクティブパラメータは490億で、コンテキスト長は100万トークン。V4 Flashは総パラメータ数2840億、アクティブパラメータ130億としている。
DeepSeekによると、両モデルは約33兆トークンで学習した。MMLU Pro、GPQA Diamond、SWE-benchなどのベンチマークでは、Opus 4.7やGPT-5.5に近い性能を示したと説明している。
YouTubeチャンネル「Forward Future」を運営するマシュー・バーマン氏は、X(旧Twitter)への投稿で、コスト面の合理性が米企業をDeepSeekに向かわせていると指摘した。
同氏によると、GPT-5.5とOpus 4.7は出力100万トークン当たり30ドル前後なのに対し、DeepSeekはそれを大きく下回る水準だという。しかもオープンソースのため、ファインチューニングや自社環境での運用にも対応できる。多くの企業業務では最先端クラスの性能が必須ではなく、「十分な性能」が確保できればDeepSeekを選ぶ動機は強いとの見方を示した。
一方で、地政学リスクを懸念する声もある。米企業が中国発のオープンソースモデルをAI戦略の土台に据えた場合、中国のAI企業側がアーキテクチャを変更したりアクセスを遮断したりすれば、大きなリスクになり得るという指摘だ。
さらに、米国発のソーシャルメディアが世界の言論形成に影響を与えてきたのと同様に、中国モデルがAI基盤として広がれば、中国由来の文化的バイアスがAIに組み込まれる可能性があるとの見方も示した。
米政府による対中輸出規制の効果を巡っても評価は分かれている。DeepSeekの論文では、スーパーノードの拡張が進む今年下半期まではV4 Proのサービス提供能力が限定的だとしており、規制が一定の制約として機能していると受け止める余地がある。
その一方で、こうした制約がアルゴリズム面の革新を促し、比較的低価格なGPUでも低コストでモデルを構築できる方向に開発を進めた側面がある、との見方も示された。
Anthropicなど米国のAI開発企業や米政府はこれまで、中国企業が米国製AIモデルを使って大規模な蒸留を進めていると警告してきた。蒸留は、既存モデルの出力を学習データとして新たなモデルを作る手法を指す。
これに対しバーマン氏は、DeepSeekが学習に利用した米国AIモデルの回答は15万件にとどまり、MoonshotAIの340万件、MiniMaxの1300万件と比べて大幅に少ないと説明した。そのうえで、「蒸留だけでこの性能水準を説明するのは難しい」とする分析もあると紹介した。
バーマン氏は最終的に、米国はオープンソースモデルの開発により積極的に取り組むべきだと主張した。あわせて、OpenAIとAnthropicについても、はるかに速いペースで価格を引き下げる必要があると指摘。米企業がコストと性能を比較すれば、現時点ではDeepSeekが大きく優位に立っているとの見方を示した。