世界のテック業界で、中国AI企業への関心が再び高まっている。OpenAIやAnthropicなど米大手の最新モデルは高性能な半面、導入コストの負担が大きい。このため、価格競争力を前面に打ち出す中国製AIモデルが代替候補として存在感を強めている。
中国AIモデルに対する評価も、単に「安い代替品」にとどまらなくなってきた。ベンチマークによっては、OpenAIやAnthropicのモデルに迫る、あるいは一部で上回る結果も出ている。
中国のAIスタートアップZ.aiはこのほど、オープンソースの高性能モデル「GLM 5.2」を発表した。一部では、現時点で中国発のAIモデルとして最高水準の性能を備えるとの見方もある。価格はAnthropicの「Fable5」の10分の1水準という。
Moonshot AIも6月、対話AI「Kimi」の最新版を発表した。公表したベンチマークでは、AnthropicやOpenAIの最上位モデルに匹敵する性能を示したとしている。
リサーチ企業Artificial Analysisが現地時間24日に公表した評価によると、GLM 5.2はオープンソースモデルとして最高水準の性能を記録した。全モデルの順位でも、AnthropicのFable5、OpenAIのGPT 5.5に次ぐ3位に入り、GoogleのGemini 3.1 Pro Previewを上回った。
Z.aiのGLM 5.2投入後には、イーロン・マスク氏(Tesla CEO)がX(旧Twitter)で「中国は来年初めまでに現在の最先端フロンティアモデルの水準に到達する」との見方を示した。これに対し、Z.ai共同創業者のタン・ジェ氏は「そこまで時間はかからない」と反論したという。
英The Economistによると、複数のベンチマークを平均した場合、Fable5の性能はGLM 5.2を約17%上回るという。GLM 5.2と同等水準の西側モデルは約4カ月前に公開されていた。中国モデルは数学やコーディングのように正誤が明確な領域で強みを示す一方、自由記述型の問いや、継続的に自律判断を求められる課題では誤りが出やすい傾向があると同誌は報じた。
一方で、中国モデルには計算資源の不足も課題として残る。サービス停止がたびたび発生したり、アクセス集中時に応答速度が低下したりするとの指摘がある。
価格面では、中国AIモデルの優位性が際立つ。DeepSeekは最新のv4モデルについて、出力トークン100万当たり0.87ドルとしている。AnthropicのFable5の50ドルと比べると大幅に安い。
こうした価格差を背景に、米企業でDeepSeekの採用が増えているという。法人向け決済プラットフォームRampの顧客データでは、米国内でDeepSeek関連サービスの決済実績が急増した。Microsoftも主力のCopilot AIチャットボットでDeepSeekモデルの活用を検討していると伝えられている。
AIモデルのマーケットプレイスOpenRouterでは、人気上位10モデルのうち6モデルはDeepSeek、Tencent、Xiaomiなど中国企業の開発モデルが占めたという。
米New York Timesによると、OpenRouterのアレックス・アタラCEOは「コストの問題が中国モデルの採用を後押ししている」と述べた。中国モデルにはオープンソースのものが多く、無料で利用できるケースもあるという。
中国AIモデルの採用拡大を受け、関連企業の評価額も上昇している。香港上場のZ.aiは、GLM 5.2の公開後に時価総額が1兆香港ドルを突破した。
South China Morning Postによると、JPモルガンのレポートもZ.ai株の上昇を後押しした。JPモルガンは先週、GLM 5.2の投入を踏まえ、Z.aiの2026〜2030年の売上高予想を7〜16%引き上げた。
同社はさらに、Z.aiの2026年売上高が534%以上増加し、2028年に黒字転換すると予想した。
DeepSeekも最近、企業価値500億ドル超の評価で、74億ドル規模の資金を調達したと伝えられている。
もっとも、中国AIモデルが「安い」との前提自体に疑問を投げかける見方もある。米Georgia Institute of Technologyのドゥ・ジェン氏らが6月に更新した研究によると、同じタスクを実行する場合、DeepSeekモデルは同等の結果を得るために、OpenAIの競合モデルより実質23倍多くのトークンを消費した。
The Economistは、こうした効率差が大きい以上、モデル比較はトークン単価ではなく、実際に消費した総トークン量を踏まえた実コストで評価すべきだと指摘している。