NVIDIAは、5500億パラメータ級のオープン大規模言語モデル(LLM)「Nemotron 3 Ultra」を今週公開する方針を明らかにした。併せて、次世代AIサーバープラットフォーム「Vera Rubin」の量産開始も発表し、企業向けAI分野でソフトとハードの両面から展開を加速する。
Gigazineによると、NVIDIAのジェンスン・フアンCEOは1日(現地時間)、「NVIDIA GTC Taipei 2026」の基調講演でNemotron 3 UltraとVera Rubinを披露した。
Nemotron 3 Ultraは、総パラメータ数5500億のLLM。NVIDIAはこれをオープンモデルとして公開する方針で、実際の公開は今週中になる見通しだとしている。
同社は、米企業発のオープンモデルとしては最高水準の性能を備えると訴求する。発表資料では、中国のGLM 5.1、Kimi K2.6、Qwen 3.5など主要なオープンモデルと比較した複数のベンチマークを示し、競争力をアピールした。特にコスト効率では中国勢に対する優位性を強調している。
一方、外部評価では中国勢が上回る指標も出た。評価機関Artificial Analysisが公表した「AAI(Artificial Analysis Intelligence Index)」で、Nemotron 3 Ultraは48点を記録。GoogleのGemma 4 31B(39点)を大きく上回ったものの、中国のKimi K2.6(54点)には届かなかった。
NVIDIAは、単純な性能指標よりも実運用での優位性を前面に打ち出す。同社によると、同程度の知能スコアを持つ競合モデルと比べ、1秒当たりに生成できるトークン数で高い性能を示したという。ベンチマーク上の数値競争ではなく、実サービス環境での処理速度とコスト効率を強みに据える考えだ。
併せて発表したVera Rubinは、次世代AI GPU「Rubin」と、自社開発のAI CPU「Vera」を中核に、高性能ストレージとネットワークを統合したデータセンター向けAIサーバープラットフォーム。NVIDIAは、エージェントAI環境で既存世代のシステムを上回る処理効率を実現すると説明した。
同社は、AIの主戦場がチャットボットから自律的に業務をこなすエージェントAIへ移行しつつあり、それに伴って関連データセンター需要も急増しているとの認識を示した。
今回の発表について業界では、新たなAIモデルやサーバー製品を個別に示しただけではなく、AIモデル開発から推論、データセンターインフラの供給までを一体で押さえるエコシステム戦略をより明確にしたとの見方が出ている。
フアンCEOはこの日、Windows 11搭載AI PC市場を視野に入れた新製品も発表した。ArmベースCPUとNVIDIA製GPUを組み合わせたノートPC向けSoC「RTX Spark」と、高性能AIワークステーション「DGX Station」がそれに当たる。
もっとも、市場の関心はNemotron 3 UltraとVera Rubinに集まっている。オープンモデルを巡る競争が米中企業の主導権争いの様相を強めるなか、NVIDIAはモデル性能に加え、推論速度とコスト効率を武器に存在感を高める構えだ。
今後の焦点は、Nemotron 3 Ultra公開後のライセンス方針や利用範囲の設定と、Vera Rubinが量産段階で企業向けAIおよびエージェントAI市場の需要をどこまで取り込めるかにある。