Vera Rubin(写真=NVIDIA)

NVIDIAの次世代AI向けCPU「Vera」が、初の公開ベンチマークでAMDの上位EPYCに迫る性能を示した。単一ソケット構成で最速級の結果を記録したほか、コードコンパイルの一部では、デュアルソケットのEPYC最上位構成に近い水準に達した。

Gizmodoが29日(現地時間)に報じた。ベンチマークは、Linux専門メディアPhoronixがNVIDIA本社への招待に基づいて実施したもの。Veraは2026年後半の投入を予定するデータセンター向けのAI・HPC用CPUで、前世代「Grace」がArm Neoverse V2コアを採用していたのに対し、NVIDIA独自設計の「Olympus」コアを搭載する。

Veraは88コア176スレッド構成で、FP8演算をサポートする。メモリはLPDDR5Xに対応し、最大1.2TB/sの帯域幅を確保した。L2キャッシュは1コア当たり2MB、共有L3キャッシュは164MB。PCIe 6.0とCXL 3.1もサポートする。ラック製品「Vera Rubin NVL72」はRubin GPU 72基とVera CPU 36基で構成されるが、CPU単体でも提供する予定だ。

テストは88コアのフル構成システムで行われ、メモリには96GBのLPDDR5-9600モジュールを8枚搭載した。ピークTDPは450Wで、実測時の消費電力は30W未満とされた。

特に目立ったのはコードコンパイル性能だ。Veraは、5.0GHz動作のAMD EPYC 9575Fによるデュアルソケット構成と同程度の結果を示し、単一ソケットではテスト対象中で最速となった。Node.jsのコンパイルではGraceの半分以下の時間で処理を完了し、コア当たり性能でも高クロックのEPYC上位製品に近い水準を示した。

Linuxカーネルのビルドでも、Veraは約20秒で最速を記録した。一方、allmodconfig x86_64カーネルのビルドでは、より多くのコアを備えるデュアルソケットのEPYC 9575Fおよび9755構成にはわずかに及ばなかったものの、単一ソケットでは最も高い性能を示した。

NVIDIAは今回の結果について、Veraがコードコンパイル、ファイル圧縮、動画トランスコード、PythonおよびJavaの実行、データベース処理など、幅広いCPU集約型ワークロードで世代間の性能向上を示したと強調した。こうしたワークロードは、今後のAIエージェントや「AIファクトリー」環境で中核的な計算処理になると説明している。

今回のベンチマークは、NVIDIAがGPU中心のAIインフラにとどまらず、CPU設計でも競争力を示した事例といえる。Graceに続く次世代サーバーCPUで自社コアへ移行した後、実際のコンパイルやシステム処理でどこまで性能を引き上げたのかが、初めて具体的な数値で示された格好だ。2026年後半にVeraが本格投入されれば、AIサーバー向けCPU市場でAMD EPYCやIntel Xeonとの競争が一段と激しくなりそうだ。

キーワード

#NVIDIA #Vera #AMD EPYC #Arm #データセンター向けCPU #ベンチマーク #Linux #コードコンパイル
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.