NVIDIAのジェンスン・フアンCEO。Computexの基調講演でRackscale製品を紹介した(写真:NVIDIA)

NVIDIAが、生成AIの先を見据えた「エージェントAI」時代への対応を鮮明にした。ジェンスン・フアンCEOはComputex初日の基調講演で、次世代AIプラットフォーム「Vera Rubin」、企業向けエージェント開発基盤、AIファクトリー向け運用基盤「DSX」を発表した。

台湾メディアIT Homeによると、フアン氏は、AIはすでに実用段階に入りつつあり、コスト要因にとどまらず、収益を生み出す基盤へと変わっていると述べた。今後10年の企業競争力は、AIインフラを構築し、管理・運用できるかどうかに左右されるとも強調した。

同氏は、この2年で業界の軸足が生成AIからエージェントAIへ移ったと指摘した。今後の企業向けアプリケーションは、コードとOSを中心とした従来型の構造から、大規模言語モデル、エージェントフレームワーク、メモリシステム、各種ツール、実行環境を中核とする構成へ再編されると説明した。

AIは単なる応答生成にとどまらず、状況を理解し、作業フローを計画し、必要に応じてツールやデータベースを呼び出す段階に入るという。さらに、コードやCAD設計、文書、業務フローまで生成し、実行する形へ進化するとの見方を示した。

NVIDIAはあわせて、企業向けエージェント開発基盤も発表した。Nemotronのオープンモデル、Open Shell実行環境、AIエージェントフレームワーク、CUDA-X関数ライブラリ、セキュリティおよびガバナンス体制で構成する。

新モデル「Nemotron 3 Ultra」は、SSMとMoE(Mixture of Experts)を組み合わせた構造を採用した。NVIDIAは、推論速度を前世代比で5倍に高め、コストを30%削減したとしている。学習データや学習スクリプト、ツールチェーンも公開し、企業独自のエージェント開発を後押しする構えだ。

導入事例としては、NVIDIAとCadenceがチップ設計向けエージェントを紹介した。RTL検証、シミュレーション、デバッグを自動化し、従来は数週間かかっていた検証工程を数時間に短縮したという。効率は40倍超に高まったとしている。

ハードウェアでは、次世代AIプラットフォーム「Vera Rubin」が量産段階に入った。Hopperが学習、Grace Blackwellが推論に重点を置いていたのに対し、Vera RubinはエージェントAIを主眼に据えたプラットフォームと位置付ける。

構成要素は、Vera CPU、Rubin GPU、NVLink 72、BlueField DPU、ConnectX-9 SuperNIC、次世代ストレージ。NVIDIAは、これらを統合した基盤として展開する。

同社はAI PC分野にも展開する。「NVIDIA RTX Spark」は、TSMCの3ナノプロセスで製造するチップで、6144基のCUDAコアを備えたBlackwell RTX GPU、20コアのGrace CPU、128GBのLPDDR5統合メモリを組み合わせた。

Microsoftとは、エージェント向けのWindows 11プラットフォームも構築した。OSからGPUやAIアクセラレーション資源を直接利用できる構成を示した。

DSXは、AIファクトリー向け運用基盤として提示した参照アーキテクチャだ。計画・シミュレーションのほか、電力管理、液体冷却管理、GPU配置の最適化、電力網との連携機能を備える。

フアン氏は、多くのAIデータセンターでは電力配置の40%が無駄になっていると指摘した。その上で、動的な電力配分や負荷平準化、エージェントベースの冷却制御によって稼働率を高められると述べた。

キーワード

#NVIDIA #ジェンスン・フアン #エージェントAI #生成AI #Vera Rubin #Nemotron 3 Ultra #DSX #Computex #AIファクトリー #Windows 11
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.