
NVIDIAは、AIハードウェアにおける次なる大きな飛躍に向けて準備を進めている。同社は9月8日、2026年の発売予定に先立ち、Vera Rubinマイクロアーキテクチャのテープアウト作業が進行中であると発表した。NVIDIAのアクセラレーテッドコンピューティング製品担当ディレクター、デイブ・サルバトール氏によると、Rubin CPXと呼ばれる新たな派生モデルは、膨大なコンテキストウィンドウを必要とするAIワークロードをターゲットとするという。
「Vera Rubinプラットフォームは、次世代Rubin GPUとCPXと呼ばれる新しいカテゴリーのプロセッサの両方を導入することで、AIコンピューティングの最先端に新たな飛躍をもたらすでしょう」と、NVIDIAの創業者兼CEOであるジェンスン・フアン氏はプレスリリースで述べています。「RTXがグラフィックスと物理AIに革命をもたらしたように、Rubin CPXは、モデルが数百万もの知識トークンを一度に推論する大規模コンテキストAI向けに特別に設計された初のCUDA GPUです。」
この発表は、Nvidiaが9月9日に最新のMLPerf推論結果を発表する直前に行われた。
Nvidiaが新しいハードウェアとアーキテクチャを発表
AIユースケースの中には、10万行を超えるコードを含むソフトウェア開発やHDビデオ生成など、100万トークンを超えるコンテキストウィンドウを必要とするものもあります。NVIDIAは、これらのユースケース向けに、2026年後半からVera Rubin NDL 144 CPXクラスのGPUを提供する予定です。
Vera Rubin NDL 144の派生モデルであるCPXモデルは、長いコンテキストウィンドウを必要とするアプリケーション向けに特別に設計されており、AI性能は8エクサフロップス、コンテキストコンピューティングには30PFのNVFP4を搭載し、Nvidia GB300 NVL72システムと比較して3倍の指数演算性能を実現します。また、128GBのGDDR7メモリ、生成ビデオ用のNVENC(エンコーダ)4基とNVDEC(デコーダ)4基、そして100テラバイトの高速メモリを搭載しています。
「これにより、インテリジェンスコーディングやビデオ生成などのプレミアムユースケースの新たなレベルが実現します」と、NVIDIA の製品マーケティング、AI、データセンター GPU 担当ディレクターのシャー・ナラシムハン氏は事前説明会で述べた。
データセンターのギガスケールリファレンスデザインはAIファクトリーの構築に役立つ
Vera Rubin NDL 144 CPXは、より大規模なAIファクトリーの一部と考えることができます。9月9日、NVIDIAは大規模データセンター向けにギガスケールのリファレンスデザインを提供する計画も発表しました。
「そのためには、幅広いインフラパートナーと協力して革新と共同開発を行う必要がある」とナラシムハン氏は述べた。
ナラシムハン氏は、NVIDIAがインフラ企業との提携により、コンピューティングの観点からデータセンターを設計する新たな時代に入りつつあると付け加えた。同社は、建築、エンジニアリング、建設、設計、シミュレーション、運用、発電、蓄電、機械、電気、配管を網羅したリファレンスデザインを提供していく。
Blackwell GPUがMLPerfベンチマークで記録を樹立
MLPerf ベンチマークは、MLCommons コンソーシアムが主催するテストであり、一部の企業で生成 AI ワークロードにおけるハードウェアとソフトウェアのパフォーマンスを測定するために使用されています。
Nvidia Blackwell GPUは、Llama 3.1 405B Interactiveにおいて、ディスアグリゲーションサービングと呼ばれる革新的な技術を用いてBlackwellのベースラインを上回り、新たなパフォーマンス記録を樹立しました。この手法により、同じハードウェアでパフォーマンスを向上させることができます。
「同じプラットフォームで、はるかに高いパフォーマンスを実現できます」とサルヴァトール氏は事前説明会で述べた。「このパフォーマンスは、既にソリューションを導入している組織にさらなる収益をもたらす可能性があります。」
一方、マイクロソフトはアナログ光コンピューターでAIを高速化する実験の結果を示した 。