NVIDIAとGoogle Cloudが提携し96万基のVera Rubin搭載ベアメタルサーバーを提供へ

NVIDIAが、次世代のエージェント型AIおよび物理AIを推進するAIファクトリー向けにGoogle Cloud AI Hypercomputerを拡張することを発表しました。最大で96万基のRubin GPUまでスケール可能なNVIDIA Vera Rubin搭載の「A5X」インスタンスを企業が利用できるようになります。
NVIDIA and Google Cloud Collaborate to Advance Agentic and Physical AI | NVIDIA Blog
https://blogs.nvidia.com/blog/google-cloud-agentic-physical-ai-factories/
.@GoogleCloud and NVIDIA are expanding their partnership across agentic and physical AI.
— NVIDIA (@nvidia) April 22, 2026
At #GoogleCloudNext, the companies made several announcements, including:
✅ NVIDIA Vera Rubin-powered A5X instances, scaling up to nearly 1M Rubin GPUs
✅ Gemini on Google Distributed… pic.twitter.com/5RxjUtfRJl
新たに発表された「A5X」はNVIDIA Vera Rubin NVL72ラックスケールシステムを採用したベアメタルインスタンスです。ベアメタルインスタンスとは、仮想サーバーではなく物理サーバー単体を一社が独占利用できるシステムを指します。
A5Xは前世代と比べてトークンあたりの推論コストが最大10分の1に削減され、メガワットあたりのトークンスループットが最大10倍に向上しているとのこと。ネットワーキングシステム「NVIDIA ConnectX-9 SuperNIC」と「Google Virgo」を組み合わせることで、単一サイトのクラスターで最大8万基、マルチサイトクラスターで最大96万基のNVIDIA Rubin GPUまでスケール可能になるとのことです。
このほか、NVIDIA BlackwellおよびNVIDIA Blackwell Ultra GPU上で動作するGoogle Distributed Cloud上のGoogle Geminiのプレビュー、NVIDIA Blackwell GPUを備えた機密VM、そしてNVIDIA NemotronのオープンモデルとNVIDIA NeMoフレームワークを用いたGemini Enterprise Agent Platform上のエージェント型AIなど、さまざまなシステムも統合できます。
NVIDIAが1200億パラメータ規模の日本語対応ハイブリッドMoEオープンウェイトAIモデル「Nemotron 3 Super」を発表 - GIGAZINE

これらのサービスを利用することで、Mixture-of-Expertsによる推論、マルチモーダル推論、データ処理、フィジカルAIやロボティクスの複雑なシミュレーションに至るまで、あらゆるワークロードの最適化を実現できるとNVIDIAはアピールしました。
GoogleとNVIDIAとの提携は10年目の節目を迎えるとのことです。
・関連記事
NVIDIAがAI特化GPU「Rubin」とAI特化CPU「Vera」の詳細を発表、AIラック「Vera Rubin NVL72」の処理性能はFP64精度で2400TFLOPS&Groqの高速推論チップも統合 - GIGAZINE
NVIDIAのAI特化CPU「Vera CPU」は一体どれだけ高性能なのか? - GIGAZINE
NVIDIAが量子コンピューターを開発するためのAI「NVIDIA Ising」を発表 - GIGAZINE
ゲームのロード時間を短縮するための「自動シェーダーコンパイル」機能がNVIDIAアプリのベータ版に登場 - GIGAZINE
・関連コンテンツ
in ハードウェア, Posted by log1p_kr
You can read the machine translated English article NVIDIA and Google Cloud partner to offer….







