MENU

ニュース

AI推論コストは10分の1まで下がるのか? NVIDIAが示す「Rubin」という答え

  • URLをコピーしました!

NVIDIAは次世代AIの中核となるRubinプラットフォームを公開し、AIファクトリー時代に向けた計算、ネットワーク、ストレージ、セキュリティの統合を示しました。RubinはVera CPU、Rubin GPU、NVLink 6スイッチ、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6イーサネットスイッチの6チップを中核に、ラックスケールのVera Rubin NVL72とサーバーボードHGX Rubin NVL8という形で提供されます。トークンあたりの推論コストをBlackwell世代比で最大10分の1に、MoEトレーニングに必要なGPU数を4分の1に抑えるとし、長コンテキスト推論やエージェント型AIの処理を想定した拡張も盛り込まれています。ハードウェアとソフトウェアの協調設計を徹底し、ミッションクリティカルな運用に必要な可用性と保守性、機密性の強化を掲げています。量産段階に入り、パートナー経由で2026年後半の提供開始を予定しています。主要クラウドやサーバーメーカーの賛同コメントも公表され、エコシステムが拡大しています。

Rubinプラットフォーム

Rubin GPUは第3世代Transformer Engineを備え、生成AI推論に最適化された新データ型NVFP4を採用します。第6世代NVLinkはGPU間の帯域を拡張し、NVL72構成で高密度なスケールアウトを実現します。Vera CPUはデータセンターにおけるAI処理の制御と効率化を担い、Rubin GPUと緊密に連携します。BlueField-4 DPUはInference Context Memory Storageを支え、KVキャッシュの共有と再利用を効率化して推論スループットを高めます。Spectrum-6イーサネットとConnectX-9 SuperNICはAI最適化ファブリックを形成し、低遅延と高スループットを両立します。これらの統合により、推論コストの大幅削減と長コンテキスト処理の高速化を同時に実現する設計です。

ラックスケール設計とセキュリティ強化

Vera Rubin NVL72は72基のRubin GPUと36基のVera CPUをNVLink 6、BlueField-4、ConnectX-9で統合したラックスケールシステムです。ケーブル不要のトレイ式モジュール設計を採用し、組立と保守の工数をBlackwell比で大きく削減します。第2世代RASエンジンはリアルタイム健全性チェックや予防保守を支援し、稼働率の向上に貢献します。Confidential ComputingはCPU、GPU、NVLinkドメインを横断して適用され、データの機密性を保ちながら学習や推論を実行できます。BlueField-4にはASTRAと呼ばれるシステムレベルのトラストアーキテクチャが導入され、単一の信頼制御ポイントでプロビジョニングと分離を実現します。NVL72とHGX NVL8は、トレーニングと推論の双方で信頼性と運用性を両立させることを目指しています。

形態とリファレンスアーキテクチャ

HGX Rubin NVL8はx86サーバー向けに8基のRubin GPUをNVLinkで接続するボードとして提供され、生成AIや科学計算の高速化に対応します。DGX SuperPODはRubin世代に最適化され、DGX Vera Rubin NVL72またはDGX Rubin NVL8を中核に、BlueField-4、ConnectX-9、ネットワークファブリックやMission Controlソフトウェアを統合する設計です。Spectrum-X Ethernet Photonicsスイッチは信頼性と電力効率の改善を掲げ、AIファクトリーの大規模化を支えます。これらの構成により、データセンター内外を単一のAI環境として扱う拡張性が示されています。ハードウェアの標準化と運用ツールの統合は、導入から本番運用までの立ち上げ期間の短縮に寄与します。将来的な超大規模展開に向けたリファレンスとして活用できます。

エコシステムの広がりと提供時期

NVIDIAは主要クラウド、研究機関、サーバーメーカー、スタートアップからの支持を得ており、Vera Rubinベースのサービスや製品が2026年後半から順次提供される予定です。クラウドではAWS、Google Cloud、Microsoft、OCI、さらにCoreWeaveやLambda、Nebius、Nscaleなどが計画を示しています。MicrosoftはVera Rubin NVL72を次世代AIデータセンターに導入し、大規模AIファクトリー構想の推進を表明しました。サーバーメーカーではCisco、Dell、HPE、Lenovo、SupermicroがRubin製品に基づくサーバー群を準備しています。ソフトウェア面ではRed HatがRHEL、OpenShift、Red Hat AIをRubin向けに最適化する協業を発表しています。量産段階にあるRubinは、パートナー提供によって幅広いユースケースへの展開が見込まれます。

詳しくは「NVIDIA」の公式ページまで。

シェアはこちらから
  • URLをコピーしました!
  • 週刊SUZUKI
  • 日本オムニチャネル協会
  • 公式LINEメンバー

お問い合わせ

取材のご依頼やサイトに関するお問い合わせはこちらから。

問い合わせる