NVIDIA DGX Cloud AI スーパーコンピューティングが AI トレーニングをサービスとして提供

NVIDIA DGX Cloud AI スーパーコンピューティングが AI トレーニングをサービスとして提供
NVIDIA DGX Cloud for AI 2023
画像: NVIDIA

NVIDIAのDGX Cloudインフラストラクチャは、組織が生成AIモデルのトレーニングに適したスーパーコンピューティングハードウェア上のスペースをリースできるサービスで、一般提供を開始しました。3月に初めて発表されたこのサービスは、インスタンスあたり月額36,999ドルで、NVIDIA独自の20万ドルのDGXサーバーと競合します。このサービスは、Oracle Cloudインフラストラクチャと、米国と英国に設置されたNVIDIAハードウェア上で稼働します。

ジャンプ先:

  • NVIDIA DGX Cloud は何をするのですか?
  • NVIDIA DGX Cloud for AI プラットフォームが機能する仕組みは何ですか?
  • AIコンピューティングへのアクセスがどのように変化しているか 

NVIDIA DGX Cloud は何をするのですか?

DGX Cloud は、Oracle Cloud Infrastructure 上でオンラインになっている数千の NVIDIA GPU を含む NVIDIA ハードウェアのリモート アクセス バージョンです。

DGX AIシステムはChatGPTが最初にトレーニングに使用したハードウェアであるため、NVIDIAは独自の生成AIモデルを構築したい組織にとって最適な選択肢です。ChatGPTのトレーニングでは、Microsoftは必要なパワーを得るために数万個のNVIDIA A100グラフィックチップを連携させました。そして今、NVIDIAはこのプロセスを大幅に簡素化し、AIトレーニングをサービスとして提供することを目指しています。

NVIDIA によれば、DGX Cloud の既存顧客には、自然言語処理や AI チャットボットを使用している製薬会社、製造会社、金融機関などが含まれる。

DGX Cloud に関心のある組織は、登録を申請できます。

参照: ChatGPT が Android アプリとして利用可能になりました (TechRepublic)。

NVIDIA DGX Cloud for AI プラットフォームが機能する仕組みは何ですか?

DGX Cloud for AI プラットフォームの成功の鍵となるのは、相互接続されたシステムのクラスター全体にワークロードを拡張し、複数のインスタンスがまるで 1 つの GPU の一部であるかのように動作できるようにする、高性能で低レイテンシのファブリックです。

1インスタンスあたり月額36,999ドルのサブスクリプション料金で、組織は8基のNVIDIA 80GB Tensor Core GPU(ノードあたり640GBのGPUメモリ、スーパーコンピュータアレイ)のスペースをレンタルできます。これらのスペースはすべてウェブブラウザからアクセスできます。お客様は、NVIDIA Base Command Platformソフトウェアダッシュボードを通じて、トレーニングワークロードを管理および監視できます。

「DGX Cloud ユーザー インターフェイス (NVIDIA Base Command Platform) により、企業は基盤となるインフラストラクチャを気にすることなく、モデル開発を迅速に実行および管理できます」と、NVIDIA の DGX プラットフォーム担当シニア ディレクターの Tony Paikeday 氏は、TechRepublic への電子メールで述べています。

そこから、組織はプラットフォームのソフトウェア部分であるNVIDIA AI Enterpriseを利用できます。100を超えるエンドツーエンドのAIフレームワークと事前トレーニング済みモデルのライブラリが提供され、実稼働AIの開発と展開が比較的容易になります。

ペイクデイ氏は、すでに DGX Cloud を使用している顧客がこれを選択しているのは、通常、従来のコンピューティングでは専用リソースがそれほど多く提供されないためだと指摘した。

顧客が求めているのは「単一の巨大なスーパーコンピュータとして動作する多数の共存コンピューティングインスタンス上で、これらの非常に大規模なワークロードを並列化できるコンピューティングスケールとネットワークファブリックインターコネクト」だ、と同氏は述べた。

AIコンピューティングへのアクセスがどのように変化しているか

生成AIの普及に伴い、組織はAIの活用方法の変化への要求に応えています。GPT-4のような公開学習済みの強力なAIから、組織が独自のデータを使用して独自のユースケースを開発できるプライベートインスタンスへと変化しています。必要とされる強力なコンピューティングパワーへのアクセスも、それに応じて変化していくでしょう。

「NVIDIA DGX Cloud が利用可能になったことで、ほぼ瞬時にアクセスできる AI スーパーコンピューティング リソースの新たなプールが提供されます」と、Moor Insights & Strategy のチーフアナリスト、パット ムーアヘッド氏は NVIDIA のプレスリリースで述べています。

「生成AIにより、あらゆる業界の大手企業にとってAIの急速な導入がビジネス上の必須事項となり、多くの企業がより高速なコンピューティング・インフラストラクチャを求めるようになりました」と彼は述べた。

「AIは今、iPhone時代を迎えています。スタートアップ企業は破壊的な製品やビジネスモデルの構築に競い合い、既存企業はそれに応えようとしています」と、NVIDIAの創業者兼CEOであるジェンスン・フアンは3月の最初の発表時に述べました。「DGX Cloudは、お客様がグローバル規模のクラウド上でNVIDIAのAIスーパーコンピューティングに瞬時にアクセスできるようにします。」

Tagged: