NVIDIA GTC 2024: トップ5のトレンド

NVIDIA GTC 2024: トップ5のトレンド

NVIDIAは、ゲーム向けグラフィックスカードに特化していた時代から大きく進歩しました。NVIDIA GPUは現在、エンタープライズ向け生成AIを支える大きな力となっています。3月18日から21日までカリフォルニア州サンノゼで開催されたNVIDIA GTC 2024では、チャットボットからアートインスタレーションまで、あらゆる場面で生成AIが目立ちました。今年のNVIDIA GTCで目にした主要なテクノロジトレンド、つまりプレゼンテーションのトピック、NVIDIA CEOジェンスン・フアン氏による基調講演やプレスQ&A、そして展示会場で繰り返し取り上げられたテクノロジをいくつかご紹介します。

検索拡張生成

AIの「幻覚」や不正確さを削減する技術として謳われている検索拡張生成(RAG)は、生成AIモデルが自身の成果を研究論文や記事などの外部リソースと比較することを可能にします。RAGは、生成されるコンテンツの信頼性を高めるため、エンタープライズ顧客にとって魅力的です。

参照:NVIDIA CEO のジェンスン・フアン氏がカンファレンスの基調講演で、今後発売される Blackwell アーキテクチャ GPU などについて発表しました。(TechRepublic)

たとえば、Lenovo は NVIDIA が新たに発表した RAG を備えた NeMo フレームワークを早期に導入しており、Lenovo デバイスを使用する顧客向けに AI エコシステムを構築するためにこれを使用しています。

増大するストレージとコンピューティングのニーズに対応する「AI工場」

NVIDIA GTC に参加した多くの組織は、企業がプライベート AI を作成するために必要なストレージとコンピューティング能力へのアクセスを提供する「AI ファクトリー」としての地位を確立しました。

AIファクトリーサービスを「GPUaaS」と呼んでいるNexGen Cloudは、今年後半にNVIDIAの10兆パラメータのBlackwell GPU(図A )へのアクセスを提供する予定の企業の1つです。

Blackwell プラットフォームと Blackwell アーキテクチャ GPU は、NVIDIA GTC 2024 における多くのイノベーションの基盤となっていました。
図A: BlackwellプラットフォームとBlackwellアーキテクチャGPUは、NVIDIA GTC 2024における多くのイノベーションの背後にありました。画像: NVIDIA

10 兆個のパラメータのジョブには大量の計算が必要であり、組織は顧客に適切な量の計算能力を提供することでビジネス モデルを構築できると考えています。

「こうしたモデルがどんどん大きくなり、指数関数的に成長し続けるにつれ、大規模なモデルをトレーニングし、微調整し、推論を提供するために必要なインフラストラクチャも、その問題を解決するために成長し続ける必要があります」と、Google Cloud のコンピューティングおよび AI/ML インフラストラクチャ担当副社長兼ゼネラルマネージャーであるマーク ローメイヤー氏は、NVIDIA GTC 2024 での TechRepublic とのインタビューで述べています。

デルのデータ管理製品管理担当シニアバイスプレジデント、グレッグ・フィンドレン氏は3月15日の事前説明会で、「ストレージは、ドキュメント、画像、動画といった非構造化データだけでなく、高性能な構造化データもサポートする必要がある」と述べた。顧客はまた、利用可能なハードウェアを自社のプロセスがどのように利用しているかを管理したいと考えている。「アイドル状態のGPUを抱えているのは誰も望んでいない」とフィンドレン氏は述べた。

デルのインフラストラクチャおよび通信マーケティング担当上級副社長であるヴァルン・チャブラ氏は事前説明会で、NVIDIA 製品の協力とサポートを受けて開発された Dell AI ファクトリーは、「広大な可能性」を「影響力のあるユースケース」に絞り込むことを目的としていると述べた。

2024 年 3 月に公開されたガートナーの調査によると、2023 年 10 月から 12 月に調査対象となった 459 社のテクノロジー サービス プロバイダーのうち 83% が、組織内で生成 AI を導入済みまたは試験運用中でした。

エッジAI

エッジ AI に注力する組織は、ロボット工学、自動車、産業、倉庫、医療、重要なシステム、小売など、さまざまなユースケースを取り上げ、NVIDIA GTC 2024 の展示フロアの大部分を占めました。

これらのエッジ AI ユースケースの多くは、NVIDIA のロボティクス向け Jetson プラットフォームによって実現されています。Jetson Orin 上の NVIDIA Metropolis マイクロサービスにより、開発者は API 呼び出しを使用してエッジで生成 AI 機能を構築できるため、ロボットは環境に対してより柔軟かつ迅速に対応できるようになります。

たとえば、基調講演では、NVIDIA CEO の Jensen Huang 氏が、障害物を自動的に迂回する倉庫ロボットのデモンストレーションを披露しました (図 B )。

ロボットと AI エージェントは、NVIDIA ソフトウェア (Omniverse、Metropolis、Isaac、cuOpt) を組み合わせて使用​​し、シミュレートされた産業空間でトレーニングされます。
図B:ロボットとAIエージェントは、NVIDIAソフトウェア(Omniverse、Metropolis、Isaac、cuOpt)を組み合わせて、模擬産業空間でトレーニングされています。画像:NVIDIA

「AI自体は新しいものではありませんが、生成AIをめぐる議論は多くの人にとってこのトピックを再び活気づけています」とチャブラ氏はTechRepublicへのメールで述べています。「私たちは長年、エッジでのAI推論に取り組んでおり、データサイエンティストはDell Precisionワークステーションなどのエンドポイントを使用してAIモデリングや概念実証を行っています。」

企業向けプライベートAI

組織は、ChatGPT のようなパブリック AI の柔軟性を提供しながら、独自のデータに安全にアクセス可能なプライベート生成 AI の立ち上げに取り組んでいます。

展示フロアでプライベート AI サービスの一般的な名前は、顧客が独自のサーバーでホストできるオープンソースの大規模言語モデルを提供する Mistral AI でした。

副操縦士

コパイロットは新しいものではありません。ChatGPTのようなチャットボットが生成型AIブームの火付け役となったのです。それ以来、「コパイロット」はデータに関する質問に答えられるチャットボットのほぼ総称となりました。

副操縦士は会社所有のデータから情報を得ることができる

NVIDIA GTCでは、企業が保有する特定の構造化データと非構造化データから答えを導き出すことができる幅広いコパイロットAIを視察しました。例えば、SoftServe Gen AI Industrial Copilotは、ロボットアームのメンテナンスマニュアルを読み取り、修理手順を段階的に作成し、技術者が交換する必要がある部品を3Dモデル上でハイライト表示します。

引用により人間がAIの回答をチェックできる

エンタープライズ向けコパイロットにおけるもう一つの一般的なトレンドは、引用です。NexGen Cloudは、SoftServeが開発し、NVIDIA GPUで高速化されたHyperstackクラウドプラットフォームを用いて、動画に基づいて質問に答え、動画のトランスクリプト内のAIが回答の元となった特定の瞬間を指摘するコパイロットを実行する方法を示しました。独自のプライベートデータソースとコパイロット型のチャットボット機能の組み合わせは、エンタープライズ向け生成AIの牽引力であり続けています。

免責事項: NVIDIA は、3 月 18 日から 21 日までカリフォルニア州サンノゼで開催された NVIDIA GTC イベントの航空運賃、宿泊費、一部の食費を負担しました。

Tagged: