NVIDIA、GPUに対する初のRowhammer攻撃のデモに反応

NVIDIA、GPUに対する初のRowhammer攻撃のデモに反応
シリコンバレーの同社のキャンパス内にあるオフィスビルの正面に表示されている NVIDIA のロゴとシンボル。
画像: Sundry Photography/Adobe Stock

学術研究者らが、Rowhammer型のメモリエクスプロイトをグラフィックス・プロセッシング・ユニット(GPU)に持ち込む新たな攻撃手法「GPUHammer」を発表し、NVIDIAのRTX A6000グラフィックスカードでその実演に成功しました。このエクスプロイトはDRAMのメモリ脆弱性を標的としており、GPUメモリに影響を与えるRowhammer攻撃の初めての事例となります。

先週、トロント大学の研究チームがこの攻撃を公開し、「GPUHammerはGPUに対する最初のRowhammer攻撃である」と査読済みの研究で確認しました。この種の攻撃は、データが保存されているDRAMチップモジュールの物理的な脆弱性を悪用し、ハッカーがメモリに保存されたデータを改ざんまたは破壊することを可能にします。

NVIDIA GPUを標的としたデモを受けて、NVIDIAはNVIDIA RTX A6000 GPUラインの顧客に対し、緩和戦略を推奨しました。攻撃デモで使用されたGPU、GDDR6メモリ搭載のNVIDIA A6000 GPUは、その高性能コンピューティング能力で知られています。

ロウハンマー型攻撃の新時代

歴史的に、Rowhammer スタイルの攻撃は CPU メモリに重点を置いてきましたが、GPU ベースのメモリ破損の影響は、特に AI や共有クラウド環境において深刻です。

研究者らによると、RowhammerはDRAMの物理構造を悪用し、単一のメモリ行を繰り返しアクティブ化することで電荷リークを引き起こし、隣接するメモリ行のビット反転を引き起こす。GPUHammerはこの原理をグラフィックスメモリに適用し、GPUで処理される重要なワークロードの整合性を損なう。

この攻撃の成功は、かつては CPU に限定されていた DRAM の脆弱性が、マルチテナント環境やクラウドベースの AI トレーニング パイプラインでよく使用される GPU ベースのシステムにリスクをもたらす可能性があることを示唆しています。

長年にわたる防御研究は CPU 攻撃に重点が置かれてきましたが、GPU の脆弱性はそれほど脅威ではないと考えられてきました。しかし、露出したメモリ整合性に対する攻撃により、悪意のある攻撃者が他のユーザーの GPU データを妨害できる可能性があります。

NVIDIAがGPUHammerデモに反応

NVIDIAは、これらの調査結果を受けて、予防措置としてシステムレベルでエラー訂正コード(ECC)を有効にすることを推奨する顧客向けアドバイザリを発行しました。NVIDIAは、「RowHammer攻撃による悪用リスクは、DRAMデバイス、プラットフォーム、設計仕様、およびシステム設定によって異なります」と述べています。

ECCを有効にするには、NVIDIAはユーザーに「nvidia-smi -e 1」コマンドの実行を推奨しています。ECCステータスは「nvidia-smi -q | grep ECC」で確認できます。これらの手順はフリップ攻撃の防止を目的としていますが、研究者らはGPUHammerがターゲット行のリフレッシュなどの既存の緩和策を回避できることを発見しました。

AIの完全性に対する脅威

GPUHammerはハードウェアレベルで動作しますが、AIシステムへの影響は広範囲に及ぶ可能性があります。研究者たちは、1ビットの反転だけでディープニューラルネットワークモデルの精度を80%から0.1%に低下させるのに十分であることを示しました。

AI モデルは並列処理やその他の計算負荷の高いタスクを実行するために GPU に大きく依存するようになっているため、GPU レベルの障害に対する攻撃は AI モデルの整合性に大きな影響を与える可能性があります。

クラウドMLプラットフォームなどの共有GPU環境において、悪意のあるユーザーはGPUHammerを利用して隣接するワークロードに密かに干渉する可能性があります。こうした攻撃は、被害者のコードやデータに直接アクセスすることなく、AIモデルのパラメータを破壊したり、干渉の精度を低下させたりする可能性があります。

さらに、低レベルのメモリ破損に対する深刻な脅威は、自律システム、エッジ AI、およびサイレント障害が検出されない可能性があるその他の領域に深刻な影響を及ぼします。

GPUHammerのようなリスクを軽減する方法

研究者らは、組織に対し、ハードウェアセキュリティ体制を見直し、既存のセキュリティフレームワークにGPUメモリの整合性チェックを組み込むよう強く求めています。AIワークロードにおけるGPUへの依存度が高まっていることを考えると、メモリの分離を確保し、物理メモリの保護を強化することが、将来のRowhammer型エクスプロイトを防ぐ鍵となります。

今週北京万博でNVIDIA CEOのジェンスン・フアン氏が中国のAIの軌跡について語った内容を見逃しましたか?中国のAIの勢いと地政学的影響に関するフアン氏の見解をまとめた記事をご覧ください。

Tagged: