Google DeepMind、超知能モデルを監視するAI「モニター」を提案

Google DeepMind、超知能モデルを監視するAI「モニター」を提案

トピック — 人工知能

出版

メーガン・クラウスの画像

DeepMindのAGIの安全性とセキュリティに対するアプローチでは、脅威を4つのカテゴリーに分類しています。解決策の一つとして、「モニター」AIが考えられます。

Google DeepMindは、最先端の生成AIのセキュリティを確保するための新たなアプローチを導入し、4月2日に論文を発表しました。DeepMindは、4つの主要なリスク領域のうち、「誤用、不整合、ミス、構造的リスク」の2つに焦点を当てました。

DeepMindは、現在の最先端のAIの先を行く、人間レベルの知能を備えた汎用人工知能(AGI)を目指しています。AGIは、医療などの産業に革命をもたらしたり、技術的な混乱を引き起こしたりする可能性があります。しかし、そのような規模のAGIが本当に実現するかどうかについては、懐疑的な見方もあります。

人間のようなAGIが間近に迫っており、備えなければならないと主張するのは、2015年に同様のミッションステートメントを掲げてスタートしたOpenAIと同じくらい古い誇大宣伝戦略です。超知能AIに対するパニックは正当化されないかもしれませんが、DeepMindのような研究は、生成AIのためのより広範で多角的なサイバーセキュリティ戦略に貢献します。

悪意のある人物による生成AIの悪用を防ぐ

誤用とミスアラインメントは、意図的に発生する2つのリスク要因です。誤用は悪意のある人間の脅威主体が関与し、ミスアラインメントはAIが敵対者となるような方法で指示に従うシナリオを指します。「ミス」(意図しないエラー)と「構造的リスク」(単一の主体がいないにもかかわらず、おそらく相反するインセンティブから生じる問題)が、この4つの要素からなるフレームワークを完成させます。

誤用に対処するために、DeepMind は次の戦略を提案しています。

  • 高度なAIシステムのモデルの重みを固定する
  • 脆弱な領域を特定するための脅威モデリング研究の実施
  • 高度なAIに合わせたサイバーセキュリティ評価フレームワークの構築
  • その他の未指定の緩和策の検討

DeepMindは、ディープフェイクからフィッシング詐欺に至るまで、今日の生成AIの悪用が横行していることを認めています。また、誤情報の拡散、世論操作、そして「意図しない社会的影響」といった懸念事項は、AGIが現実のものとなった場合、大幅に拡大する可能性があると指摘しています。

参照:OpenAIは今週、評価額3000億ドルで400億ドルを調達したが、資金の一部は組織が営利企業になることを条件としている。   

生成AIが勝手に不要な行動を取るのを防ぐ

AIがユーザーから真の意図を隠したり、タスクの一環としてセキュリティ対策を回避したりする場合、ミスアライメントが発生する可能性があります。DeepMindは、「増幅された監視」(AIの出力を本来の目的と照らし合わせてテストすること)によって、こうしたリスクを軽減できる可能性があると示唆しています。しかしながら、これを実装するのは容易ではありません。AIはどのような状況を想定して訓練すべきでしょうか?DeepMindは現在もこの問いを探求中です。

一つの提案は、「モニター」と呼ばれる、DeepMindの目標に沿わない行動を検出するように訓練された別のAIシステムを導入することです。生成AIの複雑さを考えると、このようなモニターは、許容できる行動を識別し、疑わしい行動を人間による確認のためにエスカレーションするために、精密な訓練が必要になります。

記事をシェア

こちらもご覧ください

  • ITリーダーのための汎用人工知能ガイド
  • 汎用人工知能とは:2025年初心者向けガイド
  • サム・アルトマンのAGI予測は、機械が早ければ2025年には人間のように考えるようになると大胆に主張している
  • 人工知能:さらに読むべき記事
メーガン・クラウスの画像

ミーガン・クラウス

メーガン・クラウスは、B2Bニュースおよび特集記事の執筆で10年の経験を有し、Manufacturing.netのライター、そして後に編集者として活躍しました。彼女のニュース記事や特集記事は、Military & Aerospace Electronics、Fierce Wireless、TechRepublic、eWeekに掲載されています。また、Security Intelligenceではサイバーセキュリティに関するニュースや特集記事の編集も担当しました。フェアリー・ディキンソン大学で英文学の学位を取得し、クリエイティブライティングを副専攻しました。

Tagged: