
OpenAI は現在、専用の仮想コンピューターを使用して複数ステップのタスクを自律的に完了できる ChatGPT エージェントを提供しています。
AIエージェントは、企業が究極のAIアシスタントの開発に競い合う中で、今注目の技術です。エージェントは、ユーザーに代わってレストランの予約をするなど、現実世界でのやり取りをより便利にするために、複数のステップからなるタスクを自律的に実行します。
OpenAIの新しいエージェントは、ChatGPT Proユーザーから段階的に展開されます。PlusおよびTeamプランでは、今後数日中にオプションとして利用可能になります。OpenAIは、今後数週間以内にChatGPTエージェントをEnterpriseおよびEducationプランにも展開する予定です。
Pro ユーザーには毎月 400 件のエージェント メッセージの割り当てが与えられ、その他のユーザーには 40 件のメッセージの割り当てがあり、追加の使用量を購入することもできます。
ChatGPT エージェントを使用するには、ユーザーはドロップダウン メニューから「エージェント モード」を選択する必要があります。
ChatGPTエージェントは、オペレーターエージェントとその他の最先端の機能の進化形です。
ChatGPTエージェントのアイデアの一部は、同社が今年初めにリリースしたOperatorエージェントから生まれたものだと、OpenAIのCEOサム・アルトマン氏は本日のChatGPTエージェント紹介ビデオで述べた。このエージェントには、ChatGPTのディープラーニング機能と、チャットボットの伝統的な自然言語処理技術も組み込まれている。
「人々が本当に望んでいたのは、これらの機能とそれ以上のものを統合することだということが明らかになりました」とアルトマン氏は語った。「人々が求めていたのは、独立したコンピューターを使って、現実の複雑なタスクを代わりに実行してくれる統合エージェントでした。何かを考え、行動を起こし、様々なツールを使い、端末を使い、ウェブ上でクリックし、さらにはスプレッドシートやスライドなどを作成するといった作業まで、シームレスに移行できるエージェントだったのです。」
ChatGPT エージェントは職場で何ができるのでしょうか?
これらすべての機能を統合するために、OpenAIは新しいモデルを訓練しました。このモデルは以下のことが可能になります。
- ウェブサイトをクリックすると、テキストベースとビジュアルベースの両方のブラウザを通じて解釈されます。
- ターミナルを使用してコードを実行します。
- 直接 API アクセスを使用します。
- ChatGPT コネクタを使用して、Gmail や GitHub などのアプリに接続します。
ChatGPTエージェントは、タスク中にユーザーがリクエストの内容を変更するために割り込んだ場合、適応します。また、プロセス中に明確化が必要な場合、エージェントはユーザーに詳細情報を尋ねます。
OpenAIは、ChatGPTエージェントが職場の様々なタスクに使用されることを想定しています。例えば、会議の設定、スクリーンショットに基づいたプレゼンテーションの作成、スプレッドシートの更新などが可能です。ChatGPTエージェントのようにある程度の自律性を持つ他のAIエージェントと同様に、ChatGPTエージェントはクリック操作を大幅に削減できる可能性があります。
TechnologyAdviceの主任ライター、グラント・ハーベイ氏は本日のNeuronニュースレターで次のように述べています。「 スプレッドシートのタスクでは、Excel Copilotの20%に対して 45.5%のスコアを獲得しました。これは残念なことです。OpenAIの自由をめぐる交渉の場 で、Microsoftはこれを快く思わないでしょう 。」
代理店が増えるとセキュリティ上の考慮事項も増える
AI エージェントは、多くの場合、ID 情報や支払い情報を自動入力するため、新たなプライバシーの問題を引き起こします。
あるデモでは、エージェントが事業主のステッカー500枚の注文を支援し、数量と支払いを安全に確認します。ユーザーは商品をプレビューする必要はありません。さらに、エージェントはOpenAIが「結果的」と呼ぶアクションを実行する前に確認を求めます。OpenAIは、ChatGPTエージェントで使用するために、Operatorの研究プレビューで使用されていたものと同じプライバシー制御を強化したと述べています。
OpenAIはまた、プロンプト・インジェクションがAIエージェントに対して使用される場合、特に危険となる可能性があると指摘しています。これを受けて、同社はエージェントにプロンプト・インジェクションの兆候を察知する訓練を行いました。
AIにメール送信などの特定のタスクを実行させると、監視モードが起動します。このモードでは、ユーザーはエージェントを監視する必要があります。このモデルは、Webとのやり取り時にパスワードを保存しません。
OpenAIは、このモデルを生物兵器や化学兵器の製造に利用することに対する安全対策も強化しました。このテーマに関して厳格な安全対策を実装しましたが、このモデルがアマチュアによるそのような兵器の製造に役立つという証拠はないと述べています。
その他の人工知能関連のニュースでは、Scale AI が Meta との契約に伴い約 200 人の従業員と 500 人の契約社員を解雇した。
編集者注: この記事は 7 月 17 日に最初に公開されました。