マイクロソフトがBing ChatをAIパーソナルアシスタントに変える可能性

マイクロソフトがBing ChatをAIパーソナルアシスタントに変える可能性
OpenAI のロゴが入った青い背景に、Microsoft Bing がインストールされているスマートフォンを持っている影の手。
画像: gguy/Adobe Stock

Microsoftについて知っておくべきことが一つあるとすれば、それはMicrosoftがプラットフォーム企業であるということです。オペレーティングシステムや開発者ツールから、生産性向上スイートやサービス、そしてグローバルクラウドに至るまで、誰もが利用できるツールとサービスを提供するために存在しています。ですから、レドモンドの発表で「製品からプラットフォームへの移行」という言葉が使われても、驚くべきことではありません。

最新の発表は、Bingの新しいGPTベースのチャットサービスに関するものでした。検索に人工知能を組み込むことで、BingはBingインデックスとOpenAIのGPT-4テキスト生成・要約技術を基盤とした会話型検索環境を提供できるようになりました。

ページやコンテンツのリストを順に確認する代わりに、クエリには関連リンクを含む簡潔なテキストサマリーが表示され、Bingのチャットツールを使って回答を絞り込むことができます。このアプローチにより、Bingは当初のマーケティングポイントの一つ、つまりコンテンツの検索だけでなく意思決定を支援するという点に立ち返りました。

参照: TechRepublic Premium のこのテンプレートを使用して、ビジネスに人工知能倫理ポリシーを確立します。

ChatGPTは最近、より特化したサービスへと拡張するプラグインを追加しました。MicrosoftはBingにAIを追加するという進化的なアプローチの一環として、まもなく同様の機能を追加する予定です。しかし、1つ疑問が残ります。それは、どのように機能するのかということです。幸いなことに、Microsoftの数多くのオープンソースプロジェクトの1つに、その大きな手がかりがあります。

ジャンプ先:

  • セマンティックカーネル: Microsoft が GPT を拡張する方法
  • GPTに意味記憶を与える
  • Bing Chatのスキルを身につける

セマンティックカーネル: Microsoft が GPT を拡張する方法

Microsoftは、Azure OpenAI GPTサービスと連携するためのツールセット「Semantic Kernel」を開発しています。これは、モデルに独自の埋め込みを追加することで、初期のトレーニングセットを超えるカスタムGPTベースのアプリケーションを提供できるように設計されています。同時に、これらの新しいセマンティック関数を従来のコードでラップすることで、入力の調整、プロンプトの管理、出力のフィルタリングとフォーマットといっ​​たAIスキルを構築できます。

Bing の AI プラグイン モデルの詳細は、5 月末の Microsoft の BUILD 開発者会議まで公開されませんが、Semantic Kernel AI スキル モデルに基づくものになる可能性があります。

OpenAI のアプリケーション プログラミング インターフェースと連携して動作するように設計されており、プロンプト間のコンテキストを管理したり、カスタマイズを提供するために独自のデータ ソースを追加したり、入力と出力をコードにリンクして出力の調整やフォーマットを行ったり、他のサービスにリンクしたりするために必要なツールを開発者に提供します。

Bing を利用して消費者向け AI 製品を構築することは、非常に理にかなった選択でした。基盤となる技術を詳しく見ていくと、GPT の AI サービスと Bing の検索エンジンはどちらも、比較的理解が進んでいない技術、つまりベクターデータベースを活用していることがわかります。ベクターデータベースは GPT のトランスフォーマーに「セマンティックメモリ」と呼ばれる機能を提供し、プロンプトと生成 AI との関連性を見つけるのに役立ちます。

ベクターデータベースは、データの複雑さに応じて次元数が異なる空間にコンテンツを保存します。データをテーブルに保存する代わりに、「埋め込み」と呼ばれるプロセスによって、データベース空間内で長さと方向を持つベクターにデータをマッピングします。これにより、テキストでも画像でも、類似コンテンツを簡単に見つけることができます。コードで実行する必要があるのは、最初のクエリと同じサイズと方向を持つベクターを見つけることだけです。高速で、検索にある種のセレンディピティ(偶然の発見)をもたらします。

GPTに意味記憶を与える

GPTはベクターを使用してプロンプトを拡張し、入力内容に類似したテキストを生成します。Bingはベクターを使用して情報をグループ化し、類似するウェブページを検索することで、探している情報をより早く見つけられるようにします。埋め込みデータソースをGPTチャットサービスに追加すると、GPTチャットサービスがプロンプトに応答するために必要な情報が提供され、その情報はテキストで返されます。

Bing のデータと併せて埋め込みを使用する利点の一つは、独自の長いテキストをサービスに追加できることです。例えば、組織内のドキュメントを扱う場合などです。重要なドキュメントのベクター埋め込みをクエリの一部として提供することで、例えば検索とチャットを利用して、検索からのデータや、環境に追加した他の Bing プラグインのデータを含む、よく使われるドキュメントを作成できます。

Bing Chatのスキルを身につける

最新のBingリリースでは、公開されているセマンティックカーネルに似た機能が動作している兆候が見られます。GPTで生成・処理されたデータをグラフや表に変換し、結果を視覚化する機能が追加されています。値のリストを返すGPTプロンプトを提供することで、後処理コードはテキスト出力を迅速にグラフィックに変換できます。

Bing は汎用検索エンジンであるため、より専門的なデータソースにリンクする新しいスキルを追加することで、より専門的な検索(例:医療論文のリポジトリの操作)が可能になります。また、スキルによって Bing の検索結果を外部サービスに接続できるようになるため、特別な機会にぴったりのレストランを探し、その後、選択した会場を予約するといった一連のチャットインタラクションを容易に想像できます。しかも、検索を中断することなく、すべて完了します。

GPT-4 とのプライベートおよびパブリックのやり取りのためのフレームワークを提供し、セッション間の永続性のサポートを追加することで、従来の検索アプリケーションよりもはるかに自然なフレームワークが実現します。

このモデルを他のデータソースやサービスに拡張するプラグインがあれば、マイクロソフトが10年以上前から約束してきた自然言語駆動型コンピューティング環境を実現できる余地が生まれます。また、これをプラットフォーム化することで、マイクロソフトが提供するツールに依存することなく、必要なツールを独自に構築できるオープンな環境を維持しています。

Microsoftは、GitHubのGPTベースツールからMicrosoft 365とPower Platformの新機能に至るまで、AIベースのアシスタントすべてにCopilotブランドを使用しています。願わくば、Microsoftが今後も多くのプラットフォームでGPTを同じように拡張し続けてくれることを期待しています。そうすれば、私たちはBingだけでなく、同じプログラミングモデルを使って、従来のコードと生成AIプロンプト、そしてセマ​​ンティックメモリの間の溝を越え、プラグインを他のプラットフォームにも展開できるようになるでしょう。

Tagged: