
Googleの人工知能への注力は、I/O 2023カンファレンスで中心的な位置を占めました。学習言語モデル「PaLM 2」と、Bard、検索、マップ、Workspaceなどの製品に対するAIベースの改良が発表されました。火曜日、この検索大手は多くの主要製品における新機能のデモを行いました。これらはすべて、成長を続けるAIトレンドを活かすために設計されたものです。
ジャンプ先:
- PaLM 2 大規模言語モデル
- 吟遊詩人のAIの改良
- Google検索の機能強化
- Google Workspace の機能強化
- 地図と写真の改善
- 新しい機能にアクセスする方法と場所
PaLM 2 大規模言語モデル
新製品および改良版の原動力となるのは、Googleの最も先進的なAIプラットフォームとなるよう設計された新たな大規模言語モデル、PaLM 2(Pathways Language Modelの略)です。幅広いタスクに対応できるよう構築されたPaLM 2は、25種類のGoogle製品およびサービスの開発を支えるAIエンジンとなります。GoogleはPaLM 2の詳細を多く明らかにしていませんが、このモデルは100以上の言語に対応し、それらの言語間で翻訳が可能であると謳っています。
PaLM 2 LLMは、Google Cloudの顧客による医療分野のテストに既に投入されており、派生プラットフォームであるMed-PaLM 2は、医師やその他の医療専門家からの質問に答えることになります。Googleは、PaLM 2を医療分野に展開するだけでなく、セキュリティ、数学、コンピューターコーディングなどの分野でもLLMが活用されることを強くアピールしました。例えば、このAIは写真やその他のファイルに透かしを入れ、本物と偽物を区別できるようになります。
参照:人工知能倫理ポリシー(TechRepublic Premium)
吟遊詩人のAIの改良
今年2月にリリースされたGoogleのBard AIは、OpenAIのChatGPTやMicrosoftのBing AIの代替およびライバルとして設計されました。しかし、競合製品と比較して性能不足や未開発の印象が強く、賛否両論の評価を受けています。現在、GoogleはBardをよりスマートで高性能なものへと再設計しています。
まず、GoogleはBardのウェイティングリストを削除し、米国と英国の早期導入者のみを対象としていたサービスを180以上の国と地域のすべてのユーザーに拡大しました。Bardは現在、英語に加えて日本語と韓国語でも利用可能で、今後は合計40言語に対応する予定です。
第二に、BardはPaLM 2を搭載するようになり、特に数学、推論、プログラミングの分野において、幅広いタスクに対応できるようになります。Googleによると、Bardは20以上のプログラミング言語でコードを生成・デバッグできるようになります。さらに、このAIは生成されたコードがどのように、そしてなぜ使用されているのかを説明することで、ユーザーの理解を支援します。I/O 2023で披露された一例として、GoogleはBardがPython言語を用いて特定のチェスの一手をプログラムする方法を実演しました。
Googleは、BardがGoogleやサードパーティの他のツールやサービスとどのように連携するかについても説明しました。ユーザーはBardにメールや文書の作成を依頼し、その内容をGmailやGoogleドキュメントに直接エクスポートできます。また、BardはGoogle Lensとも連携し、ユーザーはAIに画像をアップロードして分析し、キャプションやその他のコンテンツの作成を依頼できます。
Bardは、回答に画像、表、その他の書式を表示することで、より視覚的なスタイルを採用します。ユーザーは、回答で言及されている特定の場所やランドマークをBardに正確に特定するよう指示すると、AIがGoogleマップ上でその場所を表示します。回答の一部として表が作成された場合、ユーザーはその表をGoogleスプレッドシートなどのプログラムに移動して、書式を維持できます。
さらに、Bardはサポートされている拡張機能を介してサードパーティの製品、アプリ、サービスと通信できるようになります。例えば、BardはAdobe Firefly画像ジェネレーターを使用して画像を作成できます。
Google検索の機能強化
Googleのコア検索ページも、PaLM 2によるAI強化の恩恵を受けます。新しい検索ページでは、AIベースの情報が通常の検索結果に統合されます。ユーザーが重要な詳細に集中できるよう、検索結果は単一のスナップショットにまとめられます。スナップショットには、ユーザーがより詳細な情報にドリルダウンするためのポインターとリンクが含まれます。
Googleによると、新しい検索はより効率的なものになるよう設計されているとのことです。ユーザーは、検索クエリのフレーズをどう表現するかを考えたり、複数の質問に分解したりする代わりに、より複雑で詳細なクエリを入力できるようになります。これにより、Google検索はクエリをより適切に解析し、より正確な結果をすぐに提供できるようになります。
場合によっては、検索機能によってユーザーに追加の質問を促したり、ユーザーが尋ねそうな質問を表示したりすることがあります。質問を選択すると会話モードに移行し、検索ツールとチャットして必要な情報を絞り込むことができます。
Google Workspace の機能強化
Google Workspaceも、PaLM 2を通じてAIが組み込まれる製品の一つです。GmailとGoogle Appsで利用できる新機能「Help Me Write」は、リクエストや説明に基づいてメールやその他のコンテンツを自動作成します。このオプションは6月に先行テスター向けに提供開始され、その後、今年後半に「Duet AI for Workspace」という新しいAI機能の一部としてビジネスユーザー向けに展開される予定です。
AIをより良く活用することを支援するツールの一つがSidekickです。AIと連携する際に、適切なリクエスト(プロンプト)を書くのは難しい場合があります。適切な種類のプロンプトは、応答に大きな違いをもたらす可能性があります。この点を支援するために、Sidekickはドキュメントを分析・要約し、ユーザーがコンテンツを改善するために送信したいプロンプトを提案します。I/O 2023で示された例として、SidekickはGoogleスライドのプレゼンテーションにスピーカーノートを追加することを提案しました。
地図と写真の改善
マップは世界中の場所のルート案内や情報を提供するだけでなく、AIの活用も期待できます。マップは、ルートの没入型ビューという新しいオプションを導入します。ユーザーが徒歩、車、自転車でルートを計画している場合、没入型ビューはルートの始点から終点までを視覚的に表示し、途中で天気予報や交通情報も提供します。このオプションは夏にかけて展開され、ニューヨークやサンフランシスコを含むいくつかの主要都市でサポートされる予定です。
Googleフォトは、マジックエディターと呼ばれるツールによってAIを活用した強化が進む、新たなサービスです。写真内のアイテムを消すことができる既存のマジック消しゴムツールを拡張したマジックエディターは、さらに一歩進んでいます。単に消すだけでなく、写真内の人物やオブジェクトを実際に移動させることも可能です。また、ユーザーが写真の端にあるオブジェクトを中央に近づけると、マジックエディターはAIを活用して、欠けている部分を補います。
AIは、I/O 2023で発表される他の製品、例えば新型Pixel 7a、Pixel Fold、Pixel Tabletにも活用されます。デバイスをパーソナライズするために、ユーザーはAIに送るプロンプトに基づいて独自の壁紙を作成できます。
新しい機能にアクセスする方法と場所
では、Googleの新しいAIベースの製品やサービスはどのように活用できるのでしょうか?これらの機能のほとんどは正式には数ヶ月先になりますが、一足先に試してみたい方はGoogle Labsから試すことができます。Labsの早期テスターに登録すると、新しい検索機能と新しいGoogle Workspaceに加え、AIベースのメモツール「Project Tailwind」と、テキストを音楽に変換するツール「MusicLM」という2つのツールを試すことができます。