Google は、選ばれた研究者に高性能の Deep Think AI をリリースし、高度な推論テストと複雑な数学タスクの将来の最適化をサポートします。

Google DeepMindチームによるマルチエージェントAIモデル「Deep Think」が、Geminiアプリで利用可能になりました。これは、国際数学オリンピック(IMO)2025でゴールドスタンダードを獲得したモデルのより使いやすいバージョンですが、一部の学者や研究者にはフル機能バージョンも提供されています。
異なるユーザーグループ向けの二重展開
8月1日より、Google AI Ultraの有効なサブスクリプションをお持ちのユーザーは、追加料金なしでDeep Thinkにアクセスできます。ただし、これはIMO 2025で使用されたバージョンとは異なります。IMO 2025で使用された高性能バージョンは、複雑な数学の問題を解く際に数時間かけて推論を行う必要があるため、日常的な使用や商用利用には実用的ではありません。
代わりに、Google AI Ultraの加入者は、より高速なパフォーマンスを実現するために設計されたDeep Thinkのバージョンを受け取ります。研究グレード版のゴールドスタンダードのパフォーマンスを再現することはできませんが、それでも強力な推論能力を示し、標準的な評価において競合モデルよりも高い評価を得ています。
研究用バージョンは棚上げされるわけではありません。Googleは、高度なテストとさらなる最適化を支援するために、限られた学術研究者と数学者に限定して、そのバージョンを公開する予定です。
複数の視点から質問に答える
Deep Thinkの強みは、マルチエージェントアーキテクチャにあります。複数の推論エージェントを並列に展開することで、Deep Thinkは複数のアイデアや概念を同時に処理できます。そして、最も有望なスレッドを選択、洗練、または統合して、最終的な回答を導き出します。
Deep Thinkチームによる最近のブログ投稿には、次のように書かれています。「人が複雑な問題に取り組む際に、時間をかけて様々な角度から検討し、潜在的な解決策を比較検討し、最終的な答えを洗練させるのと同じように、Deep Thinkは並列思考技術を用いることで思考能力の限界を押し広げます。このアプローチにより、Geminiは一度に多くのアイデアを生み出し、それらを同時に検討し、時間の経過とともに異なるアイデアを修正したり組み合わせたりしながら、最良の答えに到達することが可能になります。」
ベンチマークの検証
IMO グレードのバージョンではないにもかかわらず、Ultra 加入者に提供される Deep Think モデルは、ベンチマーク テストで依然として優れたパフォーマンスを発揮し、Gemini 2.5 Pro などの他の主要な AI モデルを上回っています。
推論と知識(人類最後の試験) | コード生成 (LiveCodeBench) | 数学(IMO 2025) | 数学(AIME 2025) | |
---|---|---|---|---|
ジェミニ 2.5 ディープシンク | 34.8% | 87.6% | 60.7% | 99.2% |
ジェミニ 2.5 プロ | 21.6% | 74.2% | 31.6% | 88.0% |
オープンAI-o3 | 20.3% | 72.0% | 16.7% | 88.9% |
グロク4 | 25.4% | 79.0% | 21.4% | 91.7% |
Deep Thinkをさらに最適化
Deep Thinkの2つのバージョン(ツール付きとツールなし)が、まもなくGemini APIを通じて信頼できるテスターと研究者にリリースされます。Google DeepMindは、複数のモデルバージョンを流通させることで、より広範な利用状況に関する洞察を収集し、将来のAIモデルを改良し、商用および研究レベルのアプリケーションの両方をサポートすることを目指しています。
マイクロソフトの新たなAI人材の採用がディープラーニングの未来にどのような影響を与えるのか知りたいですか?このテクノロジー大手がAI研究体制を静かに再構築している様子をレポートでご紹介します。

JRジョニヴァン
JR Johnivan 氏は 17 年のキャリアを持つベテランで、IT、コンピュータ ネットワーク、セキュリティ、クラウド コンピューティング、人材配置、人事、不動産、スポーツ、エンターテイメントなど、イノベーションとテクノロジーに関する執筆活動に力を入れています。