AnthropicのClaude Sonnet 4.5は30時間以上自律的にコードを実行可能

Anthropic の Claude Sonnet 4.5 のロゴ。 — 画像: Anthropic

アンスロピックは、コーディングに優れていると主張するモデル「Claude Sonnet 4.5」で、AIとの競争に新たな挑戦を挑みました。Claude Sonnet 4.5は、実稼働可能なコードの作成、コンピューターの使用、サイバーセキュリティタスクの実行、金融サービスに関する調査、モデリング、予測において、従来のモデルよりも優れたパフォーマンスを発揮するとされています。

「Claude Sonnet 4.5は私たちの期待を一新しました。30時間以上の自動コーディングを処理できるため、エンジニアは膨大なコードベース間の一貫性を保ちながら、数か月かかる複雑なアーキテクチャ作業に劇的に短い時間で取り組むことができるようになります」と、iGent AIの最高経営責任者兼共同創設者であるショーン・ワード氏はアンスロピックの発表で述べた。

Claude Sonnet 4.5はコーディングに優れています

AIがこれほど長期間にわたって自立して作業できることは、AnthropicがAI同僚という夢を実現できる可能性を示唆しています。Claude Sonnet 4.5は、わずか2ヶ月前にリリースされたAnthropicの従来モデルの中で最も高性能だったClaude Opus 4.1を、様々なベンチマークで凌駕していると、同社は述べています。Claude Sonnet 4.5は、継続的なコーディングに加え、法律、医学、そしてより広範なSTEM分野のタスクでも優れた性能を発揮するとされています。

Claude Sonnet 4.5は、ごますり、策略、権力欲、そして妄想的な思考を助長するような要素を避けるように調整されています。Anthropic社はこれを「最も整合性のある」モデルと呼んでいます。

価格は、Claude Sonnet 4 と同じ、入力トークン 100 万個あたり 3 ドル、出力トークン 100 万個あたり 15 ドルです。これは、生成 AI の幅広い分野では比較的高価ですが、高度なコーディングを必要とする既存のユーザーにとってはお得な価格です。

アントロピックはクロード全体で他の新しい機能とツールを発表

Anthropic は、製品全体にわたってアップグレードもリリースしました。

クロード・コードのポイントを保存します。
Claude Code の新しいターミナルインターフェイスとネイティブ VS Code 拡張機能。
Claude API の新しいコンテキスト編集機能とメモリツールにより、エージェントが独立して作業できる時間が延長されます。
Claude アプリでのコード実行とファイル作成。
順番待ちリストに参加した Max レベルの加入者が利用できる、Chrome 拡張機能の Claude。
Claude Agent SDK。

フロンティアAIは徐々に改善し、より専門化が進む

ガートナーは、2025 年の生成 AI 支出が前年比 149.8% 増加し、エンドユーザー支出が約 142 億ドルに達すると予測しています。

モデルが改良されるにつれて、それらの差は劇的には小さくなってきています。ガートナーの調査レポート（購読者限定リンク）によると、Claude Sonnet 4.5は前モデルと比べてわずかに性能が向上しています。

「Claude Sonnet 4.5のリリースにより、Anthropicはコーディング分野におけるリーダーシップの強化を目指しています」と、ガートナーのアナリストであるArun Chandrasekaran氏はTechRepublicへのメールで述べています。「しかし、コーディング分野に加えて、Anthropicは金融とサイバーセキュリティという、ビジネスチャンスがあると見ている他の2つの分野でも、このモデルを適切に機能させるようにトレーニングしました。ただし、これらの分野における改善は漸進的なものです。」

しかし、MCPをGen AIとAgentic AIの通信のための業界プロトコルとして確立することに成功したことで、Anthropicはメモリ、エージェントの調整、自律性において重要な機能を追加しました。

Anthropic の新しいモデルは、その専門分野、特にコーディングと金融という、生成 AI によって雇用に大きな変革が起こる可能性のある 2 つの業界に重点を置くことで差別化を図っています。

「クロード・ソネット4.5は、競争が激化する生成AI（GenAI）モデル市場において、アントロピックがドメイン特化へと移行する意向を示している」と調査ノートには記されている。

特に、クロード・ソネット 4.5 のサイバーセキュリティスキルは、脅威分析とセキュリティテストを実行できる LLM に対する市場の強い需要を裏付けているとガートナーは述べています。

ホワイトハウスは、外国の技術供給業者への依存を減らすための最新計画で、輸入チップと国産チップの比率を1:1にすることを要求している。