Claude Opus 4.7 徹底レポート:13%向上したコーディング性能と新しいxhigh努力レベルを解説

はじめに

2026年4月16日、AnthropicがClaude Opus 4.7をリリースしました1。前バージョンのOpus 4.6から約2ヶ月での更新となります。

発表と同時に複数のメディアが「現時点で最も強力な一般公開済みLLM」と報じましたが2、AI Businessは「good but not great(良いが特別ではない)」と評するなど3、評価は割れています。

この温度差はどこからくるのでしょうか。Anthropicが未公開モデル「Mythos」の存在を認めており、Opus 4.7は同社の内部では「2番目に強力なモデル」に過ぎないという背景があります4。それでも、開発者にとって重要な改善が詰まっていることは確かです。

本記事では、ベンチマークデータと新機能を整理し、自分のワークフローに移行すべきかどうかの判断材料を提供します。

Claude Opus 4.7 — 5つの主要アップデート概要

何が変わったか:5つの主要アップデート

1. コーディング性能の底上げ

最も数字として分かりやすいのが、コーディングベンチマークの改善です。

ベンチマークOpus 4.6Opus 4.7改善幅
SWE-bench Pro53.4%64.3%+10.9pt
SWE-bench Verified80.8%87.6%+6.8pt
CursorBench(IDE環境)58%70%+12pt

注目はCursorBenchの数字です5。このベンチマークはIDE環境での実際のコーディングタスクを評価するもので、SWE-benchより実務に近い指標とされています。12ポイントの向上は、日常的なコーディングアシスト体験に直接影響します。

また、Anthropicは「本番タスクの解決数が3倍」と発表していますが6、これはエージェントループでの自律的なタスク完了を指しており、単純な補完精度とは異なります。

2. 新しいxhigh努力レベル

Opus 4.7で最も実用的な新機能の一つが、xhigh(extra high)努力レベルです7

Claude Effort Level Scale — xhigh は high と max の間に位置する新レベル

Claudeのeffortパラメータは、推論に費やす計算量を制御します。従来のスケールは low → medium → high → max でした。ここに xhigh が追加され、highmax の間に位置します。

なぜこれが重要かというと、high では質が不十分だが max では遅すぎる・高すぎる、というユースケースが多かったからです。

xhigh が向くタスク:

  • 複数ファイルにまたがるリファクタリング
  • アーキテクチャレベルの設計判断
  • 微細な競合状態(race condition)のデバッグ

Anthropicは Claude Code でのデフォルトを xhigh に設定しました8。開発者フィードバックで「highでは品質が足りない」という声が多かった結果です。

3. ビジョン性能の大幅向上

Opus 4.7では解像度サポートが大幅に拡張されました。

指標Opus 4.6Opus 4.7
最大解像度1568px3.75MP(約2576px)
視覚ナビゲーション(ツールなし)57.7%79.5%
視覚精度(visual acuity)54.5%98.5%

解像度の総ピクセル数は約3.26倍に増加しています9。視覚精度が54.5%→98.5%という大幅な向上は、文字の読み取りや細部の認識精度が根本的に改善されたことを意味します。UIスクリーンショットの分析や、図表を含むドキュメントの処理に実際的な影響があります。

4. エージェント向けの機能強化

Opus 4.7はエージェント用途向けの機能が充実しています。

タスクバジェット(Task Budgets): エージェントループ全体でのトークン目標値を指定できる新機能です10。thinking・ツール呼び出し・ツール結果・最終出力を合わせたトークン数の目安を渡すことで、モデルがコスト効率よく推論を配分します。

ファイルシステムベースのメモリ改善: スクラッチパッドやメモリファイルへの書き込みと参照が改善されています10。エージェントが複数ターンにわたって情報を蓄積・活用するタスクで恩恵を受けます。

GPQA Diamond 94.2%: 多分野推論ベンチマークで94.2%を記録し11、エージェントが扱う専門的な判断タスクの精度向上も確認されています。

5. 知識カットオフの延長

知識カットオフが2025年5月→2026年1月に更新されました12。約8ヶ月分の最新情報が組み込まれており、2025年後半から2026年初頭にかけての出来事やリリースについても回答できます。

価格と利用可能なプラットフォーム

Opus 4.7の価格はOpus 4.6と同一です。

区分価格
Input$5 / 100万トークン
Output$25 / 100万トークン

注意点: Opus 4.7では新トークナイザーが導入されており、同一プロンプトでも実際のトークン消費量が0〜35%増加する可能性があります13。価格単価は変わらなくても、実費は上がるケースがあります。移行前にトークン数の変化を確認することを推奨します。

利用可能なプラットフォーム:

  • Anthropic API
  • Amazon Bedrock
  • Google Cloud Vertex AI
  • Microsoft Foundry
  • GitHub Copilot
  • Snowflake Cortex AI

価格が据え置かれた一方で、新トークナイザーによる実費増加の可能性がある点を考えると、「移行するかどうか」は単純ではありません。

Opus 4.6 から移行すべきか

同じ価格で性能が上がっているなら、即移行すれば良い——と思いがちですが、実際はそう単純ではありません。

移行を推奨するケース:

  • ビジョン機能を活用している(解像度の恩恵が大きい)
  • エージェント型のコーディングタスクが主な用途
  • 新しいプロジェクトを開始する
  • 知識カットオフが重要(2025年後半の情報が必要)

移行を急がなくてよいケース:

  • 現行プロンプトがOpus 4.6向けに調整済みで安定している
  • ビジョン非依存のバックエンド・アルゴリズム系タスクが主
  • コスト予測を重視している(新トークナイザーの影響を測定したい)

Apiyi.comの比較分析によると、コーディング以外・ビジョン非依存のタスクでは4.6と4.7の差は数字ほど大きくないとされています14。「とりあえず最新版」ではなく、自分のユースケースで評価することが重要です。

セキュリティ面での変更

機能向上とは別に、リリースノートで注目すべき安全性への配慮があります。

Anthropicは、Opus 4.7の訓練過程でサイバー脅威能力を意図的に低減する手法(「differential reduction」)を適用したと発表しています15。これは、特定のサイバー攻撃に使えるような知識・能力を、他の性能を損なわずに選択的に抑制するアプローチです。悪用リスクを抑えながら一般公開するための措置であり、Anthropicが安全性を優先するスタンスを改めて示したものとも言えます。

セキュリティ専門家がペネトレーションテストや脆弱性調査などの正当な目的で使用する場合は、Anthropicの公式認証プログラムへの申請を通じて利用が可能です。

まとめ

Claude Opus 4.7の主な改善点を整理します。

明確に向上した点:

  • IDE環境でのコーディング精度(CursorBench +12pt)
  • ビジョン解像度と精度(最大3.75MP、視覚精度98.5%)
  • 知識カットオフ(2026年1月まで)

開発者にとって実用的な新機能:

  • xhigh努力レベル(Claude Codeではデフォルト)
  • タスクバジェットによるエージェントループの制御
  • ファイルシステムメモリの改善

注意すべき点:

  • 新トークナイザーによる実費増加の可能性
  • ビジョン・コーディング重視でない用途では差が小さい
  • Mythos未公開の状況下での「最強モデル」評価

Anthropicが「good but not great」と評されつつも前進を続けているこの時期、Opus 4.7は開発者ツールとしての完成度を着実に高めています。特にClaudeを自律エージェントとして動かしている開発者にとっては、試す価値のあるアップデートです。

参考文献

Footnotes

  1. Anthropic releases Claude Opus 4.7 - CNBC

  2. Anthropic releases Claude Opus 4.7, narrowly retaking lead - VentureBeat

  3. Anthropic Releases Good but not Great Claude Opus 4.7 - AI Business

  4. Anthropic Ships Claude Opus 4.7 as Mythos Stays Under Lock and Key - Brave New Coin

  5. Claude Opus 4.7 leads on SWE-bench and agentic reasoning - The Next Web

  6. Anthropic’s Claude Opus 4.7 Released: All You Need to Know - FelloAI

  7. What’s new in Claude Opus 4.7 - Claude API Docs

  8. Claude Opus 4.7 Developer Guide - NxCode

  9. Claude Opus 4.7 vs 4.6 comparison guide - The AI Corner

  10. Claude Opus 4.7 Complete Guide - NxCode 2

  11. Claude Opus 4.7 Benchmarks - BenchLM.ai

  12. Claude Opus 4.7 benchmarks, features, migration guide - The AI Corner

  13. Claude Opus 4.7 vs 4.6 Comprehensive Comparison - Apiyi.com

  14. Claude Opus 4.7 vs 4.6 Comprehensive Comparison - Apiyi.com

  15. Anthropic rolls out Claude Opus 4.7, an AI model that is less risky than Mythos - CNBC