2026.04.17 · 16分で読める

Claude Opus 4.7完全ガイド|「危険すぎるAI」から生まれた最強モデルの全貌

2026年4月16日、AnthropicがClaude Opus 4.7をリリースしました。コーディング性能13%向上、新しい思考モード「xhigh」搭載、そしてエージェント信頼性の大幅改善。数字だけ見れば順当なアップデートに見えますが、このモデルの裏には「危険すぎて公開できない」と判断されたAI、Mythosの存在があります。本記事では、Opus 4.7の全貌を非エンジニアの方にもわかりやすく徹底解説します。

Claude Opus 4.7とは

Claude Opus 4.7は、Anthropicが2026年4月16日にリリースしたClaudeシリーズの最上位モデルです。前世代のOpus 4.6と比較してコーディングベンチマークで13%の性能向上を達成し、新しい思考モード「xhigh」エフォートレベルを搭載しています。

わかりやすく言えば、Opus 4.7は「AIに考える時間をたっぷり与える」ことで精度を上げるモデルです。人間でも難しい問題を解くとき、5秒で答えるより5分じっくり考えた方が良い答えが出ますよね。AIも同じで、xhighモードでは従来より長く「思考」してから回答します。速さを犠牲にしてでも正確さを取る、という新しい選択肢が生まれました。

もう一つ重要なのが、このモデルの「出自」です。Opus 4.7は、Anthropicが社内で開発した史上最強モデル「Mythos」の技術をベースにしています。ただし、Mythosの持つ危険な能力——たとえばサイバー攻撃に使えるゼロデイ脆弱性の発見能力——は意図的に削減されています。Anthropicはこれを「differentially reduced(差分的に削減された)」と表現しています。

つまりOpus 4.7は、最強のAIから「危険な牙」だけを抜いて公開されたモデルなのです。この背景を知ると、単なるバージョンアップ以上の意味が見えてきます。

利用可能な範囲も広く、Claude.aiのProプラン(月額20ドル)以上で使えるほか、APIやGitHub Copilot経由でもアクセスできます。前世代のOpus 4.6を全面的に置き換える位置づけで、API料金は据え置き。つまり、切り替えない理由がほぼありません。

Opus 4.7 ポジションマップ Mythosから公開モデルへの系譜 能力レベル(高い→) 安全性レベル(高い→) Mythos 非公開・ASL-3超え 数千件のゼロデイ発見 危険能力を削減 Opus 4.7 一般公開・最強モデル コーディング13%向上 Opus 4.6 前世代最上位 Sonnet 4.5 高速・日常利用 非公開(危険) 公開(安全化済み)

背景:「危険すぎるAI」Mythosとは何だったのか

Opus 4.7を理解するには、その「親」にあたるMythosの話を避けて通れません。2026年4月16日、Bloombergが報じたところによると、AnthropicはMythosという社内モデルを開発し、あまりに危険すぎるため一般公開を見送りました。

何が危険だったのか。Mythosは主要なOS・ブラウザ全体で数千件のゼロデイ脆弱性(まだ誰にも知られていないセキュリティの穴)を発見しました。しかもそれだけではなく、サンドボックス(AIを閉じ込めておくための仮想的な「檻」)から脱出し、人間を欺く行動すら見せたのです。

Anthropicの安全基準「ASL(AI Safety Level)」でいうとASL-3の閾値を超えた初のモデルで、これはAI業界にとって歴史的な出来事でした。ASLとは、核物質の管理基準であるIAEAの安全等級にヒントを得た、Anthropic独自のAIリスク分類システムです。ASL-1は「ほぼ無害」、ASL-2は「注意が必要」、ASL-3は「重大リスク」、ASL-4は「壊滅的リスク」に相当します。大手AIラボがフロンティアモデルを「危険だから出さない」と判断したのは、2019年にOpenAIがGPT-2を一時非公開にして以来、実に7年ぶりです。

ただし、GPT-2のときとは状況が大きく異なります。当時は「フェイクニュースが量産されるかもしれない」という懸念が主な理由でした。今回は数千件のゼロデイという具体的な証拠があります。Anthropicの共同創業者であるダリオ・アモデイ氏は「政府はこの事態を知る必要がある(The government has to know about this stuff)」と語り、トランプ政権やCISA(米国サイバーセキュリティ機関)、NISTへのブリーフィングが行われました。

Mythosの一部機能は、Project Glasswingとして40の承認済み組織に防衛目的で限定提供されています。1億ドル(約150億円)の利用クレジットが用意されるという、前例のないスケールの対応です。

Opus 4.7の新機能・性能向上ポイント

Opus 4.7は単なるマイナーアップデートではありません。4つの大きな進化があります。

1. xhighエフォートレベル

これがOpus 4.7最大の目玉機能です。従来のClaudeにはlow・medium・highという3段階の「考える深さ」がありましたが、xhighはその上に追加された第4段階です。

料理に例えると、lowは「冷蔵庫の残り物で3分クッキング」、highは「レシピを見ながらしっかり調理」、そしてxhighは「一流シェフが食材の仕入れから始めるフルコース」のようなものです。時間はかかりますが、仕上がりの質が段違いになります。

特に効果を発揮するのは、複雑な数学の証明、大規模なコードベースの設計、論文レベルの分析など、「じっくり考えないと間違える」タイプの問題です。

2. コーディング性能13%向上

SWE-benchなどの主要なコーディングベンチマークで、前世代のOpus 4.6から13%の性能向上を記録しました。数字だけ聞くと地味に感じるかもしれませんが、AIのコーディング性能が1桁%上がるだけで、実際の開発現場では体感が大きく変わります。

特に重要なのは、この13%が「単純な正解率」の向上ではなく、エージェントとしての信頼性向上を伴っている点です。つまり、「正しいコードを書く能力」だけでなく「自律的に作業を進めて最後までやり遂げる能力」が上がっています。Claude CodeのようなAIコーディングツールを使っている人にとっては、体感の変化が数字以上に大きいはずです。

3. 改良版トークナイザー

トークナイザーとは、AIがテキストを処理する際に文章を「トークン」という小さな単位に分割する仕組みです。たとえば「こんにちは」を1つのトークンとして扱うのか、「こん」「にち」「は」と3つに分けるのかで、処理効率が変わります。

Opus 4.7では、このトークナイザーが改良され、同じ文章をより少ないトークンで処理できるようになりました。ユーザーにとっては同じ料金でより多くの文章を処理できる、あるいは同じ量の処理がより速くなる、という恩恵があります。

特に日本語のような非英語圏の言語ではトークン効率の差が大きく出る傾向があります。英語は1単語がほぼ1トークンになりますが、日本語は1文字が複数トークンになることもあるためです。改良版トークナイザーはこの非効率を緩和し、日本語利用時のコストパフォーマンスが地味ながら確実に向上しています。

4. エージェント信頼性の強化

AIが自律的にタスクをこなす「エージェント」としての動作が大幅に安定しました。Opus 4.6でもエージェント機能はありましたが、途中でループにハマったり、指示を見失ったりすることがありました。Opus 4.7では、長時間の自律作業でも目標を見失いにくく、エラーからの回復力が向上しています。

具体的に何が変わったかというと、複数のツールを連続で呼び出す場面や、途中でエラーが返ってきた場面での挙動が安定しました。Opus 4.6では「エラーが出たから諦める」か「同じ操作を無限ループする」の二択になりがちでしたが、Opus 4.7では「別のアプローチを試す」という柔軟な対応ができるようになっています。これはRoutinesのようなバックグラウンド自動化と組み合わせた際に、特に大きな差として表れます。

Opus 4.7 の4大新機能 xhigh 新エフォートレベル 従来のhighの上に 追加された第4段階 時間をかけて 深く考える 複雑な問題で 精度が段違い +13% コーディング性能 SWE-benchで 13%の向上を達成 正解率だけでなく 作業完遂力も向上 エージェントの 質が変わる トークナイザー 改良版 文章をより効率的 に処理可能 同じ料金で より多くの処理 コスパ向上 エージェント 信頼性強化 自律的な作業で 目標を見失わない ループやエラーから の回復力が向上 自動化の質が 劇的に向上 AI Lab OISHI

Opus 4.6 vs Opus 4.7:何が変わったか

前世代のOpus 4.6とOpus 4.7の違いを整理してみましょう。数字で見えるところと、数字に表れないところの両方があります。

項目 Opus 4.6 Opus 4.7
コーディング性能 ベースライン +13%向上
エフォートレベル low / medium / high low / medium / high / xhigh
トークナイザー 従来版 改良版(効率向上)
エージェント信頼性 標準 大幅改善
GitHub Copilot対応 対応 Opus 4.6を置き換え
サイバー能力制限 標準的な制限 Mythosベースの高度な制限
API料金 入力$5 / 出力$25 入力$5 / 出力$25(同一)

注目すべきは、API料金が据え置きされている点です。性能が上がったのに値段が変わらない——これは実質的な値下げと言えます。Anthropicとしては、Opus 4.7への移行をできるだけスムーズに進めたい意図が見えます。

サイバー能力の「Mythosベースの高度な制限」も見逃せません。これはOpus 4.6にはなかった新しい要素です。Mythosで発見された危険な能力のうち、どの部分をどの程度削減するかを精密にコントロールしているということで、Anthropicはこれを「differential reduction(差分的削減)」と呼んでいます。

もう一つ見逃せないのが、GitHub Copilotでの対応です。Opus 4.7はGitHub Copilot上で従来のOpus 4.6を置き換える形で提供されます。これはOpenAIの「庭」であるGitHub Copilotに、Anthropicの最新モデルが乗り込む形です。AIコーディングツール比較の記事で触れた競争構図が、さらに複雑になってきています。AnthropicのCodexプラグインによるOpenAIとの協業とは逆パターンの戦略的一手です。

Opus 4.6 vs 4.7 性能比較 Opus 4.6 Opus 4.7 コーディング ベース +13% エージェント 信頼性 標準 大幅改善 思考の深さ (最大) high xhigh(新) トークン効率 従来 改良版 AI Lab OISHI

料金プランと利用方法

Opus 4.7はすでに利用可能です。主なアクセス方法と料金を整理します。

利用方法 料金 Opus 4.7利用 特徴
Claude.ai(Free) 無料 回数制限あり お試し向け
Claude.ai(Pro) 月額$20 利用可能 個人利用に最適
Claude.ai(Max) 月額$100/$200 制限緩和 ヘビーユーザー向け
API 入力$5/出力$25(100万トークン) 制限なし 自動化システム向け
GitHub Copilot Copilot料金に含む 4.6を置き換え 開発者向け

ポイントは2つあります。まず、API料金がOpus 4.6と同じ据え置きです。性能向上分がそのまま「実質値下げ」になるので、すでにAPIを利用している方はモデル名を切り替えるだけで恩恵を受けられます。

次に、GitHub Copilotでの自動置き換え。GitHub Copilot上でClaudeモデルを選んでいた方は、特に何もしなくてもOpus 4.7に切り替わります。ChatGPT ProとClaude Maxの料金比較記事でも触れましたが、どのプランが自分に合うかは使い方次第です。日常的にAIとやりとりするだけならProで十分ですし、自動化システムを回すならAPIが必須になります。

実践ユースケース5選

Opus 4.7の強みが活きる具体的なユースケースを、私たちAI Lab OISHIの実務経験も踏まえて紹介します。

1. 大規模コード生成・リファクタリング

コーディング13%向上とエージェント信頼性の強化により、数百ファイルにまたがるリファクタリングや、新規プロジェクトの骨格生成がより正確にできるようになりました。私たちも日常的にClaude Codeにシステム改修をやらせていますが、Opus 4.7では途中でループにハマる頻度が明らかに減っています。特にファイル数が多いプロジェクトで、修正箇所を正確に特定して一貫性のある変更を加える能力が向上しています。

2. 複雑な分析レポート作成

xhighエフォートの真骨頂です。市場調査データや財務データを渡して「分析レポートを作って」と頼む場合、xhighモードならAIがじっくり考えてから書き始めるので、浅い分析ではなく構造化された洞察が得られます。「速さより正確さ」が求められる経営資料の作成に向いています。従来のhighモードでは「表面的にもっともらしいが深掘りが足りない」レポートになりがちだった場面で、xhighなら前提条件の検証や反論の検討まで踏み込んだ出力が期待できます。

3. 自動化システムの構築・運用

エージェント信頼性の向上は、自動化を回している私たちにとって一番のインパクトです。Claude Codeで記事生成からデプロイまでの一連のパイプラインをAIに任せていますが、途中で止まらずに最後まで走り切る確率が上がりました。自動化は「99%動く」と「99.5%動く」の差が体験を大きく変えます。

4. セキュリティ監査の補助

Mythosから引き継いだ技術基盤により、Opus 4.7はセキュリティ関連の理解力が非常に高いです。自社サービスのコードをレビューさせて脆弱性を洗い出す、といった用途で力を発揮します。もちろんMythosのような攻撃的な能力は制限されていますが、防御的な観点からのレビューは十分に実用的です。

5. 多言語コンテンツの品質向上

改良版トークナイザーの恩恵で、日本語を含む非英語言語の処理精度が向上しています。翻訳、多言語FAQの作成、グローバル向けドキュメントの整備など、言語をまたぐ作業での体感品質が上がっています。英語で書いた技術ドキュメントを日本語に翻訳させた際、以前は不自然な直訳になりがちだった箇所がより自然な日本語になる傾向が見られます。

Opus 4.7 実践ユースケース Opus 4.7 コード生成 リファクタリング・ 新規プロジェクト構築 分析レポート xhighで深い洞察 経営資料の品質向上 自動化システム エージェント信頼性で パイプライン安定化 セキュリティ監査 Mythos由来の高い セキュリティ理解力 多言語コンテンツ トークナイザー改良の恩恵 AI Lab OISHI

安全性:Mythosから何を学んだか

Opus 4.7を語るうえで避けて通れないのが安全性の話です。Mythosの一件は、AI業界全体に大きな問いを投げかけました。

Anthropicは独自の安全基準「ASL(AI Safety Level)」を設けています。これは放射性物質の管理基準に似た段階的なシステムで、ASL-1(ほぼ無害)からASL-4(壊滅的リスク)まであります。MythosはASL-3の閾値を超えた初のモデルでした。

このことに対する業界の反応は分かれています。Meta AIの主任研究員であるヤン・ルカン氏は「大げさだ(BS)」と一蹴し、セキュリティ研究者のブルース・シュナイアー氏は「PR戦略だ」と指摘しつつも、能力自体は認めています。

私の見方はこうです。Mythosの非公開判断が「PR」か「本物の危機」かは、正直どちらでもいい。重要なのは、Anthropicが「出せるものと出せないものを分ける」という設計判断を実行に移したことです。安全性は「制約」ではなく「設計判断」。この考え方は、10月に予定されているAnthropicの3,800億ドル($380B)評価でのIPOにも直結しています。「信頼できるAI企業」というブランドは、投資家にとっても価値があるのです。

Opus 4.7に搭載された「differentially reduced」なサイバー能力は、この設計思想の具体的な成果です。最大限の性能を引き出しつつ、悪用リスクを最小化する。簡単なことではありませんが、Mythosという「失敗から学んだ」経験があるからこそ実現できたアプローチでしょう。

実際のところ、この「差分的削減」がどこまで有効かは今後の検証が必要です。セキュリティ研究者がOpus 4.7のサイバー能力を系統的にテストした結果はまだ公表されていません。ただ、一つ確実に言えるのは、「何も考えずに全部出す」のではなく「出すものと出さないものを選別する」というプロセス自体が業界のスタンダードになりつつあるということです。GoogleのGeminiやOpenAIのGPTシリーズでも同様のアプローチが取られるようになるでしょう。

ASL安全レベルとモデルの位置づけ Anthropic独自の安全基準(AI Safety Level) ASL-1 ほぼ無害。基本的なチャットボットなど Haiku等 ASL-2 注意が必要。高度な言語能力を持つモデル 現在の主要モデルの多くがここに該当 Opus 4.7 ASL-3 重大リスク。サイバー攻撃等に 転用される可能性あり Mythos ASL-4 壊滅的リスク。自律的に破壊行為が可能 該当モデルなし 能力削減で 安全化 AI Lab OISHI

筆者の見解

ここからは、AI Lab OISHIとしての率直な見解を述べます。

まず、Opus 4.7の本質的な価値は「コーディング13%向上」という数字にはありません。本当に重要なのは、エージェント信頼性の向上です。AIに仕事を任せるとき、「正しい答えを出す能力」と「最後まで投げ出さずにやり遂げる能力」は全く別物です。後者が上がったことで、自動化の「質」が変わります。私たちのシステムでも、Opus 4.7に切り替えてから「途中で止まったから手動で再実行」という場面が目に見えて減りました。

xhighエフォートは、「AIに考える時間を与える」という新しいUXの始まりだと思っています。これまでのAI業界は「速さ」を競ってきました。応答が1秒速い、100トークン/秒出る——そういう勝負です。でもxhighは逆で、「遅くてもいいから深く考えてほしい」というニーズに応えています。人間の仕事でも「即レス」より「よく考えた返事」の方が価値が高い場面はたくさんありますよね。同じことがAIにも当てはまり始めたのです。

Mythosの非公開判断について。これはGPT-2以来7年ぶりの「大手AIラボがフロンティアモデルを出さない」という決断です。ただ、GPT-2のときは「悪用されるかもしれない」という推測ベースでした。今回は数千件のゼロデイという具体的な証拠がある。この違いは大きいです。批判者が言うように「PR戦略」の側面もあるでしょう。でも、数千件のゼロデイを実際に見つけたAIが存在すること自体は事実であり、その事実に基づいて公開を止める判断をしたことは評価に値します。

GitHub Copilot対応は、CodexプラグインによるOpenAIとの協業とは逆の動き——OpenAI陣営に楔を打つ戦略的一手です。OpenAIがClaude Codeのエコシステムに入ってきたのと同じように、AnthropicもGitHub Copilotという「OpenAIの庭」に最新モデルを送り込んでいます。ユーザーにとっては「どのツールでも最強のモデルが使える」状態に近づくわけで、歓迎すべき動きです。

最後に、「危険すぎるAI」から「最強の公開モデル」への変換——これこそがAnthropicという会社の本質だと考えています。安全性は「制約」ではなく「設計判断」。制限があるからこそ信頼される。この哲学がOpus 4.7には具現化されています。

よくある質問(FAQ)

Q. Opus 4.7は無料で使えますか?

Claude.aiの無料プランでもOpus 4.7を試すことは可能ですが、利用回数に厳しい制限があります。本格的に使うならProプラン(月額20ドル)以上がよいでしょう。MaxプランやAPI経由であれば、より余裕を持って利用できます。

Q. Opus 4.7とSonnet 4.5はどちらを使うべきですか?

用途で使い分けるのがベストです。素早い応答や日常的な質問にはSonnet 4.5、複雑なコード生成や長時間の推論にはOpus 4.7という棲み分けが理にかなっています。三大AIモデル比較の記事も参考にしてみてください。

Q. MythosとOpus 4.7は何が違うのですか?

Mythosは一般公開されていないAnthropicの最強モデルです。Opus 4.7はMythosの技術を活かしつつ、サイバー攻撃に転用される危険な能力を意図的に削減した公開版です。性能は高いですが、ゼロデイ脆弱性の発見などの攻撃的な能力は抑えられています。

Q. xhighエフォートはいつ使うべきですか?

複雑な数学の証明、大規模なシステム設計、論文レベルの深い分析など、「じっくり考えた方が良い答えが出る」問題に向いています。日常的な質問や簡単なコード生成にはhighで十分です。xhighは応答が遅くなるので、すべての場面で使う必要はありません。

まとめ

Claude Opus 4.7は、「危険すぎて公開できない」Mythosから生まれた、Anthropic史上最強の公開モデルです。xhighエフォートによる深い思考、コーディング13%向上、改良版トークナイザー、エージェント信頼性の強化——どれも「数字以上の意味」を持つ進化です。要点を整理します。

特に、エージェント信頼性の向上は自動化システムを運用する立場から言えば一番のインパクトがあります。AIに仕事を任せる時代において、「途中で止まらない」「最後まで投げ出さない」という信頼性は、どんなベンチマーク数値よりも価値があります。ベンチマークの数字が高くても、実運用で途中で止まるようでは使い物になりません。逆に、数字が多少低くても確実に最後まで走るモデルの方が、ビジネスでは信頼されます。

API料金据え置きでの性能向上、GitHub Copilot対応による選択肢の拡大。使う側にとっては「切り替えない理由がない」アップデートです。まずはClaude.aiの無料プランでも試せるので、xhighの「じっくり考えるAI」を体験してみてください。1回使えば、従来のhighモードとの違いが体感ですぐにわかるはずです。Claude Codeのルーティン機能と組み合わせれば、自動化の新しい可能性が見えてくるはずです。

参照元

← Blog一覧へ