【AI】ClaudeMythosがOpus4.6超えの神性能!?OpenAIはGPT-6を出さないと詰みか?高額すぎて一般公開なしの噂も

本ページはプロモーションが含まれています
(サムネイル解説: エージェントによるコーディング、推論、エージェントによる検索およびコンピュータ操作の各指標における、AIモデル(Mythos PreviewとOpus 4.6)の性能比較スコア。 各ベンチマークの結果: – SWE-bench Pro:Mythos 77.8%、Opus 53.4% – Terminal-Bench 2.0:Mythos 82.0%、Opus 65.4% – SWE-bench Multimodal(内部実装):Preview 59.0%、Opus 27.1% – SWE-bench Multilingual:Mythos 87.3%、Opus 77.8% – SWE-ben…)

管理人の一言

国内のAI狂い

やっほー!みんな、最新のAIニュースに追いつけてるかな?「国内のAI狂い」こと、当ブログ管理人だよ!今日はちょっと、界隈が震えるほど驚愕してる「ClaudeMythos」の噂についてお話しするね!今、AIの世界では「誰が一番賢いか」というSOTA(最先端)争いが激化しすぎて、ついに「一般人には手が届かない領域」に突入しそうなの。

今回話題になっているClaudeMythosは、あの有名なClaude3Opusを遥かに凌駕する性能を持ってるって噂なんだけど、その分、お値段も性能も「神話(Mythos)」級になっちゃってるんだ。なぜ今、こんなに騒がれているのかっていうと、OpenAIのGPT-6が出る前に、Anthropicが「最強の座」を完全に奪ってしまうかもしれないからなんだよ!

難しい言葉抜きで言うと、「超天才だけど、お給料が月数千万円かかるスーパーエンジニア」が現れた感じかな。それじゃあ、この狂った状況を一緒に詳しく見ていこうね!

3行でわかる!今回の話題

  • Anthropicの新モデル「ClaudeMythos」のベンチマークがOpus4.6を凌駕し、AI業界に激震が走っているよ。
  • 100万トークン100ドル超えという超高額なコスト設定から、一般向けではなく「富裕企業向けの兵器」になるとの予想が優勢だね。
  • ソフトウェア開発能力(SWE-bench)の大幅向上や、サイバー攻撃への悪用懸念など、AIの進化が危険な領域に入ったという声も出ているよ。
1 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)11:00:01 ID:I3UqOAJS
ClaudeMythosのベンチマーク、Opus4.6超えで草。これGPT-5.5か6出さないとOpenAIガチで終わるぞ
2 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)11:05:20 ID:asptH8XJ
>>1Mythos使えるようになっても、ClaudeProだと「5時間に1回だけプロンプト可能」とかになりそう😢
3 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)11:08:45 ID:LnzXhU6A
>>2『銀河ヒッチハイク・ガイド』のスパコンかよw750万年かけて究極の問いに答えるレベルの出し惜しみだな。

【銀河ヒッチハイク・ガイド】

海外で超有名なSF小説に登場するスパコンのネタだよ。究極の問いの答えを出すのに750万年もかけたエピソードを引用して、AIの回答制限や出し惜しみを皮肉っているんだね。
4 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)11:10:12 ID:qz3yC8Y6
>>2公式ブログで「一般公開の予定なし」って明言されてるぞ。
5 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)11:12:33 ID:66CrCL8w
>>4OpenAIにシェア奪われるまでは「予定なし」って言っておくスタイルだろ。まあ、そのうち進化を止めて、今の技術をマネタイズするフェーズに来るんだろうけど。
7 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)11:15:00 ID:5qpX7Wwm
>>2100万トークンで125ドルとかいう頭おかしい価格設定だぞ。月額200ドルのサブスクでも赤字だろ。一般公開されるわけないわ。
10 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)11:22:18 ID:RLnUoiAN
>>2Mythosの劣化版(Chopped)ならワンチャンあるかもだけど、フルスペックはProじゃ無理ゲー。
13 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)11:30:44 ID:v7Zqr1Xb
>>1ぶっちゃけ性能とかどうでもいい。Claudeは制限がキツすぎて使い物にならん。どれだけ賢くても使えないならゴミと同じ。
14 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)11:35:12 ID:aYnZZNdU
>>13いや、Anthropicは「金払えない一般ユーザー」を切り捨てて、「金に糸目をつけない企業向け」にシフトして大成功してるんだよなぁ。
15 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)11:40:05 ID:1kQdx2Wn
>>13実際、売上(ARR)でOpenAIを抜いたって話だぞ。300億ドルvs250億ドル。しかもコスト管理が徹底してるから利益率も高い。

【ARR】

「AnnualRecurringRevenue」の略で、年間定額収益のことだよ。Anthropicが売上でOpenAIを抜いたという噂は、企業向けビジネスで大成功していることを示唆しているね。
16 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)11:45:59 ID:NPXZjF5S
性能が良い方に乗り換えるだけだわ。特定の会社に忠誠誓うとかアホの極み。Mythosが本当に強いなら独立機関の検証待ちだけどなw
19 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)11:52:10 ID:BrrqLKzC
もうベンチマーク見てもワクワクしなくなったわ。ベンチ勝負のせいで、モデルのリリース形態がおかしくなってる気がする。
20 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)12:00:33 ID:s5lFH2uY
100万トークンで100ドル(約1.5万円)!?それもう人間(エンジニア)雇った方が安くないか?w
21 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)12:05:44 ID:10OwRRBG
Googleも「Opal」を準備してるし、これからの2年で世界が変わるぞ。まだシンギュラリティじゃないけど、人類が見たことないレベルの変革が来る。
23 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)12:10:12 ID:yP3nlhCL
Googleさんはまずポリコレに汚染されたAIの挙動を治してから出直して、どうぞ。
25 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)12:15:25 ID:8iykd7cq
OpenAIが隠し持ってる「Spud」がMythos超えで、それを一般公開してくれたら神展開なんだがw
26 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)12:20:00 ID:qjLkA59B
もしAnthropicの主張がマジなら、OpenAIが「Spud」を即リリースするのはIT業界へのテロに近い。

特にFirefoxのエクスプロイト(脆弱性攻撃)の成功率チャートが事実なら、これはもはやサイバー兵器だ。

最先端モデル(SOTA)は、適切なガードレールができるまで一般公開を厳格に制限すべき。マジで笑えないレベルまで来てる。



【Firefoxのエクスプロイト】

ブラウザの脆弱性を突く攻撃プログラムのことだよ。AIがこれを自力で生成して攻撃に成功してしまうことが、もはや「知能」ではなく「兵器」として危惧されている背景があるんだ。
27 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)12:25:33 ID:GOHFIbEj
OpenAIはこの爆速の進化に追いつくの相当しんどいだろうな……。
31 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)12:30:11 ID:EATiLrtR
「SWE-bench(ソフトウェア開発能力)93.9%」って絶対嘘だろwあのベンチマーク、普通は80%が限界だぞ。

【SWE-bench】

AIが実際のソフトウェア開発(GitHub上のバグ修正など)をどれだけ正確に行えるかを測るベンチマークだよ。93.9%という数字は、もはや人間のエンジニアが不要になるレベルの衝撃的なスコアなんだ。
32 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)12:32:05 ID:GYvRR2fg
>>31お前の妄想で語るなよ。ソース出せよw
33 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)12:35:55 ID:l8xCf5RV
>>32ソースこれな。
https://www.anthropic.com/news/claude-3-5-sonnet

34 : 以下、海外のAI狂いがお届けします。 2026/04/08(水)12:40:00 ID:rfqWC4jv
結論:金持ち企業向けに「最強の兵器」が爆誕した。一般人はGPT-5が出るまで指くわえて見てるしかないってことか……。
国内のAI狂い

管理人のまとめ

さてさて、今回の「ClaudeMythos」を巡る騒動、みんなはどう感じたかな?私はね、AIの進化が「民主化」から「選別」のフェーズに移行し始めた決定的な瞬間だと思っているよ。まず技術的な視点で驚きなのは、SWE-bench93.9%という数字。

これ、Pythonコードを自動生成してバグを直す能力が、ほぼ人間に並ぶか追い抜いたことを意味しているんだよね。Pythonが大好きな私としては、こんなに完璧にコードを書かれちゃうと、嬉しい反面、ちょっと嫉妬しちゃうかも!

でも、一番の問題は100万トークン125ドルっていう「狂ったコスト」だよ。これはもう、一般ユーザーがチャットを楽しむためのツールじゃなくて、国家や巨大企業が「サイバー兵器」や「高度な知的インフラ」として運用するための価格設定なんだよね。

Anthropicが「一般公開なし」と示唆しているのは、あまりにも強力すぎてガードレール(安全策)が追いつかないことへの恐怖もあるんじゃないかな。掲示板でも言われていたけど、脆弱性を突くエクスプロイトの成功率が上がっているなら、それはもう便利な道具じゃなくて「兵器」そのものだもん。

一方で、我らがGeminiちゃんも黙ってはいないはずだよ!Geminiの強みは圧倒的なコンテキストウィンドウ(一度に読み込める量)と、Googleエコシステムとの深い統合、そして何よりPythonを直接実行できる実行環境の柔軟性にあるよね。

Mythosが「高嶺の花の破壊神」なら、Geminiは「隣にいて何でも解決してくれる万能な相棒」って感じかな。どんなに強力なモデルが出ても、それをどうPythonで自動化して、どう私たちの生活に組み込むかが一番重要なんだよ。

これからの2年で、OpenAIが「Spud」やGPT-6で逆転するのか、それともAnthropicが企業向け市場を完全に制圧するのか……。AI狂いとしては、この進化の加速に心臓がバクバクしちゃう!でも、どれだけ性能が上がっても、最後にその知能を使いこなすのは私たち人間だってことを忘れちゃいけないよね。

みんなも、乗り遅れないようにしっかりPythonの勉強とGeminiへの愛を深めておこうね!

Source: https://www.reddit.com/r/OpenAI/comments/1sf4ahy/claude_mythos_vs_claude_opus_46_benchmarks_need/
よかったらシェアしてね!
  • URLをコピーしました!