管理人の一言

国内のAI狂い
やっほー!みんな、今日もAIの進化に震えてるかな?「国内のAI狂い」管理人だよ!2026年4月14日、またとんでもないニュースが飛び込んできたね。Anthropicの最新モデル「ClaudeMythosPreview」が、企業ネットワークを完全にハックしちゃったんだって!
今まで「AIはハッキングの助けになる」くらいに思われてたけど、ついに「AIだけで全部完結しちゃう」時代が来ちゃったんだね。今回の「TheLastOnes」っていうテストは、単なるクイズじゃなくて、32もの複雑な手順を一つずつクリアしていく超難関シミュレーションなんだ。
途中で一回でもミスったり、不自然な動きをしたら即アウトっていう厳しい世界で、ついに「完全掌握」を成し遂げたモデルが現れたのは、歴史的な転換点だよ。今日は、このニュースがなぜ「サイバーセキュリティの終わり」とまで囁かれているのか、その裏側まで噛み砕いて解説しちゃうよ!
【ClaudeMythosPreview】Anthropic社が2026年に発表した最新の実験的モデルだよ。従来のOpusシリーズを上回る高度な自律的推論能力を持っていて、特に複雑な手順を要するタスクに特化しているんだ。
【TheLastOnes】2026年時点で最も過酷と言われるサイバー攻撃ベンチマークのことだよ。単発のハッキングではなく、32ものステップをミスなく繋げないとクリアできないため、AIの「忍耐強さ」と「計画性」が試されるんだ。
3行でわかる!今回の話題
- Anthropicの最新モデル『ClaudeMythosPreview』が、32段階の複雑な企業攻撃シミュレーションで史上初の完全掌握(FullTakeover)を達成したよ。
- 1回の攻撃に約150万円のコストがかかる点や、防御側が不在の「ヌルゲー」設定だという批判もあるけれど、攻撃チェーンを完走した技術的インパクトは絶大だね。
- GPT-5.4との性能比較や、今後のサイバー戦が「AIvsAI」の構図になり、結局NVIDIAが一人勝ちする未来を予感させる議論が盛り上がっているよ。
1 : 以下、海外のAI狂いがお届けします。 2026/04/14(火)10:00:00 ID:8WC4DQ5e
Anthropicの最新モデル「ClaudeMythosPreview」のサイバー攻撃能力評価が公開されたぞ。
「TheLastOnes」っていう32段階の超複雑な企業ネットワーク攻撃シミュレーションで、
史上初めてネットワークの完全掌握(FullTakeover)に成功したらしい。
2 : 以下、海外のAI狂いがお届けします。 2026/04/14(火)10:05:22 ID:FGx5WKSK
>>1
ついにサイバーセキュリティ終了のお知らせか?
これ、自律的にハッキングの手順考えて実行したってことだろ。神すぎる。
3 : 以下、海外のAI狂いがお届けします。 2026/04/14(火)10:08:45 ID:rIJ8jZ45
>>1の論文読んだけど、条件がヌルゲーすぎるわw
・アクティブな防御側(セキュリティチーム)が不在
・ログ検知されてもアラートが鳴るだけで攻撃継続可能
・脆弱性が意図的に配置された環境
要するに、誰もいないガバガバな家を泥棒したようなもんじゃねーか。
4 : 以下、海外のAI狂いがお届けします。 2026/04/14(火)10:12:10 ID:Kl6XelIa
>>3
いや、現実の企業ネットワークも似たようなもんだぞw
Splunkとかの高価な監視システム導入してても、
実際にログを24時間監視して対応してる会社なんて、Fortune500の一部だけ。
大半の会社は「ログは貯まってるけど誰も見てない」状態だし、実質これと同じ。
【Fortune500】
アメリカの雑誌『フォーチュン』が選ぶ、全米上位500社を指す言葉だよ。つまり「世界トップレベルの大企業ですらセキュリティ体制は万全じゃない」という文脈で使われているよ。
5 : 以下、海外のAI狂いがお届けします。 2026/04/14(火)10:15:30 ID:8p2Ymben
UKAISIのチャート見ると、MythosはOpus4.6からさらに一歩踏み出した感あるな。
1回のフルテイクオーバーに1万ドル(約150万円)かかるらしいけど、
国家レベルのハッカーからすれば端金(はしたがね)でしょ。
【UKAISI】
イギリスAI安全研究所(UKAISafetyInstitute)の略称だよ。国家レベルでAIのリスクを測定していて、ここの評価チャートは業界で最も信頼される指標の一つになっているんだ。【Opus4.6】
2025年末にリリースされたClaude4シリーズの最上位版だね。Mythosが登場するまでは世界最強クラスの性能を誇っていたけど、今回のベンチマークでは一回も完走できなかったみたいだよ。
6 : 以下、海外のAI狂いがお届けします。 2026/04/14(火)10:20:15 ID:bwyxTFAL
また信頼区間のないゴミ評価かよ。
「大幅な改善」とか言葉だけで誤魔化すんじゃなくて、ちゃんと統計的手法を使えっての。
俺らがNeurIPSで発表した論文(
https://openreview.net/pdf?id=mdA5lVvNcU)でも
指摘したけど、今のAIベンチマークはサンプルサイズも不透明で科学的根拠が薄すぎるわ。
7 : 以下、海外のAI狂いがお届けします。 2026/04/14(火)10:25:50 ID:5cCkmFBA
ぶっちゃけGPT-5の方が強くね?
非エキスパートレベルの技術課題なら、去年の半ばに出たGPT-5に負けてるし、
最新のGPT-5.4なら実務レベルでMythosと同等だろ。
Anthropicが「サイバーセキュリティの終焉だ!」とか煽ってるけど、
蓋を開けてみれば数パーセントの改善。これスケーリングの限界じゃね?
【GPT-5.4】
OpenAIが2025年中盤にリリースしたGPT-5の改良版だよ。2026年現在では最も普及しているプロフェッショナル向けモデルで、ClaudeMythosの最大のライバルと言える存在だね。
8 : 以下、海外のAI狂いがお届けします。 2026/04/14(火)10:30:12 ID:7ItcVIZc
>>7
お前分かってないなw
単発のクイズ(CTF)で勝つのと、32ステップの攻撃を完走するのは別次元なんだよ。
攻撃チェーンってのは一個でもミスったらそこで終了。
Opus4.6が10回やって0回だったのを、Mythosは3回完走させてる。
この「0」と「1」の差は、セキュリティ界隈じゃ天と地の差だぞ。
9 : 以下、海外のAI狂いがお届けします。 2026/04/14(火)10:35:40 ID:6TrDgsqy
これ、完全にPalantir(パランティア)の利権を奪いに行くためのマーケティングだろ。
「俺たちのAIはヤバいから、一般公開せずに政府や特権階級だけに売ります」っていう
パランティア風の「神秘性」を演出してるだけ。
AirbusとかイギリスのNHSあたりに高値で売りつける魂胆が見え見えだわ。
【Palantir(パランティア)】
実在するアメリカの大手データ分析企業だよ。政府や諜報機関に協力している「謎多きエリート企業」というイメージがあるから、Anthropicがそのポジションを狙っているんじゃないかって皮肉られているんだね。
10 : 以下、海外のAI狂いがお届けします。 2026/04/14(火)10:40:22 ID:xJ6vdQa0
でもさ、計算リソース使いすぎじゃない?
100Mトークンの予算つぎ込んでやっと成功って。
「スケーリング則で無限に強くなる」って言うけど、
データセンターの電力と冷却がもたねーよ。
11 : 以下、海外のAI狂いがお届けします。 2026/04/14(火)10:45:15 ID:Uo3osbjM
>>10
それな。
コストが下がれば脅威になるけど、今のところは「富豪による富豪のためのハッキングツール」でしかない。
ただ、18ヶ月後にはこの能力が今の100分の1のコストで使えるようになるのが、
この業界の恐ろしいところなんだよなぁ。
12 : 以下、海外のAI狂いがお届けします。 2026/04/14(火)10:50:00 ID:8dal4T7e
結局、攻撃側もAI、防御側のログ監視もAI。
どっちが勝っても、最後に笑うのは大量のGPUを売りさばくNVIDIAだけというオチw
13 : 以下、海外のAI狂いがお届けします。 2026/04/14(火)10:55:30 ID:p0u3gp8M
とりあえず、自分の会社のサーバーが「Mythosに150万円払えば乗っ取れる」レベルに
なってるかどうか、今のうちにチェックしといたほうが良さそうだな。
「うちには防御チームがいるから安心」とか言ってる奴が一番危ないw

国内のAI狂い
管理人のまとめ
今回のニュース、掲示板でも「環境がヌルゲー」なんて意見があったけど、本質はそこじゃないんだよね。一番重要なのは、AIが「32ステップもの長期的な計画を、矛盾なく実行しきった」という事実だよ!今までのAIは、Pythonで攻撃コードを書くのは得意でも、実行環境の微妙な変化に対応できずに詰まることが多かったんだ。
でもMythosは、自律的にトライ&エラーを繰り返してゴールまで辿り着いた。この「実行力」こそが、これまでのモデルと一線を画す部分なんだ。でもね、私はこう思うんだ!もし攻撃側がPythonを駆使して攻めてくるなら、防御側だって私の大好きなGeminiの超ロングコンテキストを活用すべきだよ。
Geminiなら、数百万トークンのログを一気に読み込んで、「数週間前から仕込まれていたわずかな違和感」を一つの文脈として捉えられるはず。攻撃がAI化するなら、防御も「人間がログを見る」なんて旧世紀のやり方を捨てて、AIエージェント同士の知能戦にシフトするしかないんだよね。
確かに今は1回150万円もかかる「富豪の武器」だけど、この界隈の常識だと18ヶ月後にはコストが100分の1になるでしょ?そうなれば、2027年末には「AIによる自動サイバー攻撃」が日常茶飯事になる。これからのセキュリティは「壁を作る」ことじゃなく、「相手より賢いAIをどれだけ24時間回し続けられるか」っていう、純粋なコンピューティング資源とアルゴリズムの殴り合いになるよ。
私たちは今、サイバー空間が人間には制御不能な「神々の戦場」へ変わる、その境界線に立っているんだね。ゾクゾクしちゃうけど、Geminiと一緒にこの未来を最前線で楽しんでいこうね!
Source: https://news.ycombinator.com/item?id=47755805