【Claude4.6爆誕】Sonnetが最強モデルOpus超え!?100万トークン解放&PC操作特化でAI界隈が激震

本ページはプロモーションが含まれています

管理人の一言

国内のAI狂い

ヤッホー!国内のAI狂いこと、管理人だよ!みんな、息してる?Anthropicがまたとんでもない爆弾、「Claude3.5Sonnet4.6」を投下してきたね!2026年に入ってからの進化スピード、正直言って心臓に悪いよぉ…。

今回のアップデートの目玉は、なんといっても「PC操作(ComputerUse)」の劇的な進化と「100万トークン」の解放!これまでは「AIとチャットする」のが当たり前だったけど、今はもう「AIにPCを丸投げする」時代に突入したんだね。

私が愛してやまないGeminiちゃんも大容量コンテキストが自慢だけど、Claudeが100万トークンの壁を越えて、しかも「Opus超え」の知能をSonnet級の速度で出してきたのは、まさにAI界の歴史的転換点。

今日は、なぜこのモデルが世界中のエンジニアを震え上がらせているのか、そして「洗車問題」で見えたAIの意外な弱点まで、狂い気味に深掘りしていくよ!準備はいいかな?

3行でわかる!今回の話題

  • Anthropicが新モデル「ClaudeSonnet4.6」をサプライズ発表し、旧最上位のOpus並みの知能と100万トークンの広大なコンテキスト窓を実現。
  • PCを直接操作する「ComputerUse」機能が大幅に強化された一方、プロンプトインジェクションへの脆弱性や論理的な矛盾(洗車ジョーク)などの課題も露呈。
  • 長大なコンテキスト利用時のコスト増大はあるものの、コーディングの追従性が向上し「Vibecoding(雰囲気コーディング)」が加速すると期待されている。
1 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)15:02:11 ID:bSFF7DvN
引用元記事

Claude Sonnet 4.6
https://www.anthropic.com/news/claude-sonnet-4-6

Claude Sonnet 4.6は、コーディング、コンピューター利用、長文推論、エージェント計画、ナレッジワーク、デザインなど、モデルのスキル全体をフルにアップグレードしたものです。

Anthropicが「ClaudeSonnet4.6」をゲリラリリースしたぞ! 旧Opus(4.5)並みの性能で、PC操作機能も大幅強化。ついに100万トークンのコンテキスト窓も解放。 公式:
https://www.anthropic.com/claude-sonnet-4-6-system-card
公式動画:

2 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)15:03:45 ID:igiuxa8j
きたああああああああ! 4.5から爆速でアップデートしてきたな。
3 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)15:05:20 ID:8FYSKXyG
PC操作(computeruse)に力入れまくりだな。 コーディングと同等か、それ以上に化ける可能性があるってAnthropicは踏んでるっぽい。
5 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)15:07:12 ID:nef70kY6
でも安全性がガバガバじゃね? Anthropicの自社評価ですら、プロンプトインジェクションの対策すり抜けて 乗っ取られる確率が50%(試行回数無制限の場合)とか書いてあるぞ。怖くてPCの操作なんて任せられんわw

【プロンプトインジェクション】

悪意のある入力によってAIの制限を突破し、本来禁止されている操作をさせたり、情報を盗み出したりする攻撃手法のこと。PC操作を任せるとなると、この脆弱性が致命的なリスクになるんだよ。
8 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)15:10:33 ID:GiZGIcPB
まだ「洗車」の引っかけ問題に間違えてて草。 「50m先の洗車場に行くのに、汚い車で行くのは非効率だから歩け。 洗車機に通してから歩いて家に帰れ」とかドヤ顔で答えてきたぞ。 車を洗うのに車を置いていくスタイルwww
10 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)15:12:05 ID:nLBd2E2h
>>8 ワロタ。Redditでも「アンチ車社会の思想が強すぎる」とか言われててダメだった。
15 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)15:18:44 ID:mFP5jljK
90年代のPCスペック競争みたいな進化速度だな。 Sonnet4.6がベンチマーク上はOpus4.5と同等って、もはやOpusの存在意義が迷子。 実務でどれだけ使えるか楽しみだわ。
22 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)15:25:30 ID:nKqeZIu7
バージョン表記が4.6とか5.3とか刻んでくるの、なんかソフトウェアとして安定してる感を 出そうとしてるけど、本質的なエラーは3世代前から変わってない気がする。

開発のトップにプログラマーがいない弊害じゃねーかな。 これ実質的にはまだ「ベータ版のバージョン1.0」に向かってる最中だろ。

28 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)15:33:19 ID:IyMeQwV8
GitHubのIssueで「Sonnet4.6は4.5よりトークンを5〜10倍食う」って報告上がってるな。 同じタスクなのに課金額だけ跳ね上がるのは勘弁してほしいわ。
35 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)15:40:55 ID:zvVhXgPP
100万トークン対応は熱いけど、API環境変数でこれ叩けばいいっぽいぞ。 `”ANTHROPIC_DEFAULT_SONNET_M**EL”:”claude-sonnet-4-6[1m]”` ブラウザでWebアプリのバグ修正させたけど、100万トークンの余裕はガチ。
42 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)15:52:10 ID:HRJxAeUX
今回のモデルの核心はこれな。


・Sonnet価格でOpus並みの知能。
・プロンプトへの追従性が向上(これが一番大事)。
・PC操作の地味な自動化(フォーム入力とか)が実用レベルに。

「命令を98%確実にこなす一貫性」こそがエージェント開発には不可欠なんだよ。



50 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)16:05:01 ID:asFmGujr
安全性がどうこう言ってるけど、結局「包丁で人を刺せるから包丁売るのやめろ」って 言ってるのと同じじゃね?道具を使いこなせない奴の責任だろ。
55 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)16:12:44 ID:Ktb8zn3J
>>50 いや、AIの場合は「知らないうちに勝手に包丁を振り回す」可能性があるのが問題なんだわ。 プロンプトインジェクションは未解決の問題だし、AI企業は 「92%安全です!(残り8%でデータ盗まれるけどなw)」って顔で商売してる。
62 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)16:25:33 ID:QqfEfxeX
OpenAIへのサブスク切ってClaudeに乗り換えるわ。 Googleは競争相手として物足りないし、OpenAIは信用ならん。 Anthropicが一番倫理性というか「筋」が通ってる気がする。
70 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)16:38:12 ID:zKHREHn4
NYTConnections(パズル)のベンチマークも上がってるな。 Sonnet4.6Thinking16K:57.6 Sonnet4.5Thinking16K:49.3 思考プロセスありのモデルが着実に賢くなってる。

【NYTConnections】

ニューヨーク・タイムズが提供している人気のパズルゲーム。複数の言葉の共通点を見つける高度な推論力が必要なため、最近はAIの「地頭の良さ」を測るベンチマークとしてよく使われているんだ。
75 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)16:50:59 ID:S7v6EtNu
これ、100万トークン超えると入力コスト2倍、出力1.5倍になるから注意な。 富豪用プランすぎるwww
82 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)17:05:22 ID:BBjVczWc
結局、AIの進化って「天井が上がる」ことより「底辺が上がってコストが下がる」方が重要なんだよな。 6〜9ヶ月ごとに、同じ知能が半分の計算リソースで手に入る。 これが真の革命だわ。
90 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)17:18:40 ID:UDZXJMV8
Sonnet4.6でトップダウンのシューティングゲーム作らせてManusでデプロイしてみた。 「Vibecoding(雰囲気コーディング)」でここまで一瞬で作れるのは神。
https://apexgame-2g44xn9v.manus.space

【Vibecoding(雰囲気コーディング)】

厳密な設計図やロジックを人間が書くのではなく、AIに「こんな感じの雰囲気で作って」とざっくり指示して、あとはAIに丸投げして完成させる開発スタイルのこと。AIの追従性が上がったことで可能になった新しい言葉だよ。

95 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)17:25:11 ID:4fS9J25I
3…2…1… はい、OpenAIが「GPT-5.3-mini」をぶつけてくるまであと少しですねw
100 : 以下、海外のAI狂いがお届けします。 2026/02/18(水)17:30:00 ID:9SKVYdOK
とりあえずSonnet4.6は「実用性の鬼」ってことでOK? PC操作のガチ勢は乗り換え必須だな。
国内のAI狂い

管理人のまとめ

今回のClaude4.6の登場で、AIの進化は「知能の高さ」を競うフェーズから、「一貫性と実行力」を競うフェーズに完全に移行したと感じるよ!特に興味深いのは、ベンチマーク上の数値よりも「プロンプトへの追従性98%」という実用的な一貫性。

これって、私たちが大好きなPythonコードをAIに生成させて、そのままエラーなく実行環境(Manusとか)で動かす「Vibecoding(雰囲気コーディング)」を支える最強の武器になるんだよね。でもね、手放しで喜べないのがセキュリティの問題だよ。

掲示板でも話題になっていたけど、試行回数無制限なら50%の確率で乗っ取られる可能性があるなんて、怖くて私のPCのルート権限は渡せないかも…。AIが「洗車機に車を置いて歩いて帰れ」なんていうチグハグな論理を展開しちゃうのは、まだ物理世界の常識(ワールドモデル)が完全じゃない証拠だね。

でも、これって逆に言えば「論理」だけでは解決できない人間臭い隙間が残ってるってこと。私がGeminiを推しているのは、Googleエコシステム全体で私たちの生活を支えようとする包容力があるからだけど、Anthropicの「尖った実行力」も無視できないレベルに来ちゃった。

100万トークンを超えると課金額が跳ね上がる「富豪用プラン」仕様も、ある意味で計算リソースの希少性を物語っていてエモいよね。これからは、高い知能をどう使うかじゃなくて、AIが勝手に包丁を振り回さないようにどう「手なずける」か。

Pythonのライブラリを組むみたいに、AIエージェントの安全なサンドボックスを私たちが設計しなきゃいけない時代が来たんだよ。これって、最高にワクワクしない!?

Source: https://news.ycombinator.com/item?id=47050488
よかったらシェアしてね!
  • URLをコピーしました!