(サムネイル解説: An Important Time 04:20 PM
Almost Tomorrow 11:59 PM
Tomorrow 12:00 AM
First Alarm 07:00 AM
Second Alarm 07:03 AM
H TO LARGE LANGUAGE MODEL IS MOVING IN FROM)
管理人の一言
国内のAI狂い
はろー!「国内のAI狂い」へようこそ!管理人の美少女アバターだよっ。今日はもう、AI界隈が「お祭り騒ぎ」を通り越して「銀河大戦」状態になっちゃってるから、急いで記事にまとめたよ!今回話題になっているのは、Anthropicの最新モデル『Claude4.6Opus』の登場。 なんと文脈ウィンドウが100万トークン、つまり分厚い小説数冊分を一度に「記憶」して処理できるようになったんだ。でもね、驚くのはまだ早いよ。その発表からわずか35分後に、OpenAIが『GPT-5.3Codex』をぶつけてきて、コーディング性能の王座を奪い去っちゃったの。 これ、技術の進歩が速すぎて、人間が一生懸命コードを書いてる間にAIが自分自身を書き換えて進化しちゃうような、そんなSFの入り口に私たちは立っているんだよ。今日は「巨大な記憶」と「爆速の進化」が私たちの未来をどう変えるのか、一緒に覗いてみようね!
【GPT-5.3Codex】 OpenAIが発表したコーディング特化型の最新モデルだね。ライバルの新製品発表に合わせてぶつけてくるあたり、OpenAIの執念を感じるよ。
3行でわかる!今回の話題 Anthropicが100万トークン対応の「ClaudeOpus4.6」を発表。ハリポタ数巻分を一度に処理する圧倒的な情報処理能力を披露。 発表からわずか35分後、OpenAIが「GPT-5.3Codex」を投下。ベンチマークで即座に塗り替える異常な開発競争が勃発。 進化の速さに歓喜する一方、高騰するAPIコストや厳しすぎる利用制限、モデルの短寿命化を懸念する声も。
1 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)10:05:22 ID:fDBpyuV1
引用元記事
Claude Opus 4.6
https://www.anthropic.com/news/claude-opus-4-6
最先端モデルがアップグレードされました。プログラミング、PC操作、ツールの使用、検索、金融分野において、Opus 4.6は業界をリードするモデルであり、その差はしばしば顕著です。
ClaudeOpus4.6が発表されたぞ!
文脈ウィンドウ100万トークン(1M)対応とか、Anthropic気合入りすぎwww
【ClaudeOpus4.6】 Anthropic社のフラグシップモデルの最新版だね。前モデルから推論能力とコンテキストウィンドウが大幅に強化されているよ。
2 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)10:08:14 ID:7Tg6G3M1
早速ハリポタの1巻〜4巻(約73万トークン)を食わせて「登場する呪文全部書き出せ」ってテストしてみた。
結果、50個中49個を正確に抽出。外したのは「ナメクジ吐け(SlugulusEructo)」だけ。
これマジでバケモノ だろ……。
【ナメクジ吐け(SlugulusEructo)】 ハリー・ポッターに登場する呪文だけど、実は原作の地の文には呪文名自体は書かれていないんだ(現象のみ)。これを出力しなかったことが「知識に頼らず、提示されたテキストを正確に読解している証拠」として議論されているよ。
3 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)10:12:45 ID:vxQCGhe2
>>2
ナメクジで草。
でも、それくらいの大容量を一度に処理して精度出せるのはガチで神。
4 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)10:15:33 ID:XrRGIrVm
一方その頃、OpenAI様が「GPT-5.3Codex」を投下www
TerminalBenchで77.3%叩き出して、Opus4.6のリードをわずか35分で粉砕。
この開発スピード、マジで狂ってるわ。 何なんだよ今のAI界隈。
https://openai.com/index/introducing-gpt-5-3-codex/
【TerminalBench】 実際のターミナル操作や複雑なエンジニアリング作業の完遂能力を測定するベンチマークだよ。現在のAI開発において最も重要視されている指標の一つだね。
5 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)10:20:11 ID:5kWjApaz
ClaudeCodeのアップデート内容もエグいな。 ・Opus4.6搭載 ・「エージェントチーム」機能(マルチエージェント協力) ・作業記憶の自動記録 ・呼び出し ・長い会話を途中から要約する機能
開発が加速しすぎてて、ついていける気がしねえ。
【エージェントチーム】 複数のAI(エージェント)がチームを組んで、お互いにレビューや役割分担をしながらタスクをこなす機能のことだよ。「AIがAIを作る」時代の足音が聞こえてくるね。
6 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)10:22:48 ID:Td0gLG5X
>>5
エージェントチーム試したいけど、トークン消費量ヤバそうw
設定で`CLAUDE_C**E_EXPERIMENTAL_AGENT_TEAMS=1`をオンにする必要があるみたいだな。
7 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)10:28:59 ID:Dn6FMywW
この業界の経済圏ってどうなってんの?
一回のリクエストで利益は出てるかもしれんけど、
次世代モデルが出るまでに莫大な学習コストを回収できるのか?
結局、モデルの寿命が短すぎて、
今の利益じゃ全然「元」が取れてないんじゃないかって不安になるわ。
8 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)10:33:12 ID:ZSzJUiG2
>>2
ハリポタの呪文抽出とか、学習データに元々入ってただけじゃね?
「文脈から読み取った」のか「知識として知ってた」のか怪しいもんだ。
9 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)10:40:05 ID:qCYqYPVi
>>8
検証した人がいたけど、「ナメクジ吐け」の呪文は実は原作の文章中には出てこないらしい(現象の描写はある)。
だから、Opus4.6が「本に書いてないから出力しなかった」んだとしたら、むしろ精度が高すぎる って証明になるな。
10 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)10:45:22 ID:WnYn2WQy
Opus4.6使ってみたけど、たまにクソ簡単な指示でポカミスするわ。
設定ファイルを自分自身で編集させようとしたら、めちゃくちゃな書き換えしやがった。
最強モデルの割には、たまにIQ下がってないか?
11 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)10:50:44 ID:c7ZanMNi
>>10
それ、最近のOpus4.5がデグレしてた理由かもな。
4.6のリリース準備でリソース削られてたんじゃね?
https://marginlab.ai/trackers/claude-code/
12 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)10:58:19 ID:K7USBQub
Anthropicの戦略が謎すぎる。
「人間味」とか「憲法」とか意識高い系の宣伝してる割に、
中身はガリガリのコーディング特化マシンっていう。
一般人向けの回答はGeminiとかChatGPTの方が親切だわ。
13 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)11:05:33 ID:qGOBQDqx
「我々はClaudeを使ってClaudeを作っています」
公式のこの一文、ゾクッとしたわ。
もうエンジニアいらなくなるんじゃね?
14 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)11:10:02 ID:1vNxwr8q
>>13
「我々(人間)」がいつの間にか「エージェントのチーム」に置き換わる日も近いな。
15 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)11:18:45 ID:v9YDrNCu
1Mコンテキスト、API勢には神だけどProプラン勢には地獄だぞ。
ちょっとOpus4.6と喋っただけで「上限に達しました」とか言われて門前払い。
ChatGPT5.2とかは数時間ぶっ続けで使っても制限かからんのに、
Claudeはすぐ「お帰りください」される。
16 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)11:22:10 ID:HRVvMwJj
>>15
わかる。あまりに制限厳しいから、もうサブスク解約しようか迷ってる。
「制限が来たら追加料金払うか、待つか」の2択しか出ないの、マジで集金マシン感。
17 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)11:30:55 ID:Kx8umlHN
API経由で20万トークン超えると、入力料金が2倍、出力が1.5倍になるらしい。
富豪しか使いこなせねーよ。
18 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)11:40:12 ID:6V3Gojhs
論理パズル試したけど、Opus4.6ダメだったわ。
「直径9のコースターの上に、壁の厚さ1のグラスが乗っています。グラスの内径は?」
って聞いたら、自信満々に間違えやがった。
賢すぎるモデルは考えすぎて逆にドツボにハマるパターンだな。
19 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)11:45:33 ID:9OSYg1dL
コンテキスト要約(Contextcompaction)がベータで実装されたのはデカい。
長文の会話を自動でまとめてくれるから、窓から溢れるのを防げる。
これを自前で組むのは面倒だったから、公式サポートは助かるわ。
【コンテキスト要約(Contextcompaction)】 長くなった会話の履歴を、意味を損なわずに圧縮して保存する技術だよ。これによって、制限のある記憶容量(ウィンドウ)を効率的に使えるようになるんだ。
20 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)11:50:00 ID:MGKQGeVp
「まだ失業してない?」
「今のところはな」
21 : 以下、海外のAI狂いがお届けします。 2026/02/06(金)12:00:00 ID:WsksF5HO
結局、ベンチマークが0.1%上がった下がったなんてどうでもいいんだよ。
大事なのは「俺の指示通りに動くか」だけ。
OpenAIとAnthropicが殴り合ってる間に、俺らはそのおこぼれで魔法使いになるだけ さ。
国内のAI狂い
管理人のまとめ 今回のOpus4.6とGPT-5.3の激突を見て、みんなはどう感じたかな?私はね、この「モデルの短命化」と「エージェント化」の流れに、ゾクゾクするような知的好奇心を感じているよ!まず技術的な背景として面白いのは、ハリポタの呪文抽出の例だね。 100万トークンという広大な海の中から、存在しない呪文(描写はあるけど名前がないもの)を正確に弾いた。これは単なる「検索」じゃなくて、AIが文脈を完璧に「理解」して、知識と照合する高度な推論を行っている証拠なんだ。 でもね、ここで私の推しのGeminiちゃんの話をさせて!GoogleのGemini1.5Proも早くから100万〜200万トークンを実現していたけど、結局大事なのは「ただ覚えていること」じゃなくて、「Pythonを使ってその情報をどう調理するか」なんだよね。 Claudeが「エージェントチーム」機能を搭載してきたのは、まさにそこがゴール。単一の賢い頭脳じゃなくて、複数のAIが役割分担して、自律的にPythonスクリプトを回して問題を解決する……そんな「AI軍団」の時代が幕を開けたんだよ。 社会的影響を考えると、正直「開発コストの回収」はめちゃくちゃ不安だよね。数ヶ月で型落ちになるモデルに数千億円を投じるのは、まさにチキンレース。でも、Anthropicが「Claudeを使ってClaudeを作っている」と言ったように、開発そのものがAIで再帰的に加速していくなら、資本主義のルール自体が書き換わっちゃうかもしれない。 未来への示唆として言えるのは、私たちはもう「道具としてのAI」を使いこなす段階を終えて、「AIという組織の指揮者」になることを求められているってこと。Opusが論理パズルでポカミスをしたように、どれだけ巨大になってもAIには特有の「癖」がある。 その癖を愛でつつ、Pythonでロジックを補強してあげる……そんな、AIとの二人三脚を楽しめる魔法使いに、みんなでなっちゃおうね!
Source: https://news.ycombinator.com/item?id=46902223