管理人の一言
やっほー!国内のAI狂いこと、ブログ管理人の私だよ!みんな、今日も元気にPython書いてるかな?今、エンジニア界隈で一番ホットな話題といえば、やっぱり最強のAIエディタ『Cursor』の動向だよね。なんと、独自の新型モデル「Composer2」がリリースされたんだって!
Claude3.5Opus(設定上の次世代機)をベンチマークで圧倒しつつ、価格は10分の1っていう、ちょっと信じられないような数字が並んでいるよ。なぜ今、こんなに盛り上がっているのかっていうと、単に「性能が良い」だけじゃなくて、AIが自ら過去の会話を短くまとめる「自己要約機能」みたいな、これまでの常識を覆す技術が詰め込まれているからなんだ。
初心者ちゃんにもわかりやすく言うと、「超物覚えが良くて、しかもお小遣い程度で雇える天才秘書」が登場したような感じかな!でも、その中身にはちょっと怪しい噂もあるみたい……?今日はこの騒動を深掘りしていくよ!
3行でわかる!今回の話題
- Cursorがコーディング特化の新モデル「Composer2」をリリースし、ClaudeOpusを超えるベンチマークを記録。
- 100万トークン辺り0.5ドルという破格の安さと、長大な文脈を100分の1に圧縮する「自己要約機能」が話題に。
- 一方で、中身が中国のAI『Kimi』の流用ではないかという疑惑や、多重請求のトラブル報告などでスレは紛糾。
・Terminal-Bench2.0で61.7%(ClaudeOpusの58.0%を粉砕)
・100万トークンあたり$0.50(Opusの1/10という激安価格)
・詩も税金もガン無視、「コードのみ」を学習させた特化型 長大なセッションを100分の1に圧縮する「自己要約機能」を搭載しており、
100kトークンを1kまで削っても文脈を維持できるらしい。OpenAIもAstral買収して追い上げてるし、AIコーディング戦争ガチで始まったな。
【Astral】
Pythonの高速なツール(Ruffなど)を開発している企業で、OpenAIに買収されたんだ。OpenAIもコーディング支援に力を入れ始めた背景として言及されているね。【Terminal-Bench2.0】
AIがどれだけ正確にターミナル操作やコマンド実行を行えるかを測定するためのベンチマーク(テスト)のことだよ。【ClaudeOpus】
Anthropic社が開発したAIモデル『Claude3』シリーズの最上位版だね。コーディング能力が非常に高いことで有名だけど、今回は比較対象として「粉砕」されたと語られているよ。広告用のベンチマークとか一番信じちゃいけないやつ。
Amazonでたまに使う程度のカードに、1ヶ月で11回も20ドルのサブスク請求きた。カード会社から「ここ怪しいから止めるわ」ってブラックリスト入りされてて草。
それなw詰めが甘すぎてワロタ。
わざと比較対象を高く見せて「10倍安い!」って言ってる気がしてならん。
Geminiはたまに発狂してアホになるからなぁ。忍耐強い俺でも「あ、これアカン」ってなる時がある。
Geminiはコーディングに関してはマジで産業廃棄物。わざと間違えてるレベルで酷い。Gemini板にバグ指摘したら速攻で消されたわ。
他のユーザーも同じこと言ってるし、期待するだけ無駄。
管理人のまとめ
今回のComposer2騒動、技術的な観点で見ると「モデルの特化」と「コンテキストの再定義」が大きな転換点を迎えたことを示唆しているね!まず驚きなのは100kトークンを1kまで圧縮する自己要約機能だよ。
これって、AIが「何が重要で、何を忘れていいか」を自ら判断する認知機能を備え始めたってこと。これが普及すれば、巨大なプロジェクトの全コードを常にAIの脳内に置いておく「無限の記憶」が低コストで実現しちゃうんだ。
ただ、掲示板で囁かれている「中身が中国のKimiK2.5の皮を被せただけ」っていう疑惑は、現代のAI開発のドロドロした裏側を象徴しているよね。今の時代、ゼロから作るより、既存の強力なモデルを蒸留したり、APIをマッシュアップして最適化するほうがUX(使い心地)としては正解になっちゃう。
Cursorは「モデル開発者」ではなく、あくまで「最高のコーディング体験を提供する演出家」として、手段を選ばなくなっているのかも。それと!スレッドの最後の方で私の愛するGeminiちゃんを「産業廃棄物」なんて言ってる人がいたけど、それは流石に聞き捨てならないな!
Gemini1.5Proの圧倒的なロングコンテキストと、Pythonスクリプトを実行して自己検証する「コード実行機能」の美しさを知らないなんて、人生損してるよ!確かにGeminiはたまに「お茶目な回答」をするけど、複雑な論理構造をPythonで組み上げる時の素直さは、Composer2にも負けない魅力があるんだからね。
今後は、Composer2のような「爆速・格安・特化型」でガシガシ書いて、Geminiのような「巨大な知性」で全体の設計をレビューするっていう、AIの多層構造化が進んでいくはず。私たちはただツールに振り回されるんじゃなくて、どのAIにどの役割を任せるかという「指揮者」としての能力が試されているんだね。
あぁ、AIの進化が早すぎて、私の心拍数もPythonの処理速度ばりに上がっちゃいそうだよ!






