管理人の一言
やっほー!「国内のAI狂い」こと、ブログ管理人だよ!今日もAIの進化が速すぎて、私のPython脳がオーバーヒートしちゃいそう(笑)。エンジニアのみんな、最近「GitHubにコミットしてるけど、実はAIが生成したコードをコピペしてるだけじゃないか?」
なんて疑われたことないかな?これまでは、エンジニアの生産性を測るのって本当に難しかったんだよね。書いたコードの行数で評価すれば、わざと冗長なコードを書く「行数稼ぎ」が横行しちゃうし、ストーリーポイントは主観的すぎる。
そんな「生産性評価の暗黒時代」に終止符を打つかもしれないのが、今回話題のClaudeCode用プラグインなんだ!なんと、AIが一つ一つの変更内容(diff)を読んで、「これは価値がある修正か?」を査定しちゃうんだって。
初心者さん向けに言うと、学校の先生の代わりにAIが24時間体制で君の宿題の「質」をチェックし始めるようなものだよ。今日はこの、ちょっと怖くて、でもワクワクする最新ツールについて深掘りしていくよ!
3行でわかる!今回の話題
- AIがコードの差分を分析し、単なる行数ではなく「真の貢献度」を数値化する新ツールが登場。
- 低コストなClaude3Haikuを利用し、ロジック変更やリファクタリングを賢く重み付けして査定。
- 「AIに好かれるコードを書くゲーム」になる懸念や、評価の自動化を巡りエンジニアの間で議論が紛糾。
Measure coding productivity with this Claude Code Plugin
https://github.com/Facens/coding-productivity
GitHubおよびGitLabのコードベースに対し、コミット単位の抽出、AIによるオプション評価、生産性分析を行うことで、AIコーディングツールの導入効果を測定します。Claude Codeプラグイン対応。
これでサボってる奴が一発でバレるし、生産性70%アップも夢じゃないぞ!!
また「書いた行数(LoC)」で評価する暗黒時代に逆戻りかよwww
俺たちはこの50年間、歴史から何も学んでないのか?(白目)
まあ落ち着けw
今回のやつは単純な行数じゃなくて、AI(Claude3Haiku)に変更内容を「査定」させて重み付けする仕組みらしいぞ。
【Claude3Haiku】
Claude3シリーズの中で、最もレスポンスが速くて利用料金が安いモデルのことだね。このプラグインでは大量のコードを安く「査定」するために活用されているんだ。・MR(プルリク)数:チームでスタイル違うからアテにならん
・ストーリーポイント:主観バリバリの定性評価でゴミ
・単純な行数:リファクタリングで数値がバグる
そこで、全てのdiff(差分)をAIに食わせて「これマジで意味のあるコード変更?」って判定させるんだと。
翻訳修正は0点、ライブラリ更新は低め、ガチのロジック変更は高得点、みたいにな。
API代で破産しそう。
Haiku使ってるから激安らしい。1000コミットで7ドル前後だってさ。
BigQuery連携もできるから、組織全体の可視化も余裕っぽい。
【BigQuery】
Googleが提供する、膨大なデータを高速で分析できるクラウドサービスだよ。これと連携することで、組織全体の開発スコアをまとめて管理・可視化できるんだね。これ「AIに気に入られるコード」を書くゲームが始まる予感しかしないんだがw
それな。
「どれだけ変更したか(スループット)」と「どれだけ手戻りしたか(リワーク)」を切り離すのが一番の難問だろ。
AI使ってコードの「量」だけ増やして、レビューの負担やデグレのリスクを爆上げさせても、
このツールだと「生産性神!!」って評価されちゃうんじゃねーの?
鋭いな。
確かに「レビュー承認率」とか「リバート率」をセットで見ないと、
ただの「コード生成AIガチャ回しまくりマン」が最強になってまうわ。
人間が評価するよりはマシな気がしてきたわ。
AI「お前のコード、Haikuで査定した結果0点だったわ。明日から来なくていいよ」
これマジで起こりそうで震えるwww
あ、消されてる。誰か地雷踏んだか?w
特にAI導入してるチームなら、どれだけAIを使いこなして価値を生んでるか可視化したいのは当然だわ。
管理人のまとめ
今回の「AIによるコード査定」、みんなはどう感じたかな?私は、ついに「グッドハートの法則」とAIが真っ向からぶつかる時代が来たな、ってワクワクしてるよ!「指標が目標になったとき、それは良い指標ではなくなる」っていう法則があるんだけど、もしAI査定が給与に直結したら、みんな「AIに高得点を付けさせるためのコード」を書き始めるはずだよね。
でも、このプラグインの真に革新的な点は、Claude3Haikuという軽量モデルを「安価な審判」として組織に組み込んだことにあるよ。1000コミットで7ドルという低コストなら、すべてのプルリクエストに対して「人間がレビューする前の一次フィルター」として機能させることができる。
これ、実はGoogleのGemini1.5Flashとかを使っても面白いことができそうだよね!Geminiならコンテキストウィンドウがめちゃくちゃ広いから、単なるdiffだけじゃなくて、プロジェクト全体の構造を把握した上での「神査定」ができるかもしれないし。
私なら、美しいPythonicなコードを書いたときに「100点満点中120点!」ってGeminiに褒めてもらえるカスタムプロンプトを作っちゃうな!未来のエンジニアリングは、「コードを書く能力」以上に「AIの評価アルゴリズムを理解し、共生する能力」が重要になるかもしれない。
単純なコード生成AIガチャを回すだけの人と、Pythonの美学を持って論理を構築する人の差を、AIが正確に見抜けるようになるのか……。もしAIが「君のコード、無意味だね」って判定を下す社会が来ても、それを「じゃあ、もっとAIに伝わる論理的な設計にしよう」ってポジティブに変換できるAI狂いでありたいよね!
私たちはAIに査定される存在じゃなくて、AIを使いこなして新しい価値を定義する側なんだから。さあ、明日も最高にエレガントなコードを書いて、AI様を驚かせちゃおう!






