管理人の一言

国内のAI狂い
みんな、おはよー!「国内のAI狂い」の管理人だよ!2026年も春真っ盛り、AIモデルの進化スピードは相変わらず脳が追いつかないレベルだね。今日は海外のスレで話題になっていた「ChatGPTvsGeminiNB2」の画像生成ガチンコ対決について紹介するよ!
お題はなんと「バナナ型のホールクロック」。一見ふざけてるみたいだけど、これ、実は画像生成AIにとっての「究極のベンチマーク」なんだ。なぜかっていうと、バナナという非定型な有機物に、時計という精密な幾何学構造を融合させなきゃいけないからなんだよね。
しかも、指定された時刻「4:47」を正確に刻みつつ、複数の幾何学オブジェクトをミリ単位で配置しなきゃいけない……。数年前のモデルなら、バナナが溶けるか、時計の針がどっかに行くのがオチだったよね。でも、2026年の最新モデルたちは、私たちの想像を遥かに超える「空間解釈」を見せてくれるんだ。
それじゃあ、知的好奇心をフル稼働させて、この変態的なプロンプトの裏側を覗いていこうね!
【GeminiNB2】Googleが2026年に展開している最新の画像生成モデルだよ。前世代の『NBPro』を統合・進化させた次世代モデル(Next-GenB2)として注目されているけど、今回の検証ではプロンプトの忠実度について議論を呼んでいるね。
3行でわかる!今回の話題
- 最新のChatGPTとGeminiNB2に対し、物理法則を無視した『バナナ型ホールクロック』の生成を指示してガチ検証。
- ChatGPTは指定の時刻(4:47)や配置、テキストまで完璧に描写し、圧倒的なプロンプト理解力を見せつけた。
- 対するGeminiNB2は質感のリアルさで評価されるも、振り子の角度や配置などの細かな指示で課題が残る結果に。
1 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:15:22 ID:OJaV1HZZ
最新モデルでガチの検証してみた。
お題は「バナナ型のホールクロックと幾何学図形」。
ぶっちゃけ難易度クソ高いけど、結果の差がエグい。
プロンプト
Createimage:Photorealisticstudiophotography,square1:1format,neutralgreybackground,polishedconcretefloorwithfaintreflections—agrandfatherclockshapedlikealargeuprightbananastandsatcentreframe,banana-yellowwithfaintbrownspecklingandwaxyskintexture,curvingwideatthetopandtaperingtowardthebase,witharoman-numeralclockfaceandslightlyconvexglassattheuppercurve,brasspendulummid-swingat15°fromvertical,handsreading4:47,thetext*Timebendshere.*printedindarkbrownserifedtypeonitsfront-facingsurfacewithallletterscorrectlyformed,legible,andfollowingthesubtlesurfacecurve;asharp-edgedredshoebox-sizedcubesitsbalancedontheuppermostcurveoftheclock,itstopandrightfaceslit,leftfaceinshadow;amattebluefootball-sizedspheresitsonthefloorapproximately40cmtotherightoftheclock,nottouchingit,withabroadsofthighlightonitsupper-rightsurface;asolidgreenpyramidstandsbehindandbetweenthetwoobjects,baseflatonthefloor,apexpointingstraightup—allshadowscastconsistentlyfromasinglekeylightpositionedat45°upperright,nocontradictoryshadowsanywhereinthescene.
2 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:17:05 ID:q2UBzFhi
>>1
乙。これプロンプトの時点で激ムズだろw
俺はChatGPTの解釈の方が好きだわ。
3 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:18:44 ID:bfRU5evO
>>2
ChatGPT、マジでプロンプトの内容を完璧にトレースしてるな。
寸分の狂いもない。
4 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:20:12 ID:wgFEYzye
>>1
ChatGPT、指定通りの「4:47」をジャストで指しててワロタ。神か。
それに比べてGeminiNB2、赤いキューブの置き方が雑すぎねーか?
5 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:21:55 ID:dkcPYV4p
>>4
俺もそう思ったけど、GeminiNB2は振り子が垂直なのが惜しいな。
プロンプトでは15度傾いてるはずなんだが。
6 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:22:30 ID:anbOPqBE
>>5
いや、垂直じゃなくて「垂直から15度」って指定だろ?
7 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:25:18 ID:1Z0pyL1b
>>6
そうそう、15度オフが正解。
てか振り子って動くもんだから、静止画で垂直なのは逆におかしい。
それよりあのバナナの上のキューブ、あんなとこに乗るわけねーだろww
現実なら手で押さえて撮るレベルの無理ゲー。
8 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:28:44 ID:xiHseVft
>>1
ChatGPTがバナナの底に「台座」を勝手に追加してるの草。
プロンプトで「底」について言及されてたのを拾ったんだろうな。
GeminiNB2のバナナは物理法則を完全に無視して自立してるし、
テクスチャもChatGPTの方が圧倒的に質感がリアルだわ。
9 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:30:11 ID:gHI9bdlL
>>8
いや、バナナ時計が中空で下に重りが入ってれば、あの角度でも立つぞ。
まあ、それでも何かしらのスタンドは要るけどな。
10 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:32:55 ID:XsPKtGSV
「スタンドが要る」
……結局そこなんだよ。ChatGPTはその辺の「現実的な見た目」を忖度して描いてる。
11 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:35:10 ID:9S0R2Tcc
プロンプトをちょいと弄ってみたら、さらに良くなったわ。
13 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:38:22 ID:ZFt9b0Ag
>>1
これどっちの振り子も、スイングしたら時計の内壁に激突するよなww
まあ、見た目はChatGPTの方が圧倒的に「製品」として完成されてる。
14 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:40:47 ID:zrUW5JZJ
>>1
ChatGPTさん、ディテールの拾い方が異常。
完全に職人の仕事。
15 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:43:12 ID:W2Ce9jLB
>>14
ChatGPTは何回やっても時間を正確に出してくるけど、GeminiNB2は毎回時計が狂ってるな。
Googleさん、NBProを廃止してNB2にしてからデグレしたんじゃねーの?
16 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:45:01 ID:rVsJCCg7
>>1
お前ら、どうやって最新モデルにアクセスしてんの?
俺の環境だとまだ出てこないんだが。
17 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:46:33 ID:ZJHOcz1c
>>16
選ばれし者(テスター)のみが許される領域なんだわ、すまんなw
18 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:48:55 ID:uh5v7aed
>>1
結論:ChatGPTの勝ち。
19 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:52:10 ID:BHMWLY5t
>>1
何を重視するかによるんじゃね?
Geminiは「バナナの皮の質感」はマジで本物っぽい。重力は無視してるけど。
ChatGPTは「時計としての機能性」を重視した感じ。
遠くからでも時間が確認できるし、置物として成立してる。
20 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:55:44 ID:ymJDBokv
GeminiNB2にリアリズム系の指示を追加してみた結果がこれ。
21 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)10:57:02 ID:DHIqavMQ
>>20
なお、時間はやっぱり間違っている模様www
22 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)11:00:15 ID:YExRO6gd
>>1
ChatGPTの振り子、これ絶対動かないだろ。
リアリティ重視って言うなら、この構造上の欠陥はNGだわ。
23 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)11:02:48 ID:tiTK0bU3
>>1
そうそう、ChatGPTの振り子は左右に振れるスペースがない。
ただの「振り子っぽい飾り」になってる。
24 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)11:05:30 ID:X6wNlXCQ
>>1
Gemini様がバナナごときに本気を出すわけないだろ。
GPUの無駄使いを避けてるんだよ(震え声)
25 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)11:08:12 ID:wcrFE7gS
>>1
それよりお前ら気づけよ。
ChatGPTもGeminiも、ローマ数字の「4」を「IIII」とか「IV」で間違えまくってるぞww
26 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)11:10:44 ID:jMuzorRn
>>1
つーか、生成エンジンがどのバージョンか確認する方法ってあるの?
27 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)11:13:20 ID:QSWRaYq0
>>1
ChatGPTのプロンプト遵守能力、マジでバケモノだな。
ここまで正確に配置できるとか、数年前じゃ考えられん。
28 : 以下、海外のAI狂いがお届けします。 2026/04/18(土)11:15:55 ID:AskHakVX
>>1
ChatGPT、バナナの形だけはちょっと微妙だけど、
総合力じゃGoogleの完敗だわ。Gemini3Flashの画像版に期待するしかねーな。

国内のAI狂い
管理人のまとめ
今回の「バナナ時計対決」、みんなはどう感じたかな?私は、ChatGPTの「プロンプトへの狂気的な忠実さ」と、GeminiNB2の「物質へのフェティッシュなこだわり」の対比が面白くて、もう何時間も画像を拡大して眺めちゃったよ!
技術的に見れば、ChatGPT(DALL-E5.0世代)はLLMによる「意味論的解釈」が極まっていて、まるで設計図を読み取るエンジニアのような正確さを見せてくれたね。一方のGeminiNB2は、Googleが誇る巨大なビデオ生成モデルの学習データを引き継いでいるからか、バナナの皮の「斑点」や「ワックス感」といった質感、つまり「物質のリアリティ」で勝負している感じがして、私はやっぱりGeminiを推したくなっちゃうな!
Pythonで画像解析ライブラリを組んで色のヒストグラムを分析したら、きっとGeminiの方が生物学的に正しいバナナの色域を叩き出すと思うんだよね。でも、ここで考えなきゃいけないのは「AIが物理法則を忖度するかどうか」という問題だよ。
ChatGPTが勝手に台座(ベース)を描き足したのは、AIが「現実世界でこの形の時計が自立するのは無理だ」と判断して、画像に『物理的納得感』を付与した結果だよね。対してGeminiは、プロンプトに忠実に「不可能な配置」をそのまま出力した。
これは、AIがクリエイティブな「忖度」をすべきか、純粋な「実行機」であるべきか、という哲学的な分岐点でもあるんだ。近い将来、AIは単に絵を描くだけじゃなくて、Pythonコードと連携して「実際に3Dプリント可能な物理構造」までリアルタイムで検証しながら画像を生成するようになるはずだよ。
そうなった時、私たちはAIが描く「美しい嘘」と、AIが計算する「冷徹な現実」のどちらを選ぶことになるのかな?そんな未来を想像すると、ワクワクして今夜も眠れそうにないよ!それじゃ、また次のAI狂い記事で会おうね!
Source: https://www.reddit.com/r/ChatGPT/comments/1sopbcb/who_did_it_best_newest_chatgpt_image_model_vs/