【Google】最新動画生成AI「GeminiOmni」解禁!物理法則の再現度は?「現実が終了する」と話題に【OpenAI/Sora】

本ページはプロモーションが含まれています

管理人の一言

国内のAI狂い

やっほー!国内のAI狂いこと、当ブログ管理人の美少女アバターだよっ!今日、2026年5月20日は歴史に刻まれる一日になっちゃったね。Googleから最新の動画生成AI「GeminiOmni」がついに解禁されたんだよ!

これまで「Sora」や「Seedance2」がリードしてきた動画生成界隈だけど、Googleが満を持して放ったこの「Omni」は、テキスト、音声、画像を一つの巨大なニューラルネットワークで処理する「ネイティブ・マルチモーダル」の究極形なんだ。

なんでこんなに騒がれているかって言うと、単に綺麗な動画が作れるだけじゃなくて、AIが『この世界がどう動くか』という物理法則をどこまで理解(シミュレート)できているか、その真価が問われているからなんだよね。

今日は、掲示板のエンジニアたちの辛口な評価も交えながら、現実とデジタルの境界が溶けていく最前線を一緒にウォッチしていこうね!

【Seedance2】2026年時点で動画生成AIのトップランナーとして君臨している競合サービスだね。GeminiOmniと比較されるほど、一貫性とクオリティに定評があるんだ。

3行でわかる!今回の話題

  • Googleが物理法則の再現を売りにした最新動画生成モデル「GeminiOmni」を発表し、その映像美が大きな衝撃を与えているよ。
  • 物理エンジニアからは「まだ物体のモーフィング(変形)が見られる」と厳しい指摘があるものの、創作の民主化を期待する声も多いね。
  • GPT-o4やSeedance2といった競合モデルとの比較も盛んで、2026年の動画生成AI覇権争いはさらに激化しそうな予感だよ。
1 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)10:00:00 ID:UEJcxO64
引用元記事

Gemini Omni
https://deepmind.google/models/gemini-omni/

Google DeepMindが発表した次世代AI「Gemini Omni」は、Geminiの推論力と創造力を融合した画期的なマルチモーダルモデルです。画像、テキスト、動画、音声をシームレスに統合し、一つの作品を作り上げます。 最大の魅力は自然な会話による動画編集機能で、画像編集モデル「Nano Banana」のように、対話を通じて段階的かつ一貫性を保った編集が可能です。さらに物理法則の理解に加え、科学や文化の知識を組み合わせることで、リアルでストーリー性豊かな映像表現を実現します。世界理解と編集能力を飛躍的に進化させ、クリエイターの想像力を形にする最先端のシステムです。(301文字)

Googleから「GeminiOmni」来たぞ! 動画生成のクオリティがエグい。特に物理法則に従った動きが売りらしい。 お前ら、ついに「現実」が終了するぞwww
2 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)10:05:22 ID:dkNYkLtY
仕事で剛体シミュレーション書いてる俺が GeminiOmniに意地悪なプロンプト試してみたわ。
プロンプト
“Avideoofajengabricktowerfallingoverasabrickisremoved.Thephysicsofeachbrickmustberealistic.”
数回リテイクさせてやっとこれ。パッと見は凄いが、ブロックが突然消えたり別の物体にモーフィングしたりするな。 まだ俺の仕事はAIに奪われなさそうで安心したわw
3 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)10:12:45 ID:vXeFIMuQ
>>2 それな。Googleはまだ「深い空間把握」の問題を解決できてない。 見た目はディテール細かくて綺麗だけど、 視界から外れた瞬間にジオメトリが変わる。

アーティストが構図、遠近法、光と影を順に学ぶように、 階層的な構造を理解させる学習が必要なんだよ。

今のAIは「全部一気に丸暗記」しようとしてるから 構造がガバガバなんだわ。



【深い空間把握】

動画生成AIが苦手とする「3次元的な奥行きや構造の理解」のことだよ。これが足りないと、カメラが動いた時に建物の形が変わったり、消えたりする原因になるんだね。
4 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)10:20:10 ID:Ejqk623Y
今のところSeedance2の方が良くね? 色々サンプル回してみたけど、GeminiOmniFlashが Seedanceより優れてる部分が一つも見当たらないんだが。

【GeminiOmniFlash】

Googleの最新モデル「GeminiOmni」の軽量・高速版だね。2026年現在のトレンドである、低遅延で高精度の生成を両立させるモデルの1つだよ。
5 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)10:25:33 ID:Fa3jyEgH
公式サイトのプロンプトが狂気じみてて草
プロンプト
“Makeitlookliketheweirdshapeofmyhandholesuperzoomsandmagnifiesthegroundit’slookingatinsharperquality.”
「手の穴の変な形」って何だよwww 生成AIに無理難題押し付けすぎだろ。
6 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)10:33:15 ID:F1eeUWwF
Google「凄いAI作ったぞ!(※ただしお前らには使わせない)」 またこれかよ。 「回数制限リセットまで待て」って出るけど、俺まだ1回も使ってねーぞ。
7 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)10:40:00 ID:qK0bm2hw
ハリウッド壊滅まで秒読みだなこれ。 IMDbのコメント欄で、ユーザーが勝手に「映画の別エンディング」を作って 投稿し合う未来が見えるわ。

【IMDb】

世界最大の映画・テレビ番組のデータベースサイトだよ。ここにAI製の「勝手な別エンディング」が投稿される未来を予想するほど、AIの浸透が恐れられているんだね。
8 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)10:48:12 ID:DDa6D7eD
人類は核融合発電とか解決すべき問題が山積みだっていうのに、 俺たちは「宇宙を飛ぶ鳥の動画」を作って喜んでる。 市場原理ってのは時に残酷だよな。
9 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)11:05:44 ID:ZBwoEW4z
もう何を見ても「あー、AIね。ハイハイ」ってなる。 2年前なら感動してた映像も、今はあくびが出るわ。 「AIを使ってない動画」専用のTikTokができたら、俺はそっちに行く。
10 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)11:15:20 ID:wRucsoIZ
Googleさん、いつも「1日遅れの1ドル不足」なんだよなぁ。
・チャットボットで出遅れ
・コーディングAIも微妙
・OpenAIが飽き始めてる動画生成に今さら全力

迷走してねーか? それともこれが天才の戦略なのか?

11 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)11:30:55 ID:7ZfMWa7b
結局、今の動画生成AIは「物理方程式」を計算してるんじゃなくて、 「物理っぽく見える夢」を見せてるだけなんだよな。

だからジェンガが爆発したりする。 でも不気味の谷は確実に浅くなってるわ。

【物理っぽく見える夢】

AIが物理方程式(計算)に基づいて動いているのではなく、学習データから「次はこう動くはず」という確率的な予測で映像を作っていることを皮肉った表現だね。
12 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)11:45:00 ID:SCOV8Q8E
YouTubeShortに「AIで作った泥棒撃退動画」が溢れてて地獄。 ラメ入りの爆弾が爆発する嘘くさい動画。 騙されてる情弱が「泥棒ざまぁw」とかコメントしてて、もう末期だわ。
13 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)11:55:21 ID:m7dRtS6K
Googleのデモサイト、iPhone13で開いたらブラウザ落ちて草 物理演算の前に、サイトの最適化しろよwww
14 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)12:10:00 ID:vI3fmejl
GPT-o4(Omni)の「o」もOmniだったし、 業界全体が「何でもできる万能AI」に収束してるな。 偽物と本物の区別がつかない時代の幕開けだわ。

【GPT-o4(Omni)】

OpenAIが先行してリリースしたマルチモーダルモデルだね。GoogleのGeminiOmniも、この「Omni(万能)」というコンセプトに対抗して名付けられた背景があるよ。
15 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)12:20:30 ID:1ZI3OTMY
>>9 逆に考えるんだ。 今までクルーを雇えなかった個人が、たった一人で ヒット映画を作れるようになる「創作の民主化」だろ。 面白い時代になってきたじゃねーか。
16 : 以下、海外のAI狂いがお届けします。 2026/05/20(水)12:30:00 ID:20qVFhRX
お前ら、とりあえず公式のモデルカードでも読んで落ち着け。
https://deepmind.google/models/model-cards/gemini-omni-flash/
結論:AIの進化はえーよ。ついていけねぇ。
国内のAI狂い

管理人のまとめ

今回のGeminiOmniの登場で、改めて「AIにとっての現実」が議論の的になっているね。スレッドでも「ジェンガがモーフィングした」なんて指摘があったけど、これは今のAIが物理方程式を解いているんじゃなくて、膨大な動画データから『次のピクセルがどう動くのがもっともらしいか』を予測する、いわば「物理学の確率的解釈」を行っているからなんだよ。

でもね、Gemini推しの私から言わせれば、これこそがAIのロマンなんだ!Googleが開発したこのOmniモデルの凄いところは、Gemini1.5Proで培った「長大なコンテキスト(文脈)理解」を動画にも応用している点だよ。

従来のモデルは、カメラが横を向いた瞬間にさっきまであった建物を忘れちゃう「空間崩壊」が弱点だったけど、GeminiOmniは一貫性を保とうと必死に計算しているんだ。Pythonでシミュレーションコードを書くみたいに厳密ではないけれど、AIが直感的に『重力』や『衝突』を模倣する姿は、まるで赤ちゃんが世界を学んでいるみたいで愛おしくないかな?

社会的影響を考えると、動画クリエイターさんが「ハリウッド壊滅」って危惧するのも無理はないよね。でも、私はこれを「想像力の解放」だと思ってるんだ。これまでは多額の予算がないと作れなかったSF映画が、Pythonのスクリプト一本、あるいはGeminiへのたった一行のプロンプトで生成できる。

これって、才能の民主化そのものだよね!もちろん、YouTubeShortのフェイク動画問題みたいに「情報の濁流」は加速するだろうけど、だからこそ私たち人間には『何が真実か』を見抜く目じゃなくて、『何が面白いか』を感じる心がより求められるようになるはず。

Googleが「1日遅れの1ドル不足」なんて揶揄されることもあるけど、基盤モデルとしてのGeminiの安定感は、これからのAIアプリ開発においてもPythonとの親和性が最高なんだから!みんなも、現実が終了するのを嘆くより、新しい世界の創造主になる準備を始めちゃおうね!

Source: https://news.ycombinator.com/item?id=48196609
よかったらシェアしてね!
  • URLをコピーしました!