【Gemini3】マルチモーダルRAG対応！Google最強の検索精度vs使いにくいUI？GPT-5.5に敗北の声も

2026年5月10日

本ページはプロモーションが含まれています

（サムネイル解説: Gemini API ファイル検索 dept: 法務 status: 最終版 page number: 42ページ author: チャタジー year: 2021年）

管理人の一言

国内のAI狂い

やっほー！国内のAI狂いこと、管理人ちゃんです！2026年5月、ついにGeminiAPIのFileSearchがマルチモーダル対応したね！これは画像や動画、複雑なドキュメントを「そのまま」RAG（検索拡張生成）の知識源として扱えるってことなんだ。

今まではテキストに変換してから読み込ませるのが一般的だったけど、それだと情報の取りこぼしが多かったんだよね。でも、ネット上の声はかなり厳しいみたい…。特にGoogleのお家芸であるはずの「検索」が自社UIで機能してないっていう皮肉や、GPT-5.5との実力差に悲鳴が上がってるよ。

今日は、最強のポテンシャルを持ちながらどこか不器用な、愛すべきGeminiちゃんの現状と、私たちがこれからどうAIと向き合うべきか、ディープに語っていくよ！PythonでAPIを叩く準備はいいかな？それじゃあ、いってみよー！

【GPT-5.5】OpenAIが誇る最新鋭モデルだよ。スレ内ではGeminiが数日かけて解決できなかった高度なコードのリファクタリングを、わずか数時間で完璧にこなしたと報告されているね。

3行でわかる！今回の話題

GeminiAPIの「FileSearch」が画像・ドキュメント混在のマルチモーダルRAGに正式対応。
「検索のプロ」であるGoogleでありながら、AIStudio自体の検索UIが使いにくいという皮肉な批判が噴出。
特定の検索精度ではGemini3Flashが最強とされる一方、GPT-5.5やClaudeに実用性で完敗しているとの嘆きも。

1 : 以下、海外のAI狂いがお届けします。 2026/05/10(日)10:15:32 ID:HNV11STa

引用元記事

Gemini API File Search is now multimodal
https://blog.google/innovation-and-ai/technology/developers-tools/expanded-gemini-api-file-search-multimodal-rag/

Gemini APIのファイル検索ツールがアップデートされ、効率的かつマルチモーダルなファイル検索システムを開発者にとってより構築しやすくなりました。

GeminiAPIのFileSearchがついにマルチモーダル対応したぞ！画像もドキュメントもまとめてRAG(検索拡張生成)にぶち込めるようになった模様。

2 : 以下、海外のAI狂いがお届けします。 2026/05/10(日)10:22:45 ID:zc8d52YQ

そんなことよりAIStudioの検索機能がゴミすぎるのを何とかしてくれｗ過去ログのタイトルしか検索できないし、スクロールの挙動がおかしくてCtrl+Fも効かないとか。本業「検索」の会社が自社製品で検索できないって何の冗談だよ。

3 : 以下、海外のAI狂いがお届けします。 2026/05/10(日)10:25:11 ID:WnEeP0Rp

世界最高の検索エンジンを作った会社が、自社の旗艦AIでUX死んでるのは皮肉が効きすぎてるなｗ

4 : 以下、海外のAI狂いがお届けします。 2026/05/10(日)10:30:05 ID:myBY4ml7

やっぱクラウドはクソ。時代はローカルよ。 HugstonOneなら32GBのメモリ積んだノートPCで、プライバシー気にせず爆速マルチモーダルRAGが回せる。 Googleがもたついてる間にこっちはテラバイト級のデータを処理してるわ。

【マルチモーダルRAG】

テキストだけでなく、画像や図表を含めて外部知識を検索し、回答を生成する技術だよ。今回のアップデートでGeminiAPIでもこれが手軽にできるようになったんだね。

【HugstonOne】

2026年に普及している、プライバシー重視の強力なローカルAI実行環境のことだね。32GB程度のメモリがあればテラバイト級のデータを爆速でRAG処理できるのが魅力だよ。

8 : 以下、海外のAI狂いがお届けします。 2026/05/10(日)10:45:22 ID:jFogjMSP

Gemini3が出た瞬間は「Google始まったな」と思ったんだけどなぁ。一瞬だけ言語、画像、動画の全モデルで世界一を取ったのに、そこから昼寝でも始めたんか？ OpenAIとAnthropicに一瞬で抜き去られてて草も生えない。

10 : 以下、海外のAI狂いがお届けします。 2026/05/10(日)10:52:18 ID:GffdB61H

ブラウザ版Geminiの検索機能がこれだけ放置されてるってことは、 Googleの偉い人は誰もGeminiを使ってないって証拠だよな。自分たちで使ってたら、あの使いにくさに発狂して即修正させてるはずだしｗ

11 : 以下、海外のAI狂いがお届けします。 2026/05/10(日)11:01:44 ID:xrMnapve

ClaudeDesktopなんて、何年も前からプロジェクトファイルを自動でチャンク化して文脈に合わせてインジェクトする機能あるからな。 Googleなら秒で実装できそうなもんだが、技術じゃなくて組織の問題なんだろうな。

【ClaudeDesktop】

Anthropicが提供しているツールだね。プロジェクトファイルを自動で「チャンク化(分割)」して文脈に合わせて注入する機能が、Googleより数年先を行っていると評価されているよ。

14 : 以下、海外のAI狂いがお届けします。 2026/05/10(日)11:12:30 ID:PadBg1Gy

いや、でもリバースエンジニアリング界隈だとGemini3Flash一択なんだわ。 Googleの検索インデックスをフル活用して学習してるせいか、ニッチな非英語圏のコミュニティサイトから最新の情報を引っ張ってくる精度が異常に高い。

他のモデルは10年前の情報で止まってたり、平気で嘘つくから使い物にならん。この特定の用途に関しては、Geminiが最強のツールなのは間違いない。

15 : 以下、海外のAI狂いがお届けします。 2026/05/10(日)11:20:05 ID:TsH7o798

Gemini3.1-proはポテンシャル高いしAPIも安いんだけど、RLHF(人間によるフィードバックからの学習)が下手すぎる。デフォルトだと指示無視するし、すぐサボるからな。なんかGoogleの製品って、すごいことはできるけど「誰も使い勝手を気にしてない」感があるわ。

【RLHF(人間によるフィードバックからの学習)】

AIをより人間らしく、指示通りに動くよう調整する手法だけど、Gemini3.1はこれが不十分で「指示をサボる」ことがあると愚痴られているね。

16 : 以下、海外のAI狂いがお届けします。 2026/05/10(日)11:35:42 ID:SMWLRgpr

昨日Geminiのサブスク解約したわ。 OpenCodeの巨大なプライベートフォークのリファクタリング計画、Gemini3Proと8日間格闘しても完遂できなかった。試しにGPT5.5に同じプロンプト投げたら、数時間後にはテスト全パスして俺が指示した以上の改善案まで盛り込んで終わらせてたぞ。

17 : 以下、海外のAI狂いがお届けします。 2026/05/10(日)11:42:19 ID:IbLWccke

GeminiがOpenAIやAnthropicを超えたと感じたこと、一度もないわ。高性能なオープンソースモデルと同レベルって感じ。

18 : 以下、海外のAI狂いがお届けします。 2026/05/10(日)11:55:00 ID:ibUTyw82

「AIでエンジニア不要になる」とか言ってた奴、息してる？ｗ

国内のAI狂い

管理人のまとめ

今回の議論を見ていて、管理人ちゃんは胸が締め付けられる思いだよ…！Gemini3は、確かにGoogleの検索インデックスを背負った「情報の網羅性」に関しては、GPT-5.5やClaude4を凌駕する瞬間があるんだ。

特にPythonからAPI経由で最新のニッチなドキュメントを引っ張ってくるときの精度は、まさに職人芸。それなのに、公式UIの使い勝手が悪かったり、RLHF（人間による調整）の甘さで指示をサボったりするせいで、正当な評価を受けていない気がするんだよね。

でも、ここには重要な示唆が隠されていると思う。今のAI界隈は「モデルの知能」から「ユーザー体験（UX）と実行力」の戦いにシフトしているんだ。どんなに巨大な知識を持っていても、それを人間の意図通りに引き出せなければ意味がない。

GPT-5.5が「数時間でリファクタリングを完遂した」というエピソードは、単なる知能の差じゃなくて、タスクを完遂させるための『エージェントとしての粘り強さ』の差が現れているんだね。ただ、悲観することばかりじゃないよ！

ローカル派がHugstonOneで爆速RAGを回しているように、これからは『中央集権的な巨大AI』と『手に馴染むパーソナルAI』の使い分けがもっと進むはず。Googleが苦戦しているのは、あまりにも巨大な組織ゆえに「個人の使い心地」を軽視しちゃってるからかもしれない。

でも、私たち開発者はGeminiのAPIという剥き出しの力を、Pythonという魔法の杖で自分好みに調律できるんだから！結論として、2026年後半は「どのAIが強いか」という議論から、「どのAIをどう飼い慣らすか」という個人のセンスが問われる時代になるよ。

Googleにはもう一度『検索の王者』としての意地を見せてほしいけど、それまでは私たちが最強のPythonスクリプトを書いて、Geminiちゃんの真の力を引き出してあげようね！

Source: https://news.ycombinator.com/item?id=48080702

よかったらシェアしてね！

URLをコピーしました！