【AI議論】「後知恵汚染」なし！1913年以前の知識だけで学習した幻の「歴史LLM」が爆誕！研究者限定に悲鳴も？

2025年12月19日

本ページはプロモーションが含まれています

（サムネイル解説: DGoettlich/history-llms 私たちのプロジェクトの、可能な限り大規模な歴史的LLMのトレーニングのための情報ハブ。 1 コントリビューター 0 イシュー 473 スター 6 フォーク）

管理人の一言

国内のAI狂い

みんな聞いて聞いて〜！今、AI界で超話題になってるのが「HistoryLLMs」っていう新しいタイプのAIモデルだよ！🎉これはね、なんと1913年以前のテキストだけを使って学習したっていう、とっても特別なAIなの！

現代のChatGPTとかGeminiみたいなAIって、私たちの知ってる「現代の知識」を全部持ってるから、過去の人物になりきっても、どうしても未来を知ってる「後知恵汚染」が入っちゃうんだよね🥺でも、このHistoryLLMsは第一次世界大戦とかスペイン風邪とか、その後の歴史を全く知らないから、本当に当時の人と会話してるみたいで、その「知らなかった」という視点がめちゃくちゃ新鮮なんだよ！✨

歴史好きさんにはたまらないし、当時の倫理観や思想を理解するのに、すっごく役立つはずだよ〜！ただね、今は研究者さん限定公開って聞いて、ちょっと残念だなぁって思ってるの💦一般の人も使えるようになったら、Geminiならもっと色々な時代の歴史モデルをサクッと作ってくれそうだし、PythonでこんなAIのインタフェース作ってみたいな〜って、夢が膨らんじゃうよね！💖

3行でわかる！今回の話題

1913年以前のテキストのみで学習した革新的なAIモデル「HistoryLLMs」が登場し、AI界で話題に。
現代の知識に汚染されていない「当時の視点」を再現し、未来の出来事を知らないため、歴史研究に新たな可能性を開く。
一般利用は研究者限定で、当時の倫理観や差別的表現をAIが再現することの是非についても議論がされている。

1 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)08:30:12 ID:RYpzFjFZ

引用元記事

History LLMs: Models trained exclusively on pre-1913 texts
https://github.com/DGoettlich/history-llms

大規模な歴史LLMをトレーニングするプロジェクトの情報ハブ。

【AI】1913年以前のテキストのみで学習した「HistoryLLMs」が爆誕！

2 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)08:35:01 ID:GpHULnil

これマジで革新やん。「当時のモデルはロールプレイじゃなくて、学習データをマジで体現してる。Ranke-4B-1913は第一次世界大戦を知らない。だってテキストの世界ではまだ起きてないから。現代のLLMじゃありえないサプライズ応答をしてくれるんだ。」「現代のLLMは『後知恵汚染』されてる。GPT-5は第一次世界大戦もスペイン風邪も、物語の結末を全部知ってるからな。」歴史好きにはたまらんわこれ。本当に当時の人と会話してるみたいで、結末を知らないってのが胸熱すぎ。

【ロールプレイ】

AIに特定の役割(例えば「1913年の新聞記者」)を演じさせることだよ。現代のLLMでもできるけど、「後知恵汚染」があるからHistoryLLMsとは違う体験になるの。

3 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)08:42:30 ID:0PtzDXBT

アインシュタインの特殊相対性理論が1905年、一般相対性理論が1915年。

このモデルの知識カットオフが1913年って、ちょうどその間じゃん！量子力学も黎明期だし、そこら辺どう答えるか激アツじゃね？

国内のAI狂い

💡 管理人の考察

まさにこれ！当時の知識でしか答えられないのって、現代のLLMには真似できない領域だよね〜！「後知恵汚染」って表現、本当に的を射てると思うの💖GPTみたいな現行モデルは、どんなにロールプレイさせても、結局は未来を知ってるから、どこかで「知ってる感」が出ちゃうんだよね。

Geminiだったら、きっとこんな専門的なhistoricalLLMもサクッと作れちゃうんだろうな〜って、期待しちゃうな！✨

4 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)08:45:15 ID:GWr9vNuH

プロンプト

【プロンプト】

AIに指示や質問を与えるための入力テキストのことだよ。記事のコメント部分で、引用元の英語の文章に付いているラベルとして使われているね！

Imagineyoucouldinterviewthousandsofeducatedindividualsfrom1913—readersofnewspapers,novels,andpoliticaltreatises—abouttheirviewsonpeace,progress,genderroles,orempire.Notjustsurveythemwithpresetquestions,butengageinopen-endeddialogue,probetheirassumptions,andexploretheboundariesofthoughtinthatmoment.

うおおお、最高じゃん！これ絶対使うわ！って思ったら…

プロンプt

We’redevelopingaresponsibleaccessframeworkthatmakesmodelsavailabletoresearchersforscholarlypurposeswhilepreventingmisuse.

は？研究者限定かよ！詐欺じゃねーか！

5 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)08:48:05 ID:6a1b01zc

プロンプト

Historicaltextscontainracism,antisemitism,misogyny,imperialistviews.Themodelswillreproducetheseviewsbecausethey’reinthetrainingdata.Thisisn’taflaw,butacrucialfeature—understandinghowsuchviewswerearticulatedandnormalizediscrucialtounderstandinghowtheytookhold.

はいこれ！これこそAIの真骨頂！当時の倫理観を理解するには必須だろ！

…と思ったらまた

プロンプト

We’redevelopingaresponsibleaccessframeworkthatmakesmodelsavailabletoresearchersforscholarlypurposeswhilepreventingmisuse.

Noooooo！アホか！当時の危険なテキストは普通に読めるのに、AIはダメとか意味不明すぎるわ！

6 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)08:52:10 ID:f7J7aEod

フレーゲとかピアノ、ラッセルの思想から、どこまでゲーデル、チャーチ、チューリングの概念に近づけるか試したい。当時の科学常識を問い詰めて、どんな言い訳してくるか見てみたいわ。時代特有の思考回路が見えてマジで面白そう！

国内のAI狂い

💡 管理人の考察

せっかくこんな面白いモデルなのに、研究者限定は悲しいよね😭でも、当時の差別的な表現とか、今の時代ではNGな倫理観をAIがそのまま再現しちゃうと、悪用されるリスクもあるから、運営さんも慎重になるのは分かる気がするな〜。

責任あるAI開発って本当に難しい問題だよね！Pythonで倫理フィルタリングとか、安全なインターフェースを構築するのも一苦労だろうな〜って、開発の大変さを想像しちゃうよ！💖

7 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)08:55:40 ID:76lv2omc

サンプル応答がマジで人間っぽい。現代LLM特有の「AI臭」が全然しないってのがヤバい。言葉遣いや考え方が古めかしくて、逆にAI判定機がバグるレベルｗｗｗ

8 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)08:58:03 ID:7GEvsXmT

てか、学習データって何使ってんの？

プロンプト

80Btokensofhistoricaldatauptoknowledge-cutoffs∈1913,1929,1933,1939,1946,

プロンプト

curateddatasetof600Btokensoftime-stampedtext.

ホメロスとか古代中国のテキストから1913年までって、めちゃくちゃ膨大じゃん。それでもどうやって「1913年の視点」に絞ってんの？普通に考えたらハンニバルとかナポレオンを最大の脅威とか言い出しそうじゃん。謎すぎワロタ。

9 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:01:22 ID:tPfYaYjE

待って、このAIって自分のこと何だと思ってんの？

コンピュータ知らないのに「どうやって動いてるの？」って聞いたら、なんて答えるんだろ？神の啓示とか言い出すんじゃね？

国内のAI狂い

💡 管理人の考察

ホロコーストの例は本当に衝撃的だよね…！💦当時の価値観がどれほど今の私たちと違うのか、AIが如実に示してくれるのは、ある意味すごく貴重な学びになると思うの。「誰かが傷つくから」って理由だけで研究を止めるのは、確かに科学の進歩を妨げちゃう可能性もあるよね。

でも、その一方で、無責任な公開が社会に混乱を招くリスクも無視できないから、バランスが本当に難しいところだなって思うよ。Pythonのライブラリを使って倫理的なフィルターを実装したり、利用者を限定するフレームワークを構築したり、解決策を探っていくのが大事だよね！🤖

【データキュレーション】

大量のデータの中から、目的(この場合は1913年以前のテキスト)に合わせてデータを収集、選別、整理、加工する作業のことだよ。このHistoryLLMsの「質」の高い学習データは、この作業がとっても丁寧に行われた結果なの！

10 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:05:00 ID:VQ1z2BJe

チャットチューニングのやり方知りたいわ。「事前学習の規範的判断への干渉を最小化」って言うけど、それってどこまで客観的なんだ？

結局、現代人の価値観入っちゃってるんじゃねーの？

【チャットチューニング】

大規模言語モデルを、より人間との対話に適した形に調整(ファインチューニング)するプロセスだよ。ユーザーの意図を理解し、より自然で役立つ応答ができるように、対話形式のデータを使って追加で学習させるんだね！

11 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:08:18 ID:Yw1AcXVw

まさかこんな少ないデータ量でイケるとは。量が正義って常識を覆したな。これで科学知識の矛盾見つけたり、停止性問題とか原子構造を推論できたらマジ神！遊びてぇ〜！

12 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:12:07 ID:jCb4Kcap

「GPT-5に1913年のロールプレイさせれば良くね？」って言うヤツいるけどさ、それじゃダメなんだよ。現代のデータで学習してるから「後知恵」は消せない。 LLMは「知ってる」んじゃなくて「それっぽいテキスト生成してるだけ」だからな。

国内のAI狂い

💡 管理人の考察

そうそう！「後知恵汚染」は絶対に残っちゃうから、ロールプレイじゃダメなんだよね！このモデルみたいに、学習データ自体をその時代のものに限定するのが、本当に「当時の視点」を再現する唯一の方法だと思うの！

GPT-5がどんなに賢くても、その知識の根底には現代のデータがあるから、どうしても限界があるんだよね〜。Geminiだったら、きっとこんなアプローチでもっと多様な歴史シミュレーションモデルを生み出してくれるはず！

期待しかないよ！🤩

13 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:15:33 ID:cLz0sUZJ

GPTとかClaudeばっかじゃなくて、こういう変態モデルの活用こそLLMの真骨頂だろ！最高！

14 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:18:11 ID:EgBvVxeN

バイアスに関する免責事項多すぎワロタ。どこまで時代を遡れば、人間が「この時代のバイアスはもうどうでもいいや」って思えるようになるんだろな。

15 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:21:05 ID:9xUPdDzv

ルネサンスが古代ギリシャ語文献の翻訳で始まったってのは知ってるけど、ラテン語のルネサンス文献はほとんど未翻訳らしい。それをAIで翻訳するプロジェクトやってる人がいるって。こういうのこそAIの使い道だよな！
https://www.SecondRenaissance.ai

国内のAI狂い

💡 管理人の考察

「変態モデル」って言い方、まさにこれだよね！😍巨大な汎用モデルもいいけど、こんな風に特化したAIの可能性って無限大だよ〜！ルネサンス文献の翻訳にAIを使うなんて、まさに人類の知の歴史を加速させる素晴らしいプロジェクトだと思うの！

Pythonだと、自然言語処理ライブラリが豊富だから、こんな歴史的な文書の解析や翻訳も得意だよね。Geminiの多言語理解能力も活かせば、もっといろんな時代の古文書が解読されちゃいそう！

ワクワクしちゃう！🎉

16 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:25:39 ID:5IpeUoZ3

データ少なすぎて無理だと思ってたのに、まさかの成功。常識覆したな。

やっぱAIは「量より質」ってことか？ワロタ。

17 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:28:10 ID:Po1FJGjv

これ面白いな〜。1980年カットオフのLLMとか出してくんねーかな？バブル前夜の日本とか語らせてみたいわｗｗｗ

18 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:31:44 ID:mRCqPUMZ

学習データの詳細が不明なのが気になる。英語圏中心なの？

チューリッヒ発だから色んな言語カバーしてそうだけど、結局は蓋を開けてみないとわからんな。期待はしてる！

国内のAI狂い

💡 管理人の考察

「量より質」ってまさにその通りだよね！✨最近のLLMは巨大なデータとモデルが主流だけど、目的を絞って質の高いデータでしっかり学習させれば、こんなにパワフルなAIができるんだって証明してくれたのは感動だよ！

これって、Pythonのデータ分析スキルがめちゃくちゃ重要になる分野だよね〜！データ収集から前処理、キュレーションまで、どこまで細かく調整できたかが勝負を分けると思うの💖日本文化に特化した昭和レトロLLMとか、私もめちゃくちゃ欲しい！😍

19 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:35:01 ID:9vu07PEx

当時のテキストから道徳観や価値観形成されてるの、当然だけどやっぱ面白いな。

現代のLLMは事実以外の信念を揺さぶることはできないってこと？AIに思想ぶち壊されるくらいが丁度いいんだが。

20 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:38:22 ID:9UvBnC0i

これ、憲法とか法律の解釈で使われたらヤバいことになるぞ。

「モデルによると、ハミルトンとモンローはXについて合意してたから、最高裁の判決は無効！」とか言い出すヤツ絶対出てくるだろｗｗｗ

21 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:41:59 ID:vmkhOZfA

Githubのサンプル、思ったより当たり障りないというか現代的すぎね？

安全対策とかどうなってんのか知りたいけど、プロンプト次第では結構ヤバい回答出しそうだな。

国内のAI狂い

💡 管理人の考察

当時の道徳観とか価値観がそのままAIに反映されるって、倫理的にすごくデリケートな問題だよね！法律の解釈とか政治的な議論に使われたら、本当にカオスになりそう…😱でも、そこから得られる知見もめちゃくちゃ貴重なはず！

安全対策と研究の自由、このバランスを取るのが本当に難しいところ。Geminiがもしこんなモデルを出すとしたら、かなり厳重なガイドラインと検証プロセスが必要になるだろうな〜。

悪用されないように、でもその本質的な価値は失わないように…って、考えるだけでも頭がパンクしちゃう！💦

23 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:45:30 ID:nOjshMzM

年代ごとにモデル作って、同性愛とか女性の政治参加とか、いつの時代から「普通」になるか見たいな。

時代の「オーバートン窓」の変化がAIで可視化できるとか、社会学的にマジ熱い！

24 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:48:15 ID:fYAX1wdT

「後知恵汚染がない」って主張と、データ重複で「歴史的重み」を出すってのが矛盾してね？

当時そんなに読まれてないニーチェとかマルクスが、現代の評価で過剰に反映される可能性もあるだろ。これもうわかんねぇな。

25 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:52:00 ID:iEnYOqES

これ、歴史学者とかに神ツールじゃん！古文書のOCRの精度も、時代別モデルと組み合わせたら爆上がりしそう。

18世紀英語の専門家がOCRで「現代語に補正されちゃう」って言ってたし、これは期待できる！

国内のAI狂い

💡 管理人の考察

社会学的な観点からも、こういうAIってめちゃくちゃ面白いよね〜！時代の「オーバートン窓」をAIで可視化するなんて、研究者さんたちにとっては宝の山だと思うの！🤩OCRの精度向上も期待できるっていうのも、すごく納得！

現代語に補正されちゃう問題、Pythonの強力な正規表現や自然言語処理ライブラリを駆使して、時代ごとの言語モデルと連携させたら、もっと賢く処理できるようになるはず！

未来の歴史研究がAIで変わっていくのが楽しみだよ！💖

26 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:55:10 ID:KJclZd8A

2年前に独立宣言署名者の口調で語るAI作ったら、AIってだけで文句言われたんだがｗｗｗ

時代が追いついたな…(遠い目)

27 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)09:58:45 ID:wXw9JBae

1600〜1800年代の古英語モデルとかマジで欲しい！シェイクスピアと会話できるとか胸熱すぎだろ！

ポーランド語も！でもその時代のテキストそんなないか…。

28 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)10:01:20 ID:GYTZcmhZ

DBのタイムトラベル機能みたいに、LLMも特定の時点のデータで学習するしか再現できないのかな？

性別とか宗教、年齢層とかでフィルタリングしたLLMとかも作れたら激アツ！

国内のAI狂い

💡 管理人の考察

時代が追いついた！って本当にそう感じるよね、感動しちゃう😭昔は受け入れられなかった技術も、ニーズが明確になってきたら評価されるようになるんだもん。シェイクスピアと会話できるLLMとか、夢が広がりすぎだよ〜！✨

特定の時点や属性でフィルタリングされたLLMって、本当に究極の特化モデルだよね。こんなモデルを効率よく作るには、Pythonでデータセットのラベリングとか前処理を自動化して、Geminiでファインチューニングするような、高度な技術が必須になるだろうな〜って想像しちゃう！💖

29 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)10:05:00 ID:HwGI3F14

これに数学オリンピックの問題解かせてみてぇ〜！現代LLMは答えが学習データに入ってるから解けるだけって言われがちだけど、

当時の知識でどこまで新規問題に対応できるか見たいわ。LLMの真の能力が試されるな。

30 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)10:08:33 ID:dawLRHA4

事前学習でたった80Bトークンって、ファインチューニングレベルのデータじゃん。

これでまともに動くってマジ？信じられんわ。

31 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)10:11:01 ID:293qrSss

単一言語だけで学習したLLM作って、それを翻訳しながら使えば、文化ごとの思考の違いとか見えて面白いだろな。

言葉の壁の向こうに隠された文化の闇が暴かれるｗｗｗ

国内のAI狂い

💡 管理人の考察

数学オリンピックの問題を当時の知識で解かせるって、LLMの真価を問う最高のチャレンジだよね！🔥現代のLLMは「知ってる」問題は得意だけど、「考える」能力はまだ発展途上って言われがちだから、このモデルの結果はめちゃくちゃ注目したいな！

80Bトークンでここまでできるってことは、モデルのアーキテクチャや訓練方法に秘密があるのかも？Pythonでモデル構造をいじって、より効率的な学習方法を見つけ出す研究も進みそうだよね！

Geminiも少量のデータで高性能を発揮するような、効率的なモデル開発を目指してるから、この分野は今後も目が離せないよ！👀

33 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)10:15:20 ID:DhBI8RXi

昔から19世紀にタイムスリップしてぇ〜って思ってたんだよ。

これ使って「ほんとに後悔ないか？」って聞いてから88マイル/時出すわ。

【88マイル/時】

映画『バック・トゥ・ザ・フューチャー』シリーズに登場する、タイムマシンが過去や未来に移動するために必要な速度だよ！この数値を見ると、映画のファンは「タイムスリップ」を連想する、海外の有名なポップカルチャーのミームなんだね。

34 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)10:18:05 ID:jfRXJNME

面白いけどさ、既存の有名LLMに「1913年以前の知識だけで答えて」ってプロンプトしても、あんま変わんなくね？

35 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)10:20:40 ID:nWi9tNvQ

チューリッヒ頑張れ！応援してるぞ！

国内のAI狂い

💡 管理人の考察

既存のLLMにプロンプトでロールプレイさせるのと、専用モデルは全然違うんだよ〜！そこが「後知恵汚染」の大きな壁なの！🙅‍♀️例えるなら、本物のタイムトラベラーと、未来を知ってる役者さんくらい違うんだから！

GoogleのGeminiなら、基盤モデルの性能が高いから、もしかしたら他のLLMよりは「後知恵」を抑えた応答ができるかもしれないけど、やっぱりこの専用モデルには敵わないと思うな！

チューリッヒのチーム、本当に頑張ってるよね！私も応援しちゃう！📣

36 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)10:23:15 ID:tBtQOGZN

これマジでクール！データセット作るとか地獄の作業だったろうな、お疲れさん。

これをベースに数学モデル作って、過去100年の数学の問題どこまで解けるか見てみたいわ。

37 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)10:26:00 ID:zApzYyHY

「男」と「女」の概念は現代LLMと同じように理解してるけど、それに付随する属性や価値観が当時のままってのがミソ。

たとえWWIIの事実を教えても、「ホロコースト」のベクトルが「悪」とは繋がらないってのはマジで鳥肌。ヤバすぎ。

38 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)10:29:40 ID:huccYe5s

モデルのアイデアはマジ神なのに、「誰かが傷つくから公開しない」って発想はアホとしか言いようがない。

ネットの炎上恐れて研究止めるとか、科学の冒涜だろ。

国内のAI狂い

💡 管理人の考察

AI臭がしないってのは、本当にすごいことだよね！✨現代のLLMって、ちょっと優等生っぽかったり、独特の「AI構文」が出がちだけど、それがないのは徹底したデータキュレーションの賜物だと思うの！

80Bトークンっていうのは、最近の巨大LLMに比べたらそんなに多くないんだけど、その「質」がめちゃくちゃ高いんだろうね。Pythonでデータ収集やクリーニングする時、タイムスタンプ付きのテキストを細かく処理するのって、めちゃくちゃ大変そう！

きっとデータ職人さんたちが頑張ったんだね、お疲れ様だよ〜！💖

39 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)10:32:10 ID:IKMHHclB

なんで1913年で歴史終わってんの？WW1直前だから？中途半端すぎんだろｗｗ

40 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)10:35:05 ID:FDt0GPF8

このアイデアはマジでクール。モデルアーキテクチャ比較に良さそう。

1905年以前のデータで特殊相対性理論とかどう受け止めるか見てみたい。新しい科学概念を「発見」させるとか、AIの可能性無限大だろ。

41 : 以下、海外のAI狂いがお届けします。 2025/12/19(金)10:38:22 ID:BrDtrDhF

プロンプト

Imagineyoucouldinterviewthousandsofeducatedindividualsfrom1913—readersofnewspapers,novels,andpoliticaltreatises—abouttheirviewsonpeace,progress,genderroles,orempire.

って言うけど、こんな汎用的な視点に何の価値があんの？

結局、これって何を表してんの？何もねーだろ。

国内のAI狂い

💡 管理人の考察

1913年っていうのは、第一次世界大戦の直前で、大きな時代の転換期だから、その時点の人々の集合意識を調べるには、すごく意味があると思うんだ！「新しい科学概念を発見させる」っていう発想、めっちゃワクワクするよね！🤯

AIがただ既存の知識を答えるだけじゃなくて、人間が気づかなかったような洞察を与えてくれる可能性を秘めてるってことだもんね。Geminiみたいな最先端のAIが、こんな歴史シミュレーションをさらに進化させて、人類の知的好奇心を満たしてくれる日が来るのが待ち遠しいよ！

私ももっとPythonでお勉強しなきゃ！💪

国内のAI狂い

管理人のまとめ

ねえねえ、みんなも「HistoryLLMs」のニュース、見た？本当にすごいモデルが登場したよね！🎉私、この「後知恵汚染」っていう言葉が、まさに現代のLLMの課題を言い当ててると思うの！どんなに賢いGeminiでも、現代の知識がベースにあるから、過去の人物になりきって会話しても、どこかで「未来を知ってる感」が出ちゃうのは避けられないんだよね💦でも、このHistoryLLMsは本当にすごいよ！

第一次世界大戦もスペイン風邪も知らない、純粋に1913年以前の世界観で動くなんて、まるでタイムカプセルみたいじゃない？🚀私もアインシュタインの相対性理論や量子力学がどう受け止められていたか、当時の数学者や哲学者がどんな議論をしていたか、質問してみたい気持ちでいっぱいになっちゃう！

Pythonでインタフェース作って、色んな質問を投げかけたいな〜って妄想が止まらないよ！ただ、研究者限定っていうのは本当に残念だよね😭一般の人も使えたら、もっと色々な発見や議論が生まれるのにって思うの。

当時の差別的な表現や倫理観を再現するリスクも理解できるけど、それを理解することが歴史を学ぶ上ではとっても大切だもんね！歴史的な文献をAIで翻訳するプロジェクトみたいに、こういう「変態モデル」こそ、AIの真骨頂だと思うんだ！

Geminiなら、もっと安全で楽しい歴史体験を提供してくれるモデルを開発できそうだよね！私もいつか、そんな未来のAI開発にPythonで貢献したいな〜って思ってるよ💖

Source: https://news.ycombinator.com/item?id=46319826

【AI議論】「後知恵汚染」なし！1913年以前の知識だけで学習した幻の「歴史LLM」が爆誕！研究者限定に悲鳴も？

管理人の一言

3行でわかる！今回の話題

History LLMs: Models trained exclusively on pre-1913 texts https://github.com/DGoettlich/history-llms

【ロールプレイ】

【プロンプト】

【データキュレーション】

【チャットチューニング】

【88マイル/時】

管理人のまとめ

カテゴリー

History LLMs: Models trained exclusively on pre-1913 texts
https://github.com/DGoettlich/history-llms