Googleが古文書解読AI「Aeneas」を発表、古代ローマの碑文の欠損部分を読み解き年代推定や地域推定も可能

Googleが古典ラテン語で記された碑文の解読に役立つAIモデル「Aeneas」を開発しました。Aeneasを使えば「欠損部分の文字数が分からない碑文」の内容を解読したり、碑文の年代や地域を推定したりできます。
Aeneas transforms how historians connect the past - Google DeepMind
https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/
GoogleはAeneasを開発するにあたって「Epigraphic Database Roma(EDR)」「Epigraphic Database Heidelberg(EDH)」「Epigraphic Database Clauss Slaby(EDCS-ELT)」といった古文書データベースの内容を統合し、古典ラテン語で記された17万6000件の古文書を含むデータセット「Latin Epigraphic Dataset (LED)」を構築しました。
AeneasはLEDを用いてトレーニングされており、テキストだけでなく画像の入力にも対応しています。ユーザーは「碑文を文字起こししたテキスト」や「碑文の写真」を入力することでAIに碑文の欠損部分を推定や関連する碑文の探索といった作業を実行できます。

Aeneasは碑文が記された年代や地域を推定することもできます。

複数の歴史学者を対象にした実験の結果、Aeneasは「欠損部分の推定」「地域の推定」「年代の推定」という3種のタスクで歴史学者の平均を超える精度を示しました。また、「欠損部分の推定」と「地域の推定」では「歴史学者がAeneasを活用しながら推定する」というシチュエーションで最も高い精度を示しました。

Aeneasを使える無料のウェブアプリが以下のリンク先で公開されています。加えて、2022年に登場した古代ギリシャ語解読AI「Ithaca」にAeneasの成果が取り込まれたことも発表されています。
Predicting the Past | Contextualising, restoring, and attributing ancient texts
https://predictingthepast.com/aeneas

Aeneasのコードとデータセットは以下のリンク先で公開されています。
GitHub - google-deepmind/predictingthepast
https://github.com/google-deepmind/predictingthepast?tab=readme-ov-file

・関連記事
DeepMindの碑文解読AI「Ithaca」で失われた碑文を72%の精度で復元することに成功 - GIGAZINE
GoogleのAIは古代ギリシャの碑文解読をものの数秒で行うことができるように - GIGAZINE
「日本語のくずし字をAIで活字に直す試み」の活発化に海外の研究者らも注目 - GIGAZINE
AIは古文書を読むのが得意、古文書の写真を見せるだけで内容の読み取りが可能&専門家でも気付きにくい細かなポイントにも対応可能 - GIGAZINE
・関連コンテンツ
in ソフトウェア, サイエンス, Posted by log1o_hf
You can read the machine translated English article Google announces 'Aeneas,' an AI that de….