東京大学総合図書館の所蔵資料、インターネットアーカイブから利用可能に 6
ストーリー by nagazou
世界データ資産 部門より
世界データ資産 部門より
インターネットアーカイブ (Internet Archive) が、東京大学総合図書館と提携したそうだ。デジタル化ずみの所蔵アーカイブ資料の一部が、Internet Archiveから検索および閲覧が可能になるという。閲覧できるようになるのは、同館が事前申請をせずに利用できる25コレクション・4180点になるという。画像データをPDF形式でも保存することも可能だとしている(Internet Archive Blogs、Internet Archive 東京大学総合図書館ページ、東京大学附属図書館)。
なおInternet Archive Blogsによると、
森鴎外 (1862-1922) の個人文庫に収められていた鴎外自筆の写本や鴎外本人による書き込みがある書物を集めた鴎外文庫、源氏物語の初期の写本、さらに、中国明代中期の条例(皇帝の判断に基づく法令や先例)をまとめた皇明條法事類纂(同館以外での所蔵は確認されていません)などがあります。
とのこと。
job failed問題 (スコア:0)
サイトが保存できない
なんとかしてよマジで
現代文として読めるのは (スコア:0)
かろうじて戦後10年以降かなー
AIで一文翻訳インタラクティブに引出線で表示とかまだまだ未来の話なんだろうか
全く関係ないない俺らが古い書物に触れられる様になっただけでも凄い事なんだろうけど
活用難しいわ
Re: (スコア:0)
まず書かれている文字を判読できるか。さらに古文を現代文として理解できるかどうか。この2つの関門を越えなきゃならない。
文字の判読については版本だと慣れると結構読めるのだけれど、日本で版本が普及するのは江戸時代に入ってからで、歴史学的に見れば「つい最近」。それ以前の手書き文字は、いわゆる崩し字で書かれているものが多く、筆者によるクセが激しくて解読には名人芸が必要となる。さらに前後の文脈からくみ取るにも、欠損の激しい資料も多くて、単体だと解読不可能で、同一の内容が記述されていると考えられる別資料との比較作業が必須となる(別資料があるとして)。
文字が読めたとしても、内容がわかるかというと、これが結構難しい。ふつうは辞書を片手に読むのだけれど、用法的に辞書とはかけ離れたものも多くて、これまた想像で補うしかない。よく「書き下し文はムダ。現代人が読むなら現代語訳だけでいい」という意見も見かけるけど、上記のように現代語訳はいわば「訳者の創作」なんで、当然ながら誤訳が多数含まれるため、原文の手掛かりとなる書き下し文がないと、危なくてそのまま信用できない。
Re:現代文として読めるのは (スコア:1)
> 当然ながら誤訳が多数含まれるため、原文の手掛かりとなる書き下し文がないと、危なくてそのまま信用できない。
つまりスラドと同じということですね。
Re: (スコア:0)
くずし字の自動認識は色々試みられてなかったっけ?
かなり正確な結果が得られてたと思うけど…
Re: (スコア:0)
AIでくずし字を解読するのはそれなりに実用的なのでは?
アーカイブ資料を片っ端から解読するのはあると思う。
解読したからと言って意味がわかるかは別問題だけど。
AI 手書きくずし字検索
http://www.ai-kuzushiji.net/ [ai-kuzushiji.net]
くずし字解読 AIの実力は?
https://www.nhk.or.jp/d-navi/sci_cul/2019/11/story/story_20191120/ [nhk.or.jp]