パスワードを忘れた? アカウント作成
28547 story
ニュース

英 Times 紙が 200 年分の誌面をデジタルアーカイブし公開 47

ストーリー by hylom
200年の歴史 部門より

reo 曰く、

いささか旧聞となってしまったが、Impress の記事によると、イギリスの Times 紙は 1785 年から 1985 年までの Times 誌の全文を OCR でデジタル化し、日付やキーワードで検索出来る Times Archive を公開した。

1785 年からの紙面ということで、フランス革命やアメリカ南北戦争、二度の世界大戦の記事もアーカイブされている。検索結果を閲覧するためには Times Online への登録 (無料) が必要。検索結果はテキストデータとして得られるほか、記事のスキャン画像としてもダウンロードする事が可能 (Full Page で縦横 2000 pixel 程度の解像度、ファイルサイズは 2MB ほど) 。広告や求人情報、お悔やみ、誕生、結婚の欄まで閲覧できる。ただし、労働争議のために新聞の発行が行われなかった 1978/12/1 と 1979/11/12 の情報だけはアーカイブされていないという。利用は私的利用に限定され、商用利用をする場合には別途許諾が必要なようだ。

森薫の「エマ」やサイモン・シンの「暗号解読」にあったような新聞の私事通信欄を使った暗号恋文なども読むことが出来るのだろうか。1985 年以降の記事についても、まもなく公開される予定だという。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 誌でなく紙 (スコア:3, 参考になる)

    by elderwand (34630) on 2008年06月25日 12時04分 (#1370060) 日記
    英 Times 紙

    米 TIME 誌
  • 文章語に限りますが、200年間にわたるイギリス語の変遷や、ある用語がどのような意味で使われていたかの研究などができそうですね。イギリス語やイギリス史、イギリス風俗などを研究している人にはすばらしいソースになるものと思います。
    • ぶっちゃけ1785年なんて言われると、学校で習う「世界史」の中の世界、みたいな感じでしょうから、このアーカイブを見ることによって受ける衝撃というか、感慨は研究者以外の一般の人たちにとっても結構大きいんじゃないかと思います。
      親コメント
      • >ぶっちゃけ1785年なんて言われると、
        当時の国王はジョージ3世。現女王エリザベス2世より8代前。世代では6代前。
        同時代の出来事では、パリ講和条約(アメリカ独立承認)が1783年、バスティーユ襲撃が1789年。
        十分世界史レベル。

        親コメント
      • by Anonymous Coward
        1780年代って言うと
        ・イギリスがアメリカ独立承認(1783)
        ・フランス革命(1789)
        あたりでしょうか

        試しに会員登録して、バスティーユ襲撃の翌日(15-7-1789)を調べたところ、

        The following important intelligence was received yesterday by an extraordinary Messenger from Paris.
        から始まる記事がありました

        #読み始めたら昼休みが終わりましたorz
  • by Anonymous Coward on 2008年06月25日 10時50分 (#1370015)
    アーカイブという概念が無く、すぐに記事を消したり修正したりする日本のゴミクズどもとは、全く比べ物になりませんね(藁
  • PD (スコア:2, 興味深い)

    by nijimasu (2879) on 2008年06月25日 12時02分 (#1370059) ホームページ 日記


    > 利用は私的利用に限定され、商用利用をする場合には別途許諾が必要なようだ。



    このくだりが見つけられなかったのですが、
    200 年前の記事ならパブリックドメインのはず。
    Times が PD のアーカイブにまで商用利用への許諾を求めているのかどうか、
    気になるところであります。
    • Re:PD (スコア:2, 参考になる)

      by reo (4042) on 2008年06月25日 13時17分 (#1370111) 日記
      > このくだりが見つけられなかったのですが、

      What is the Times Archive? [timesonline.co.uk]の 1 ページ目一番最後から 2 ページ目にかけて

      Can I save articles from the Times Archive?
       
      Yes. When you view an article, below the image of the page you will see a ‘Save / Print’
      link that will allow you to save the image of the article you’re viewing. Please note that
      this is intended only for personal use (see our Terms & Conditions for more information).
      If you are interested in using material from the Times Archive for commercial purposes,
      you should contact our Syndication department.
      だそうです。Syndication department に contact してみれば、「PD なブツについてはイイヨイイヨー」ということになるのかも。
      --
      Hiroki (REO) Kashiwazaki
      親コメント
    • by Anonymous Coward
      記事じゃなく、検索機能の利用を言ってるんじゃね?
  • by sladoslado (28918) on 2008年06月25日 11時06分 (#1370021)
    文章や写真や絵などの著作権だの二次使用だのなんのかんのと問題点先行でやる前から立ち消えしてしいそうなネタですね。
    乗り物関連の月刊誌(車、鉄道、飛行機、船)などは記事の内容に過去を振り返るネタを多く抱える系のものはニッチかもしれないけれどTime誌のような公開を望む声はありそうですね。
    弱小出版社的なところも多々あるのでタダでとは言いませんが^^;
    • Re:日本だと…… (スコア:2, 参考になる)

      by oguma (17986) on 2008年06月25日 13時42分 (#1370131)

       読売新聞が「明治・大正・昭和の読売新聞」としてCD-ROM/DVD-ROMを出しています。

      http://www.yomiuri.co.jp/database/cdrom/mts/ [yomiuri.co.jp]

       とても個人で買えるものではありませんが。

      --
      Nullius addictus iurare in verba magistri
      親コメント
    • 確認できなかったのですが、これ、紙面全部の公開なのですかね。たぶん、権利関係はイギリスも一緒で、公開されていない部分ってのもあるとは思うのですが。
      親コメント
      • by Anonymous Coward
        著作権切れてるのも多いんじゃないですか?つまり Times誌的にはどうしようともはや自由。
        そこから起こしたデジタルデータには変換者の権利が発生するので、発表や閲覧をどうするかもやっぱり Times誌の自由。

        #第三者が独自にスキャンしてもやっぱり自由だろうけど
    • by Anonymous Coward
      海ほたるには自分の生まれた年の新聞の1面を印刷できる機械があったぞ(数年前にいったきりなので、今あるかどうかは不明)
      新聞は縮刷版として公開しているから、後は手間暇の問題でしょ
      • by gigo (21150) on 2008年06月25日 11時47分 (#1370047)

        こういうのは、画像データとして記録していますよね。今度のは、いったん画像を表示させたあとで、テキストデータも取り出せるようになっているようです。

        印刷物をスキャンして取り込んだあとで、OCRでテキストデータにしてデータベース化しようってのを、あちこちで試みていると思いますが、OCRの精度が良くありません。電子データは、そのまま読むだけでなく検索出来て欲しいのですが、誤って読み込まれているのを検索にかけるとメチャクチャになって使い物になりません。

        OCRの精度が上がったのか、それとも大量の人手を投入したのでしょうか。

        親コメント
        • by Anonymous Coward
          7bitと16bit(あるいは24bit)の違いでしょうか。やはり漢字のOCR処理は難しいのでしょう。
  • 日本と比べて (スコア:1, すばらしい洞察)

    by Anonymous Coward on 2008年06月25日 11時41分 (#1370043)
    自虐的に、日本じゃダメだろうなみたいな事言ってる人いるけど、そうでもないでしょ。
    Timesだって、利害を無視して公開した訳じゃないよ。
    Timesにとって、この紙面公開は利益につながる行為だから行ってる事。
    儲かると思えば日本の新聞社もやるだろう。

    Timesの価値の一つは、長い歴史を持つという事、古い記事の公開はそのブランドイメージの宣伝になる。
    また、過去の記事を売るという商売の、無料カタログとしての意味もある。
    これは、Timesならではの商品と、その宣伝だと思う。

    日本の新聞社が同じ事をしないだろうと思うのは、Timesと違って長い歴史を売りに出来ないから。
    やっても宣伝として効果が薄い。
    • 朝日新聞の方がデータベースを作っているというのは聞いています。ただ、結構までの話で、それがどういう成果になったかは確認していません。
      親コメント
      • by FLYWHALE (27794) on 2008年06月25日 13時21分 (#1370112)
        朝日新聞の場合は「聞蔵」(きくぞう)という有料サービス [asahi.com]をやってますね。某大学の図書館で利用したことがあるのですが、1945年から84年の紙面のPDFイメージ検索、85年以降の記事検索ができます。それまでは84年以前のものは縮刷版1冊1冊調べるしかなかったので、非常に便利でした。

        まあ、TIMES紙のように、一般公開してくれると非常に助かるのですが、向こうも商売でしょうからねぇ。逆にTIMES紙がこれをどうやってビジネスにつなげているのかが気になります。それが分かれば、日本の各紙に提案して……実現すれば、僕らも気軽に利用できてありがたい限りなんですけどね。
        親コメント
      • by elderwand (34630) on 2008年06月25日 12時54分 (#1370093) 日記
        昔、インターネット以前にパソコン通信だったときに、Nifty で利用したことがあります。今は Nifty 止めてるし。

        今は、、、ありますね [nifty.com]。
        親コメント
      • 新聞記事が永久に残って個人の犯罪履歴が簡単に検索ができるというのは、犯罪者の更正という点では 問題があるんだろうなあ。
        今でもThe Internet Archiveがあるけど、検索がもっと簡単になって、町工場や個人商店の経営者が 採用時に応募者の犯罪履歴を調べる事が一般化したら、犯罪を犯した人がカタギになる道がずいぶん 閉ざされてしまうと思う。
        親コメント
        • by Anonymous Coward
          まるで今はカタギになる道が大きく開かれているかのような口ぶりですね。ご冗談を。官僚や法学者の脳内や机上の空論ではそうなのかもしれませんが。
          • >まるで今はカタギになる道が大きく開かれているかのような口ぶりですね。
            すいません、偉そうな書き方だったと思います。

            ただ、新聞の検索が簡単になると、今まで比較的寛容だった事業者までもが
            雇用の際に身元調査を行うようになるとともに、大昔の記録や書類送検程度の
            軽微な記録(場合によっては書類送検にすらならなかった事件の記録でも)
            残るので、今まで以上にシビアな状況になると思うのです。
            親コメント
    • by shinshimashima (9763) on 2008年06月25日 12時40分 (#1370077) 日記
      >日本の新聞社が同じ事をしないだろうと思うのは、Timesと違って長い歴史を売りに出来ないから。
      毎日新聞の前身である東京日日新聞が明治五年、
      讀賣新聞が明治七年、朝日新聞が明治十二年創刊ですから、
      十分歴史がありますよ。
      明治五年創刊の郵便報知新聞も会社は報知新聞社として残っていますしね。
      親コメント
    • Re:日本と比べて (スコア:1, すばらしい洞察)

      by Anonymous Coward on 2008年06月25日 12時53分 (#1370092)
      アサヒがこんなことしたら、自分が率先して太平洋戦争を煽っていた等の夥しい恥ずべき過去の数々が広くバレてしまいますから、絶対にやらないでしょうね
      せいぜい、知恵蔵でネット住民からフルボッコに遭いながらも臆面もなく捏造記事をせっせと積み上げていくのが関の山です

      #すぐ証拠隠滅されてしまう日本のweb新聞記事は、個人でまとめサイトでも作っていくべきか?
      親コメント
      • by Anonymous Coward
        お前、朝日新聞読んだことないのがモロバレだな。他の新聞だってろくに見たことないだろ。

        朝日を含む新聞各紙が太平洋戦争時に政府と軍の宣伝媒体と化していたことくらい、周知の事実だし朝日の紙面にだって何べんも出ている。
        いまさらバレるなんてことでもないし、知られたからって恥になるわけでもない。

        批判なら結構だが、お前がやっているのはそうではなくて他人の尻馬に乗ってけなしているだけ。みっともない。
        自分がやっていることが「アサヒる」行為そのものだっていうことに気づかんか?
        • by Anonymous Coward
          お前がどう思おうとも、世間はそうは思っちゃいねぇよw

          #はいはい、論破できないから一般化してますよw
          • by Anonymous Coward
            >お前がどう思おうとも、世間はそうは思っちゃいねぇよw

            世間?
            ああ、ネット右翼界隈のことですね、分かりますw
            • by Anonymous Coward
              あなたの文を素直に解釈すると、ネット右翼界隈では朝日を含む新聞各紙が太平洋戦争時に政府と軍の宣伝媒体と化していたことが周知でないことになります。

              全く意味が分からないのですが…
    • by hironko (12276) on 2008年06月25日 14時08分 (#1370168)
      あまり言及されてないけど、これ、TIMES ONLINE登録への撒き餌でもありますよね。
      今まで有料でライセンスしていたものを無償化して、どう帳尻を合わせてくるのか興味津々です。

      あと、TIMES紙と日本の新聞の比較で問題になるのは歴史の長さや黒歴史?ではなく

      「日本語で書かれている」

      ことだったりしないかな?
      親コメント
      • by emk (30939) on 2008年06月26日 0時58分 (#1370712) 日記

        今まで有料でライセンスしていたものを無償化して、どう帳尻を合わせてくるのか興味津々です。

        同じく無償化した(こちらは登録すら不要)NY Times [nytimes.com]の事例が参考になるかもしれません。

        無料であることによるアクセス増加で無料公開部分から得られる広告収入のほうが、有料会員からの購読料による収入より大きくなったので無償化に踏み切ったそうです。逆に言えばアクセスを集められないところはどんどんジリ貧に陥るでしょうね。

        親コメント
  • 戦前最右翼、戦後GHQにいぢられ180度転換
    ・・・らしいんですが、詳しい話しありませんかね?

    #毎日新聞英語版の恥ずかしい記事みたいな例もあるので
     全国紙の国内版・海外版の流れも知りたいですね
    • by Anonymous Coward on 2008年06月25日 19時16分 (#1370464)
      ちょっと大きな図書館に行けば縮刷版を置いてますよ。
      親コメント
    • by Anonymous Coward
      ただ単に戦時中は戦争高揚の為の記事が多かっただけじゃないでしょうか? 政府批判なんてしたら特高が黙ってないんだろうですし、使われる写真も検疫がありましたね。
      • by Anonymous Coward
        検閲ね
        #外地から来るからフィルムや写真には、検疫が必要だったかもしれないけどね。
    • by Anonymous Coward
      戦前も今も極左だと思いますよ、大東亜共栄圏とか八紘一宇とか。
      変わったのは帝国主義から極端な平和主義へという点でしょう。

      古い記事が簡単に手に入るようになれば、右翼や左翼の変遷などが明らかになってくるかもしれませんね。
  • by shinshimashima (9763) on 2008年06月25日 13時23分 (#1370114) 日記
    最初登録せずに11/Dec/1941,"Prince of Wales"で検索したら登録不要で見れたが、
    次に22/Oct/1805,"Nelson"で検索したら登録しろって言われた。
    まぁその前後で500が返ってきたりしたからメンテ中にたまたま見れただけかもしれんが。
  • by Anonymous Coward on 2008年06月25日 13時01分 (#1370103)
    問題は無料公開です。タイムズのデータベース化は既に Gale [cengage.com] 社が
    行っており、日本では雄松堂書店 [yushodo.co.jp]のような所で販売され、実際に
    大学などで利用されています。今回公開になったものも同一のもので、1785年から
    1985年までの記事をカバー。もちろん、インターフェイスはゴテゴテとしたデザイ
    ンに刷新されてますけども。
    結構なお値段を払って契約してる大学とか、どーすんだろか。
    • 不要な契約を解除すれば良いんでない?
      コレまではシステムがなかったからコストを払っていた。
      コレからはシステムがあるからコストカットできるようになった。
      システムが作られたのは自分たちがコストを支払い続けてその DB の価値を訴え続けたから。

      と云うだけのコトかと。

      #まさか、「金返せ」と?
      --
      -+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
      親コメント
typodupeerror

あと、僕は馬鹿なことをするのは嫌いですよ (わざとやるとき以外は)。-- Larry Wall

読み込み中...