このページの本文へ

13年間/1万件/633TBにもおよぶネットの資料

国立国会図書館、インターネット資料収集保存事業の結果を可視化

2015年12月02日 17時00分更新

文● 行正和義 編集/ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

収集したウェブサイトのデータ量を可視化

 国立国会図書館は12月1日、ウェブサイトを保存し続けているインターネット資料収集保存事業の収集件数が1万件を突破したと発表。収集データ量を可視化したウェブページを公開した。

 ウェブサイトに掲載された情報は頻繁に更新・削除されることから、国立国会図書館では国立国会図書館法に基づき、2002年(平成14年)より「インターネット資料収集保存事業(WARP:Web Archiving Project)」として、日本国内のウェブサイト情報を収集し記録に残している。対象となるサイトは、国の機関や地方公共団体、独立行政法人、国立大学など。また、民間の政党や私立大学、文化的イベント、東日本大震災関連のウェブサイトも許諾を得て収集している。

可視化したデータ量マップ(公開ページではインタラクティブに拡大でき細部が表示できるほか、csv形式による一覧もダウンロードできる)

 ウェブサイトの情報が消えるという点では、例えば1999~2010年(平成11~22年)にかけての「平成の大合併」と呼ばれる市町村合併に伴い、約1500の地方自治体が消失しており、こちらも収集・保存を行なわれている。

消失したウェブサイトの例。水海道市(2006年に結城郡石下町を編入し、常総市と改称した)

 2016年10 月をもって 収集ウェブサイトは1万件を突破、保存ファイル数は約36億ファイル、容量は632.9TB。国立国会図書館では、サイトごとの保存データ量を可視化して示すページを公開している。

■Amazon.co.jpで購入

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン