国立国会図書館は12月1日、ウェブサイトを保存し続けているインターネット資料収集保存事業の収集件数が1万件を突破したと発表。収集データ量を可視化したウェブページを公開した。
ウェブサイトに掲載された情報は頻繁に更新・削除されることから、国立国会図書館では国立国会図書館法に基づき、2002年(平成14年)より「インターネット資料収集保存事業(WARP:Web Archiving Project)」として、日本国内のウェブサイト情報を収集し記録に残している。対象となるサイトは、国の機関や地方公共団体、独立行政法人、国立大学など。また、民間の政党や私立大学、文化的イベント、東日本大震災関連のウェブサイトも許諾を得て収集している。
ウェブサイトの情報が消えるという点では、例えば1999~2010年(平成11~22年)にかけての「平成の大合併」と呼ばれる市町村合併に伴い、約1500の地方自治体が消失しており、こちらも収集・保存を行なわれている。
2016年10 月をもって 収集ウェブサイトは1万件を突破、保存ファイル数は約36億ファイル、容量は632.9TB。国立国会図書館では、サイトごとの保存データ量を可視化して示すページを公開している。