Nowa Zelandia po raz kolejny archiwizuje swój internet
Biblioteka Narodowa Nowej Zelandii po raz kolejny rozpoczyna akcję archiwizowania zasobów krajowego internetu. Od 12 maja przez czternaście dni Biblioteka (we współpracy z Internet Archive udostępniającym oprogramowanie do sczytywania) kopiować będzie zawartość nowozelandzkich stron – głównie z domen .nz, ale także .com, .net i .org (jeśli podpięte pod nie serwisy hostowane są na krajowych serwerach).
Zabezpieczone zostaną główne serwisy internetowe kraju, w tym strony czasopism i instytucji, ale także blogi i strony domowe, fotografie, materiały multimedialne, dokumenty (pdf, doc itp.). Skanowane i pobierane będą jedynie ogólnodostępne materiały. Właściciele serwisów, którzy nie chcą udostępniać ich w procesie archiwizacji mogą bardzo łatwo wyłączyć swoje strony z indeksów robota (NLNZHarvester2010) – wystarczy odpowiednio zmodyfikować plik robots.txt.
Organizatorzy akcji zakładają zabezpieczenie około 140 milionów linków, co ma wygenerować archiwum wielkości 7-8 terabajtów.
Biblioteka Narodowa Nowej Zelandii sczytuje krajowy internet na mocy National Library of New Zealand Act (2003). Zebrane materiały przechowywane będą w siedzibie biblioteki – w Wellington oraz w bibliotekach filialnych (kopie archiwum). Jak zaznaczają przedstawiciele Biblioteki, pozyskane zasoby udostępniane będą użytkownikom po ostatecznym opracowaniu kwestii prawnych.
Pierwszą akcję archiwizacji nowozelandzkiego internetu zorganizowano w październiku 2008 roku. Zebrano treści z ponad 106 milionów adresów (URL) o łącznej objętości 4.6 terabajta. Statystykę rodzaju pozyskanych zasobów przedstawia poniższa tabelka.
Więcej szczegółowych informacji na temat działań z 2008 roku znaleźć można w tym dokumencie.
Tymczasem w polskim Archiwum Internetu przechowywane są archiwalne wersje stron 41 instytucji: Prezydenta, Premiera, Sejmu, Senatu, Ministerstwa Kultury i Dziedzictwa Narodowego oraz 34 archiwów i Naczelnej Dyrekcji Archiwów Państwowych, a także Muzeum Narodowego w Krakowie.
Warto obserwować dalsze działania Narodowego Archiwum Cyfrowego w tym kierunku. Być może – wobec braku możliwości zorganizowania podobnej do nowozelandzkiej akcji polskimi siłami – NAC – podobnie jak Biblioteka Narodowa Nowej Zelandii – mógłby nawiązać współpracę z Internet Archive? Otwarte oczywiście pozostają kwestie prawne takiego projektu (legalność zbierania i udostępniania zebranych zasobów).
Zob. też: Czy zachowamy cyfrowe dziedzictwo? Penny Carnaby i delete generation.