Nowa Zelandia po raz kolejny archiwizuje swój internet

link

Biblioteka Narodowa Nowej Zelandii po raz kolejny rozpoczyna akcję archiwizowania zasobów krajowego internetu. Od 12 maja przez czternaście dni Biblioteka (we współpracy z Internet Archive udostępniającym oprogramowanie do sczytywania) kopiować będzie zawartość nowozelandzkich stron – głównie z domen .nz, ale także .com, .net i .org (jeśli podpięte pod nie serwisy hostowane są na krajowych serwerach).

Zabezpieczone zostaną główne serwisy internetowe kraju, w tym strony czasopism i instytucji, ale także blogi i strony domowe, fotografie, materiały multimedialne, dokumenty (pdf, doc itp.). Skanowane i pobierane będą jedynie ogólnodostępne materiały. Właściciele serwisów, którzy nie chcą udostępniać ich w procesie archiwizacji mogą bardzo łatwo wyłączyć swoje strony z indeksów robota (NLNZHarvester2010) – wystarczy odpowiednio zmodyfikować plik robots.txt.

Organizatorzy akcji zakładają zabezpieczenie około 140 milionów linków, co ma wygenerować archiwum wielkości 7-8 terabajtów.

Biblioteka Narodowa Nowej Zelandii sczytuje krajowy internet na mocy National Library of New Zealand Act (2003). Zebrane materiały przechowywane będą w siedzibie biblioteki – w Wellington oraz w bibliotekach filialnych (kopie archiwum). Jak zaznaczają przedstawiciele Biblioteki, pozyskane zasoby udostępniane będą użytkownikom po ostatecznym opracowaniu kwestii prawnych.

Pierwszą akcję archiwizacji nowozelandzkiego internetu zorganizowano w październiku 2008 roku. Zebrano treści z ponad 106 milionów adresów (URL) o łącznej objętości 4.6 terabajta. Statystykę rodzaju pozyskanych zasobów przedstawia poniższa tabelka.

Więcej szczegółowych informacji na temat działań z 2008 roku znaleźć można w tym dokumencie.

Tymczasem w polskim Archiwum Internetu przechowywane są archiwalne wersje stron 41 instytucji: Prezydenta, Premiera, Sejmu, Senatu, Ministerstwa Kultury i Dziedzictwa Narodowego oraz 34 archiwów i Naczelnej Dyrekcji Archiwów Państwowych, a także Muzeum Narodowego w Krakowie.

Warto obserwować dalsze działania Narodowego Archiwum Cyfrowego w tym kierunku. Być może – wobec braku możliwości zorganizowania podobnej do nowozelandzkiej akcji polskimi siłami – NAC – podobnie jak Biblioteka Narodowa Nowej Zelandii – mógłby nawiązać współpracę z Internet Archive? Otwarte oczywiście pozostają kwestie prawne takiego projektu (legalność zbierania i udostępniania zebranych zasobów).

Zob. też: Czy zachowamy cyfrowe dziedzictwo? Penny Carnaby i delete generation.

O ile nie zaznaczono inaczej tekstowa treść tego artykułu jest dostępna na licencji CC BY-SA 3.0.

Powiązane wpisy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *