Problemy z archiwizowaniem cyfrowych danych uderzą w historyków?
Artykuł Roberta Colvila z The Daily Telegraph to kolejny dowód na to, że pisanie o relacjach między historią a internetem to nie przykład myślenia w kategoriach fantastyki, ale opisywanie problemu, który z roku na rok stawać się będzie coraz bardziej istotny.
Colvile pisze między innymi o sprawie przechowywania danych cyfrowych i możliwościach ich późniejszego wykorzystania przez historyków. Zastosowanie magnetycznych nośników danych dobrej jakości i procedury regularnego wykonywania kopii zapasowych to nie wszystko. Problemem może okazać się również dostęp do treści niektórych formatów danych: grupa inżynierów poszukiwała niedawno taśm z lądowania na Księżycu, zagubionych lata temu przez NASA, ale pozostało już tylko jedno zdezelowane urządzenie zdolne je odtworzyć. Częściowym przynajmniej rozwiązaniem może być stosowanie otwartych standardów formatów plików, które odczytywane mogą być dzięki temu przez wiele niezależnych od siebie programów: Im bardziej skomplikowany i specjalistyczny program, tym trudniej o odzyskanie danych: kosztujący miliony funtów projekt BBC, by stworzyć dla Wielkiej Brytanii elektroniczną księgę katastralną, z której w latach 80. korzystało ponad milion ludzi, na przełomie wieków był już prawie niemożliwy do odczytania.
Techniczne kłopoty z dostępem do historycznych danych mogą wpływać na pracę przyszłych historyków: Biografowie mogli niegdyś badać zbiory listów pisanych przez sławne osoby, ale teraz porządkowanie poczty e-mailowej jakiegoś polityka czy pisarza może doprowadzić do zniszczenia bezcennych notatek. Brytyjczycy wysyłają miesięcznie cztery miliardy wiadomości tekstowych, a te niezachowane w telefonach są utracone na zawsze. Także strony internetowe znikają, gdy wygaśnie ich żywot lub ich twórcy przestaną się nimi interesować.

Ważna jest również kwestia odróżniania materiałów wartościowych od tych, które nie przydadzą się do niczego. Ilość danych rośnie lawinowo. Archiwum Narodowe musi na przykład przechowywać około pięciu procent dokumentów rządowych i ten zbiór z 900 lat liczy 580 terabajtów danych. A w zeszłym roku powstało na świecie 157 milionów terabajtów danych, co jest ilością niemal niewyobrażalną.
Colvile powołuje się na przykład serwisu Archive.org, który archiwizuje serwisy internetowe i pozwala na odwiedzanie historycznych wersji stron (np. strony głównej Onetu z 1997 roku).
Problemem kolejnym jest kwestia praw autorskich. Jeśli umieszczę swoje wideo na YouTube, czy jest to dokument historyczny? Kłopoty mają zwłaszcza wyszukiwarki, takie jak Google. Aby odpowiedzieć nam w ułamku sekundy, Google nie przeszukuje całej sieci, lecz jej kopię (”cache”), aktualizowaną przez zautomatyzowane programy i przechowywaną na tysiącach połączonych komputerów, które znajdują się w ogromnych halach na całym świecie. Czy te dane należą do ich twórców, czy do Google? A co w przypadku jeśli Google przechowuje na przykład treść książek, do których wyłączne prawo roszczą sobie ich autorzy?
Według Colvila być może masowe korzystanie z narzędzi udostępnianych przez wielkie internetowe firmy stanie się praktycznym rozwiązaniem tego problemu. Wielu ludzi umieszcza obecnie swoje zdjęcia nie na zawodnych dyskach, lecz w sieci, w archiwach takich jak Flickr. Być może kiedyś, gdy otrzymamy żelazne gwarancje bezpieczeństwa i prywatności, będziemy mogli w ten sposób przechowywać wszelkie zapisy, przerzucając związane z tym ryzyko na firmy takie jak Google, które są znacznie lepiej przygotowane do ochrony danych. O wiele łatwiej byłoby też wtedy przeglądać informacje i nimi operować.
Artykuł źródłowy na stronach The Daily Telegraph
Tłumaczenie artykułu na stronach Onet.pl
Opis narzędzi i zasobów dostępnych w ramach Internet Archive

