Tim Hitchcock i the Infinite Archive
W styczniu odbyła się coroczna konferencja British Society for Eighteenth-century Studies. Jednym z jej uczestników był prof. Tim Hitchcock, dyrektor projektu The Old Bailey Proceedings (o którym napiszę wkrótce). Na swoim blogu Hitchcock opublikował tekst swojego wystąpienia, wygłoszonego podczas sesji otwierającej konferencję. Warto zapoznać się z tym materiałem, ponieważ podjęty jest w nim problem filozofii badań w cyfrowej przestrzeni nieskończonego archiwum:
Many of the manuscript collections of eighteenth century American figures are now available on line, as are the papers of Hartlib, Newton and Darwin. Soon, 40 million words of everyday manuscripts from eighteenth-century London – hospital and workhouse records, parish and voting records – will be available online in a keyword searchable form. And of course, you can add to this all those representations of artefacts and images – tied perhaps less securely to our finding aids, but newly accessible in a new way, through museum websites and commercial image galleries. In other words, what is being created is an entirely new and comprehensive library of the textual and artefactual leavings of the dead. And the question I find myself continually asking is what do we do with it?
Tim Hitchcock podkreśla, że o ile nie zmienia się klasyczna metoda krytyki źródeł, pojawiają się nowe możliwości związane z automatyczną analizą zawartości dużych zestawów dokumentów: to take just a single example, with just a little technical nous, you can trace a single phrase, or a set of ideas as expressed in a set of phrases, across 40 billion words of text – to chart the borrowings and adaptations, to test the roles of context and structure. Jednak nowe technologie pozwolić mogą – zdaniem Hitchcocka – w niedostępny dotąd sposób badać przeszłość. Historyk posługując się odpowiednim algorytmem odnaleźć może w milionach stron zdigitalizowanych dokumentów poszczególne fragmenty odnoszące się do badanej przez niego osoby, instytucji czy zjawiska i w ten sposób stworzyć niemal całościowy jej obraz, obejmujący wszystkie sfery, które w jakikolwiek sposób odcisnęły swój ślad w treści źródeł.
Pojęcie nieskończonego archiwum (infinite archive) pojawia się często w dyskusjach dotyczących digital history. Wydaje się, że jest to jeden z najważniejszych problemów metodologicznych tej dziedziny. Wzrastająca lawinowo ilość dostępnych online zasobów zdigitalizowanych źródeł pozornie ułatwia pracę historyka, który bez kosztownych wypraw do zagranicznych archiwów może na domowym komputerze zebrać potencjalnie przynajmniej część materiałów do swojej pracy. Jeśli jednak okazuje się, że materiałów, które mogą być istotne, jest zbyt wiele jak na możliwości percepcji jednego człowieka? Czy w takim przypadku research zrobiony za pomocą odpowiedniego algorytmu (np. automatycznego przeszukania treści źródeł w poszukiwaniu odpowiedniego słowa kluczowego) jest pod względem metodologicznym równorzędny podobnej pracy, którą miałby zrobić sam historyk? Czy analiza, którą wykonuje komputer, może mieć taką samą wartość jak badanie zrealizowane przez człowieka?
CC-BY Lisa Spiro
Z zagadnieniem infinite archive łączy się problem digital preservation. Pisał o tym Roy Rosenzweig w eseju Scarcity or Abundance? Preserving the Past in a Digital Era. Być może zamiast nadmiaru źródeł, dostępnych w rozszerzającym się wciąż cyfrowym archiwum przyszłych historyków czeka katastrofa związana z rozpadem danych cyfrowych? Już teraz – jak pisze Daniel J. Cohen w The Future of Preserving the Past – pojawiają się nowe formy źródeł historycznych mające wyłącznie cyfrową postać (np. wpisy na blogach relacjonujące wydarzenia 11 września 2001 roku). Czy istnieją narzędzia, które pozwolą na ich skuteczne zarchiwizowanie i udostępnianie?
• • •
Tagi: Digital preservation, infinite archive, Tim Hitchcock
Kategorie: Nowa metodologia






Komentarze