Web Curator Tool - archiwizuj zasoby internetowe
Maciej Rynarzewski, 21.05,2009
Czas życia strony internetowej uzależniony jest od wielu czynników, a jej treść zmieniana może być nawet kilkukrotnie w ciągu dnia. W wielu przypadkach wraz z kolejnymi aktualizacjami znikają także opublikowane na niej wcześniej informacje, zmienia się wygląd czy nawet dostępność. Treść oraz forma serwisów internetowych może być jednak bardzo ważnym elementem dziedzictwa kulturowego i źródłem wiedzy dla współczesnych - ale przede wszystkim przyszłych naukowców. To ważny materiał badawczy, z którego korzystać mogą socjologowie, etnografowie czy historycy.
Dlatego zagadnienie digital preservation staje się coraz bardziej istotnym elementem dyskusji oraz inspiracją różnorakich internetowych projektów i narzędzi. Niedawno swoją premierę miała kolejna już wersja narzędzia służącego do selektywnego archiwizowania stron internetowych - programu Web Curator Tool.
Web Curator Tool jest wspólnym projektem National Library of New Zealand oraz International Internet Preservation Consortium. Oprogramowanie WTC zostało zbudowane i jest rozwijane dzięki firmie Sytec Resources Ltd.. Program dostępny jest w internecie za darmo na zasadach licencji Apache Public License.
WTC zaprojektowany został jako przyjazne narzędzie do wykorzystania przede wszystkim w bibliotekach, w których do zakresu obowiązków bibliotekarzy włączono zadanie archiwizowania określonych zasobów internetowych. Program działa w formie prostej aplikacji dostępnej z poziomu przeglądarki internetowej. Oprogramowanie wykorzystuje m. in. istniejące już skrypty-roboty indeksujące (web crawlers). Te dwa główne crawlery to spełniający podstawowe funkcje Heritrix oraz Wayback - open source’owa wersja silnika stworzonego dla archives.org - wykorzystanego w projekcie Wayback Machine.
WTC daje możliwość m. in. wyselekcjonowania z całej strony internetowej poszczególnych jej elementów przeznaczonych do zarchiwizowania. Umożliwia także administrowanie projektami archiwizacyjnymi oraz opisywanie zebranych materiałów metadanymi w formacie Dublin Core. Do udostępniania zebranych danych wykorzystywane muszą być już jednak zewnętrzne rozwiązania, ponieważ jak na razie platforma WTC nie posiada takiej funkcji.
W czasopiśmie D-Lib Magazine przeczytać możemy raport z doświadczeń w posługiwaniu się Web Curator Tool. Artykuł dotyczy co prawda poprzednich wersji oprogramowania, pozwala jednak zapoznać się z mechanizmem jego funkcjonowania. Znajdziemy w nim także case study dotyczące zastosowania WTC w archiwizacji danych dotyczących wyborów samorządowych w Nowej Zelandii w roku 2007.
Web Curator Tool to stosunkowo prosty darmowy program do archiwizacji zasobów internetowych. Może być dobrym narzędziem dla wielu instytucji dopiero planujących własne inicjatywy w tym kierunku.
Kategorie: Internet / Narzędzia
Tagi: Digital preservation
Brak komentarzy