Kolektywna transkrypcja archiwaliów – Transcribe Bentham

link

Transcribe Bentham to projekt, którego celem jest społecznościowe opracowanie rękopisów Jeremy’ego Benthama, udostępnianych przez archiwum University College London. UCL przechowuje 60 tys. kart rękopisów autorstwa angielskiego filozofa, jednak tylko jedna trzecia tego zasobu jest dziś opisana i stranskrybowana. Sposobem na zintensyfikowanie prac nad archiwum Benthama ma być otwarcie się na aktywność wolontariuszy działających online.

Osią projektu jest specjalnie przygotowany serwis wiki, na którym znajdują się podstawowe informacje związane z metodologią transkrypcji oraz skany do opracowania. Transkrypcja nie polega tu jednak na prostym przepisaniu tekstu (nawet gdyby, trudno byłoby w przypadku rękopisów skorzystać z oprogramowania OCR), ale opracowaniu jego XML-owej wersji. Organizatorzy projektu odeszli od wykorzystywania standardowych dokumentów Worda, które uniemożliwiały dokładne odtworzenie treści i struktury rękopisu (przekreśleń, dopisków itp.). Odpowiednio zdefiniowana składnia XML pozwala na bardzo dokładne oddanie wszystkich elementów dokumentu:

Przykładowy dokument opracowywany w ramach projektu podejrzeć można choćby na tej stronie. Edytorzy – oprócz transkrypcji treści – przygotowują także odpowiedni zestaw metadanych opisujących analizowany tekst.

Problemem w takich projektach jest zawsze aktywność użytkowników, którzy chcą działać dobrowolnie i za darmo. W opracowywaniu rękopisów Benthama biorą udział (w ramach swoich szkolnych obowiązków) uczniowie brytyjskich szkół, co w pewnym sensie zabezpiecza całą inicjatywę przed zastojem spowodowanym brakiem wolontariuszy: Transcribe Bentham is, in fact, a heritage learning project which allows school pupils to interact with archival material and to take an active role in the preservation and understanding of our past. Do tej pory opracowano prawie 18 proc. rękopisów z przygotowanej przez UCL puli (szczegółowe statystyki dostępne są tutaj).

W brytyjskim projekcie wykorzystywane jest oprogramowanie MediaWiki, jednak CHNM pracuje już nad specjalistycznym oprogramowaniem do kolektywnej transkrypcji archiwaliów – Scripto.

O ile nie zaznaczono inaczej tekstowa treść tego artykułu jest dostępna na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 3.0 Unported.

Powiązane wpisy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Current ye@r *