Republic of Letters – wizualizacja dużego zestawu danych historycznych
Visualization of Republic of Letters to bardzo ciekawy projekt zrealizowany w Stanford Humanities Center. Jego podstawą są dane pozyskane z Electronic Enlightenment database. Na podstawie 55 tys. listów zbudowano wizualizację komunikacji ponad 6 tys. autorów piszących w latach 1700-1750 w ramach oświeceniowej rzeczpospolitej uczonych (Respublica literaria).
Oprócz merytorycznego znaczenia tego projektu (możemy obserwować jak kształtowała się sieć tej specyficznej wspólnoty) warto zwrócić uwagę także na jego metodologię. Tak ogromny zasób źródeł nie może być łatwo zanalizowany przez historyka – konieczne jest wsparcie komputera. Listy z Electronic Enlightenment Database (które są podstawą tej wizualizacji) dostępne są w bazie w formie pełnotekstowej. Oznacza to, że ich treść (a nie tylko metadane) może być swobodnie przeszukiwana:
our combination of XML, XHTML and MySQL means that — potentially — every piece of data is separately searchable and therefore significant: from page numbers in a late 18th-century printed source, to an individual correspondent’s age or location at the time of writing a specific letter.
Dzięki takiemu charakterowi bazy można było w prosty sposób wygenerować zestawy danych potrzebne do przygotowania wizualizacji (np. przygotować statystyki dla poszczególnych autorów czy miast). Zdaniem jej twórców współpraca między informatykami i historykami ma ogromny potencjał: The new challenges posed by an exponentially growing corpus of online historical data also present an opportunity for collaborations with computer scientists interested in data visualization, interpretation, and human-computer interaction. Computer scientists are deeply interested in how users interact with visualization tools to explore, explain, and engage with data to create meaning. We engaged in an iterative, collaborative effort that brought together historians, computer scientists, and an academic technology specialist to design data visualizations to represent the intellectual network of the Republic of Letters.
• • •
Kategorie: Zasoby
Skrócony link: Kopiuj adres odnośnika
O ile nie zaznaczono inaczej tekstowa treść tego artykułu jest dostępna na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 3.0 Unported.
Instytucje odpowiedzialne za digitalizację polskiego dziedzictwa przyjęły jako standard skanowanie bez OCR – projekt taki jak powyższy w takich warunkach nigdy nie będzie zrealizowany. Argument jest oczywiście prosty: pełny tekst jest za drogi i zbyt czasochłonny. Ale na powyższym przykładzie widać, że przynajmniej „punktowo” należy dokonywac pełnej digitalizacji, umożliwiającej maszynową pracę na treści.
W tłumaczenie wkradła się tu niezręczność. Łacińska „Respublica literaria” to po polsku rzeczpospolita uczonych (taka forma przyjęta została w badaniach nad renesansem i humanizmem), a nie republika listów.