Co dobrego w menu? Crowdsourcing w Bibliotece Publicznej Nowego Jorku
Biblioteka Publiczna Nowego Jorku (New York Public Library) zaprosiła użytkowników internetu do wspólnej pracy nad transkrypcją treści archiwalnych kart dań z nowojorskich restauracji. Najstarsze menu pochodzą z lat 40 XIX wieku.
With approximately 45,000 menus dating from the 1840s to the present, The New York Public Library’s restaurant menu collection is one of the largest in the world, used by historians, chefs, novelists and everyday food enthusiasts. Trouble is, the menus are very difficult to search for the greatest treasures they contain: specific information about dishes, prices, the organization of meals, and all the stories these things tell us about the history of food and culture.
W 2001 roku biblioteka umieściła na swoich stronach fotografie ponad 9 tys. kart dań – ich treść została przepisana przez internautów w trzy miesiące. Teraz ambicją New York Public Library jest opracowanie całej kolekcji. Czy nie można tego jednak zrobić automatycznie za pomocą OCR?
Użycie automatycznego rozpoznawania znaków pozwoliłoby jedynie na podstawowe zczytanie treści menu. Tymczasem założeniem organizatorów akcji jest przygotowanie bazy, której konstrukcja zakłada tworzenie relacji między poszczególnymi rodzajami danych oraz udostępnianie informacji, których komputer nie jest w stanie uzyskać (np. informacji o lokalizacji lokalu). Problemem jest też to, że wiele z kart opisanych jest pismem odręcznym, które utrudnia sczytywanie.
Przepisane już karty dań przeglądać można na tej stronie. Biblioteka przygotowuje się też do udostępnienia surowych danych, które wykorzystać będzie można w innych, już nie tylko naukowych projektach.
Informacje o najciekawszych znaleziskach z kolekcji około 45 tys. kart znaleźć można na blogu projektu.
Fotografia pochodzi z kolekcji New York Public Library
Pozostańmy w kontakcie! Zachęcamy do subskrybcji newslettera oraz korzystania z profilu Historia i Media na Facebooku i Twitterze.