Finisz projektu Europeana Newspapers

18 mln europejskich gazet zostało zdigitalizowanych w ramach projektu Europeana Newspapers. Zainicjowany w 2007 roku i finansowany ze środków Komisji Europejskiej w ramach Programu Ramowego na rzecz Konkurencyjności i Innowacji 2007-2013 projekt kończy się w tym roku.

Udostępnione w jego ramach skany były automatycznie przetwarzane na tekst (OCR), dzięki czemu można je dziś przeszukiwać pełnotekstowo, korzystając z wyszukiwarki na stronach European Library. W opracowaniu rozpoznawanej treści wykorzystano także narzędzia do optycznego rozpoznawania układu strony (OLR – Optical Layout Recognition) oraz rozpoznawania nazw (NER – Name Entity Recognition). Dzięki temu możliwe stało się wydzielenie treści poszczególnych artykułów zamieszczonych na jednej digitalizowanej stronie. Warto dodać, że w ramach Europeana Newspapers przeszukiwać można także polskie gazety – ponad 15 tys. numerów 116 tytułów pochodzących ze zbiorów Biblioteki Narodowej.

Częścią Europeana Newspapers jest także ankieta dotycząca projektów digitalizacji prasy podejmowanych w europejskich bibliotekach i archiwach. Badanie dotyczyło nie tylko tytułów czasopism objętych digitalizacją i ich liczby, ale także np. zasad udostępniania. Wyniki badania przedstawia komunikat zamieszczony na stronach Biblioteki Narodowej.

Biblioteka Narodowa w drugiej połowie grudnia organizować będzie wydarzenie podsumowujące projekt.