• 130.

    Nowe metody OCRu dla wczesnych druków

    http://digitalia.sbn.it/article/view/2630

    Ważnym problemem przy rozpoznawaniu tekstu w skanach druków sprzed XIX wieku jest to, że mechanizmy rozpoznawania trenowane są na źródłach z mało zróżnicowanymi typami czcionek. Projekt OCR-D ma rozwiązywać ten problem poprzez zaproponowanie mechanizmu automatycznego wyznaczania typu (grupy) czcionek w zeskanowanym tekście i wybierania modelu ich rozpoznawania. #ocr

    Weichselbaumer, N., Seuret, M., Limbach, S., Dong, R., Burghardt, M., & Christlein, V. (2020). New Approaches to OCR for Early Printed Books. DigItalia, 2, 74-87.

    Dodane przez: mw | 2021-01-09 | Udostępnij na Facebooku | Udostępnij na Twitterze
    Jeśli nie chcesz pominąć nowych wpisów, subskrybuj kanał RSS lub newsletter. Newsletter wysyłany jest co tydzień w piątek, znajdziesz w nim podsumowanie ostatnio dodanych wpisów i nowe treści, których nie ma na stronie.

    Czy wiesz, czym jest Web scraping? Zwiększ zasięg swojego badania i zamów dane z internetu