Towards Digital Mathematical Library: Optical Character Recognition of Mathematical Texts

Varování

Publikace nespadá pod Filozofickou fakultu, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.
Název česky Budování digitální matematické knihovny: OCR matematických textů
Autoři

SOJKA Petr ŠTULLER Julius LINKOVÁ Zdenka

Rok publikování 2006
Druh Článek ve sborníku
Konference Inteligentní modely, algoritmy a nástroje pro vytváření sémantickeho webu
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
www Full paper--proceedings
Obor Dokumentace, knihovnictví, práce s informacemi
Klíčová slova OCR; Optical Character Recognition; DML-CZ; digitization; Digital mathematics library project
Popis Článek popisuje prototyp řešení OCR matematických textů vztvořený pro skenovaná data projektu DML CZ. Řešení spočívá v kombinaci programů FineReader a InftyReader. Dosažená chybovost (počítave nejen překlepy, ale i chyby rozpoznání matematických formulí a tzpů písem) klesla z úvodních 12% pod 1%.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.