Typ Kladenští jako problém automatické morfologické analýzy
Autoři | |
---|---|
Rok publikování | 2020 |
Druh | Další prezentace na konferencích |
Fakulta / Pracoviště MU | |
Citace | |
Popis | Cílem našeho příspěvku bude demonstrovat postupy, jejichž pomocí lze na základě korpusu, konkrétně webového korpusu Araneum Bohemicum IV Maximum (Czech, 20.03) 7.10 G řady ARANEA, získat data potřebná ke zpřesnění nástrojů používaných pro automatickou morfologickou analýzu češtiny. Cílem sondy do webového korpusu Aranea tedy bude: - vytvoření seznamu frekventovaných proprií typu Kladenští; - jejich korpusově založený popis, který lze použít jako východisko pravidlové desambiguace. Domníváme, že taková sonda může přispět ke zlepšení výsledků automatického morfologického značkování. |
Související projekty: |