Korpusové zpracování korespondenčních textů : morfologické značkování

Logo poskytovatele
Autoři

HLAVÁČKOVÁ Dana

Rok publikování 2013
Druh Kapitola v knize
Fakulta / Pracoviště MU

Filozofická fakulta

Citace
Popis Článek shrnuje zkušenosti s korpusovým zpracováním korespondenčních textů. Pozornost je věnována především lemmatizaci, morfologickému značkování a desambiguaci textů s vysokou frekvencí substandardních jazykových jevů. Při analýze jazyka soukromé korespondence byly také využity zkušenosti získané při morfologickém značkování Brněnského mluveného korpusu. Morfologický analyzátor ajka byl doplněn o nejfrekventovanější substandardní lemmata a slovní tvary, které se vyskytly ve zkoumaných korespondenčních textech. V článku jsou dále popsány nutné úpravy morfologického analyzátoru, podíl ruční anotace a získané výsledky.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.