Homonymie mezi oikonymy a antroponymy zakončenými na -slav jako problém automatické morfologické analýzy
Autoři | |
---|---|
Rok publikování | 2020 |
Druh | Vyžádané přednášky |
Fakulta / Pracoviště MU | |
Citace | |
Popis | Homonymie na všech úrovních, která je charakteristickým rysem všech přirozených jazyků, je také jednou z nejvýznamnějších překážek automatického zpracování přirozeného jazyka. V tomto příspěvku upozorníme na morfosyntaktické rozdíly českých antroponym končících na -slav (typ Miroslav, maskulinum) a českých oikonym se stejným zakončením (typ Miroslav, femininum) a českých antroponym končících na -slava (typ Miroslava, femininum), protože jeho formy jsou homonymní s oběma: mužskými antroponymy a ženskými oikonymy). Analýza dat z korpusu SYN v8 ukazuje, že homonymie slovního tvaru významně ovlivňuje výsledky automatické morfologické analýzy. Zdokumentujeme chyby v pokrytí slovníku automatického analyzátoru a především chyby v morfologickém značení a navrhneme řešení pro částečné vylepšení automatické desambiguace daného typu vlastních jmen. |
Související projekty: |