Pre-processing Large Resources for Family Names Research
Název česky | Zpracování velkých zdrojů pro výzkum příjmení |
---|---|
Autoři | |
Rok publikování | 2016 |
Druh | Článek ve sborníku |
Konference | RASLAN 2016 Recent Advances in Slavonic Natural Language Processing |
Fakulta / Pracoviště MU | |
Citace | |
www | PDF full paper |
Obor | Informatika |
Klíčová slova | DEB platform; lexicography; big data; family names; data conversion |
Popis | Článek popisuje metodologii a nástroje použité pro zpracování archivních dokumentů v různých formátech a jejich konverzi do jednotného formátu. Zdroje byly použity pro výzkum původu a geografické distribuce příjmení ve Spojeném království, jako součást projektu Family Names in Britain and Ireland. Data extrahovaná z dokumentů a jejich vzájemné propojení se ukázalo jako cenný výzkumný zdroj, který urychlil lexikografický výzkum. |
Související projekty: |