Competing Patterns in Language Engineering and Computer Typesetting
Název česky | Soutěživé vzory v jazykovém inženýrství a počítačové sazbě |
---|---|
Autoři | |
Rok publikování | 2005 |
Druh | Účelové publikace |
Fakulta / Pracoviště MU | |
Citace | |
Popis | Cílem této dizertační práce je vývoj modelů, metod a metodologie pro strojové učení kompaktního a efektivního uložení dat v~oblastech jazykového inženýrství a počítačové sazby, se zaměřením na masivní zpracování výjimek. Výzkum se soustředil na přístup řízený vzory. Byla vyvinuta celá metodologie takzvaných přebíjejících vzorů, pomocí níž je možné zpracovat (detekovat, efektivně uložit a v~nich vyhledávat) výjimky. Přebíjející vzory umožňují ukládat kontextově závislou informaci, která může být naučena z~dat, nebo napsána expertem, nebo vzájemně kombinována. První část práce buduje teorii přebíjejících vzorů; jsou definovány základní techniky metodologie jako stratifikace, bootstraping, filtrování dat. Užití technologie je ukázáno na příkladech segmentačních problémů (dělení slov) a problému parciální morfologické desambiguace značkovaných dat v~oblasti korpusové lingvistiky. Druhá část práce obsahuje soubor sedmi publikovaných článků, které se zabývají nasazením navržené metodologie a diskutují její možnosti a aplikace v~oblastech dělení slov, dělení složených slov, generování přebíjejících vzorů pro češtinu a slovenštinu a například i segmentaci thajského textu. |
Související projekty: |