Stylometrická analýza církevněslovanských textů české provenience
Autoři | |
---|---|
Rok publikování | 2023 |
Druh | Článek v odborném periodiku |
Časopis / Zdroj | SLAVIA-časopis pro slovanskou filologii |
Fakulta / Pracoviště MU | |
Citace | |
www | https://www.slu.cas.cz/cs/slavia |
Doi | http://dx.doi.org/10.58377/slav.2023.5.06 |
Klíčová slova | cluster analysis; Czech Church Slavonic; lexical diversity; stylometric analysis; token length |
Popis | Příspěvek představuje pilotní studii stylistické analýzy českých církevněslovanských textů. Cílem studie je měření podobností/rozdílů mezi texty na základě vybraných kvantitativních charakteristik. Konkrétně je použita průměrná délka tokenu (ATL), klouzavý průměrný poměr typů a tokenů (MATTR) a textové vzdálenosti určené normalizovanými frekvencemi nejfrekventovanějších slov (MFW). Pro analýzu byl použit korpus dvanácti církevněslovanských literárních spisů připisovaných (s různou pravděpodobností) českým autorům v 10. a 11. století. Navíc byly přidány další dva textové prameny (Codex Suprasliensis a Život svatého Metoděje), aby bylo možné porovnat výsledky a získat komplexnější pohled na vztahy mezi texty. Výsledky ukazují věrohodnost aplikace metod na tomto specifickém vzorku textů. |