Stylometrická analýza církevněslovanských textů české provenience

Autoři

ČECH Radek VEPŘEK Miroslav

Rok publikování 2023
Druh Článek v odborném periodiku
Časopis / Zdroj SLAVIA-časopis pro slovanskou filologii
Fakulta / Pracoviště MU

Filozofická fakulta

Citace
www https://www.slu.cas.cz/cs/slavia
Doi http://dx.doi.org/10.58377/slav.2023.5.06
Klíčová slova cluster analysis; Czech Church Slavonic; lexical diversity; stylometric analysis; token length
Popis Příspěvek představuje pilotní studii stylistické analýzy českých církevněslovanských textů. Cílem studie je měření podobností/rozdílů mezi texty na základě vybraných kvantitativních charakteristik. Konkrétně je použita průměrná délka tokenu (ATL), klouzavý průměrný poměr typů a tokenů (MATTR) a textové vzdálenosti určené normalizovanými frekvencemi nejfrekventovanějších slov (MFW). Pro analýzu byl použit korpus dvanácti církevněslovanských literárních spisů připisovaných (s různou pravděpodobností) českým autorům v 10. a 11. století. Navíc byly přidány další dva textové prameny (Codex Suprasliensis a Život svatého Metoděje), aby bylo možné porovnat výsledky a získat komplexnější pohled na vztahy mezi texty. Výsledky ukazují věrohodnost aplikace metod na tomto specifickém vzorku textů.

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.