Reprezentace významu sloves (valence a sémantické role)
Autoři | |
---|---|
Rok publikování | 2010 |
Druh | Článek ve sborníku |
Konference | Sborník konference Kognice 2010 |
Fakulta / Pracoviště MU | |
Citace | |
Klíčová slova | representation of the verb meanings valency frames VerbaLex semantic roles |
Popis | V článku věnujeme pozornost valenčním rámcům českých sloves a lexikální databázi VerbaLex čítající 6 360 synsetů, 21 193 literálů, 10 482 lemmat, 19 556 valenčních rámců a 82 sémantických tříd. Databáze vznikala od r. 2005 v Centru zpracování přirozeného jazyka FI MU v Brně. Zmíníme se také o podobných zdrojích jak pro češtinu (Vallex, (Lopatková, Žabokrtský)), tak i pro angličtinu (WordNet, (Fellbaum a VerbNet, Kipper)). Základními jednotkami (hesly) jsou slovesná lemmata organizovaná v synonymických řadách (synsetech) s čísly významů, která mají v českém WordNetu (CzWN). Jednotlivým lemmatům jsou přiřazeny komplexní valenční rámce (KVR) zachycující informaci o morfosyntaktických (pády) a sémantických vlastnostech slovesných argumentů. Sémantické ohodnocení argumentů zachycujeme sémantickými rolemi tvořenými: a) hlavními rolemi založenými na prvcích vybraných z vrcholové ontologie EuroWordNetu (Vossen et al), tj. cca 40 značkami jako SUBS – substance, ENT – entita, PART – part, COM – communication, ACT – action, INS – instrument, GROUP – group aj. b) subkategorizačními rysy majícímí podobu literálů vybraných z Princetonského WordNetu (PWN), jichž je kolem 1000. Literály jsou součástmi uzlů v hypero/hyponymických stromech tvořících posloupnosti sémantických rysů popisujících význam lexikálních jednotek vyskytujících se v konkrétních valenčních rámcích. |
Související projekty: |