Sustainable long-term WordNet development and maintenance: Case study of the Czech WordNet

Publikace nespadá pod Filozofickou fakultu, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.

Název česky Dlouhodobě udržitelný vývoj a údržba WordNetu: případová studie češtiny
Autoři

RAMBOUSEK Adam PALA Karel HORÁK Aleš

Druh Článek v odborném periodiku
Časopis / Zdroj Cognitive Studies | Études cognitives
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
WWW Open Access Journal
Doi http://dx.doi.org/10.11649/cs.1715
Klíčová slova EuroWordNet; BalkaNet; wordnet; Czech WordNet; DEBVisDic
Popis Český Wordnet představuje jeden z prvních národních wordnetů, které byly vytvořeny během projektů EuroWordNet a BalkaNet. Bohužel data obsahují různé problémy, které mohou ovlivnit využití českého WordNetu v NLP aplikacích. Od zveřejněné první verze CzWN byly sémantická síť v několika fázích rozšířena, ale komplexní finální úpravy a proces zveřejněný zatím nejsou dokončené. V roce 2017 jsme spustili projekt k vyhodnocení a aktualizaci českého WordNetu a také propojení s Collaborative Interlingual Index. V tomto článku poskytujeme přehled verzí a rozšíření českého Wordnetu a také plán pro publikaci aktualizované verze s otevřenou licencí. Dále představujeme koncept dlouhodobých aktualizací a údržby dat založený na crowdsourcingu.
Související projekty: