Sustainable long-term WordNet development and maintenance: Case study of the Czech WordNet
Název česky | Dlouhodobě udržitelný vývoj a údržba WordNetu: případová studie češtiny |
---|---|
Autoři | |
Rok publikování | 2018 |
Druh | Článek v odborném periodiku |
Časopis / Zdroj | Cognitive Studies | Études cognitives |
Fakulta / Pracoviště MU | |
Citace | |
www | |
Doi | http://dx.doi.org/10.11649/cs.1715 |
Klíčová slova | EuroWordNet; BalkaNet; wordnet; Czech WordNet; DEBVisDic |
Popis | Český Wordnet představuje jeden z prvních národních wordnetů, které byly vytvořeny během projektů EuroWordNet a BalkaNet. Bohužel data obsahují různé problémy, které mohou ovlivnit využití českého WordNetu v NLP aplikacích. Od zveřejněné první verze CzWN byly sémantická síť v několika fázích rozšířena, ale komplexní finální úpravy a proces zveřejněný zatím nejsou dokončené. V roce 2017 jsme spustili projekt k vyhodnocení a aktualizaci českého WordNetu a také propojení s Collaborative Interlingual Index. V tomto článku poskytujeme přehled verzí a rozšíření českého Wordnetu a také plán pro publikaci aktualizované verze s otevřenou licencí. Dále představujeme koncept dlouhodobých aktualizací a údržby dat založený na crowdsourcingu. |
Související projekty: |