Project information
Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
(LINDAT-Clarin)
- Project Identification
- LM2010013
- Project Period
- 11/2010 - 12/2015
- Investor / Pogramme / Project type
-
Ministry of Education, Youth and Sports of the CR
- Large Infrastructures for Research, Development and Innovation
- MU Faculty or unit
- Faculty of Informatics
- Cooperating Organization
-
Institute of the Czech Language of the ASCR, v. v. i.
Charles University
- Responsible person Ing. Jana Kalinová, Ph.D.
- Responsible person prof. Ing. Jan Tříska, CSc.
Projekt LINDAT-Clarin bude napojen na projekt Clarin, ESFRI projekt (FP7-RI-2122230) pro jazykovou infrastrukturu v humanitních vědách (Common Language Resources and Technology Infrastructure)
Uzel Clarin bude realizován čtyřmi partnery projektu. Toto ZSPO bude realizovat organizačně i technologicky veškeré funkce uzlu (Centrum "A" v terminologii Clarin) pro budoucí asociaci Clarin-ERIC, a bude pověřeno výkonem funkcí MŠMT v Clarin-ERIC (kromě pravomocí rozhodovacích). Navrhovaným sídlem této ZSPO je budova sekce informatiky MFF UK na Malostranském náměstí 25, 11800 Praha 1.
Národní úkoly při tvorbě a dodávání jazykových dat, úkoly vzdělávací a výzkumné budou plnit jednotlivé zakladatelské organizace v jejich stávající struktuře. Organizačně budou jednotlivá pracoviště podporovaná z prostředků LINDAT-Clarin oddělena v rámci těchto organizací.
Publications
Total number of publications: 90
2012
-
Migrating Cornetto Lexicon to New XML Database Engine
6th International Global Wordnet Conference Proceedings, year: 2012
-
POS Annotated 50M Corpus of Tajik Language
Proceedings of the Workshop on Language Technology for Normalisation of Less-Resourced Languages (SALTMIL 8/AfLaT 2012), year: 2012
-
Recent Czech Web Corpora
6th Workshop on Recent Advances in Slavonic Natural Language Processing, year: 2012
-
Saara: Anaphora Resolution on Free Text in Czech
Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2012, year: 2012
-
SENEQA - System for Quality Testing of Wordnet Data
6th International Global Wordnet Conference Proceedings, year: 2012
-
SpiderLing
Year: 2012
-
Syntactic parser SET
Year: 2012
-
Towards 100M Morphologically Annotated Corpus of Tajik
Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2012, year: 2012
2011
-
Budování anotovaného korpusu bez odborníků
Korpusová lingvistika 2 - Výzkum a výstavba korpusů, year: 2011
-
Internetová jazyková příručka
Year: 2011, type: R&D Presentation