Fast syntactic searching in very large corpora for many languages
Název česky | Rychlé syntaktické vyhledávání ve velkých korpusech pro mnoho jazyků |
---|---|
Autoři | |
Rok publikování | 2010 |
Druh | Článek ve sborníku |
Konference | PACLIC 24 Proceedings of the 24th Pacific Asia Conference on Language, Information and Computation |
Fakulta / Pracoviště MU | |
Citace | |
Obor | Informatika |
Klíčová slova | corpus search; large corpora; CQL; syntactic search |
Popis | Prvním krokem pro mnoho lingvistických výzkumů je vyhledání příkladů. V 21. století by tyto příklady měly být vždy vyhledávány, nikoli vymýšleny. Proto potřebují lingvisté flexibilní nástroje pro vyhledávání i okrajových jazykových jevů. Takové vyhledávání musí být navíc rychlé i pro velké korpusy a složité dotazy. Představujeme rozšíření ke korpusovému dotazovacímu jazyku CQL pro intuitivní vytváření syntaktických dotazů a ukážeme, že tyto dotazy mohou být rychle vyhodnocovány našimi nástroji i pro korpusy o velikostech v řádech miliard pozic. |
Související projekty: |