A New Approach for Semi-automatic Building and Extending a Multilingual Terminology Thesaurus
Název česky | Nový přístup k poloautomatické tvorbě a rozšiřování vícejazyčného terminologického tezauru |
---|---|
Autoři | |
Rok publikování | 2019 |
Druh | Článek v odborném periodiku |
Časopis / Zdroj | International Journal on Artificial Intelligence Tools |
Fakulta / Pracoviště MU | |
Citace | |
www | |
Doi | http://dx.doi.org/10.1142/S0218213019500088 |
Klíčová slova | Thesaurus building; terminology dictionary; domain-corpus exploitation; knowledge extraction; term extraction; DEB platform; knowledge-rich contexts |
Popis | Článek popisuje nový systém pro poloautomatickou tvorbu, rozšiřování a správu terminologického tezauru - vícejazyčného terminologického slovníku obohaceného o vztahy mezi termíny, aby vytvořil tezaurus. Systém umožňuje výrazně zlepšit workflow existujících odborných terminologických skupin, které využívají pro editační rozhodnutí převážně introspekci. Představený systém doplňuje lexikografický proces pomocí technik zpracování přirozeného jazyka, které jsou integrovány do editačního prostředí tezauru. Metodologie systému a výsledný tezaurus jsou úzce spojeny s novým doménovým korpusem v šesti jazycích. Tyto se používají pro příklady použití termínů a také pro automatickou extrakci nových kandidátských termínů. Terminologický tezaurus je přístupný přes webovou aplikaci, která a) prezentuje podrobné obohacené informace o každém termínu, b) vizualizuje vztahy mezi termíny, c) zobrazuje skutečné příklady použití termínu v doménových dokumentech a v kontextu podobných termínů. Navíc jsou specializované korpusy použity pro detekci možných překladů termínu z původního jazyka (čeština) do ostatních jazyků (angličtiny, francouzština, němčina, ruština, slovenština) a také pro detekci nadřazených pojmů. Tento projekt byl realizován pro terminologický tezaurus zeměměřictví, ale nástroje a metodologie jsou využitelné také pro další odborné terminologie. |
Související projekty: |