Určení tematické konzistence dokumentu
Autoři | |
---|---|
Rok publikování | 2011 |
Druh | Článek ve sborníku |
Konference | Znalosti 2011 |
Fakulta / Pracoviště MU | |
Citace | |
www | http://znalosti.ics.upjs.sk |
Obor | Informatika |
Klíčová slova | fulltext search engine; topic consistency; backlinks |
Popis | Cílem této práce bylo navrhnout a implementovat nástroj, který pro libovolný textový dokument v českém jazyce určí, do jaké míry je jeho text tematicky (in)konzistentní a současně rozhodne, zda je vhodné použít jeho odkazy pro výpočet relevance ve fulltextovém vyhledávání (na základě tematické konzistence). Ukazuje se totiž, že by odkazy tematicky nesouroudé webové stránky měly mít menší váhu než odkazy stránky tematicky sourodé. Navržený nástroj je založen na statistických i heuristických metodách a na testovací množině 200 dokumentů dosahuje přesnosti 93,5 % |
Související projekty: |