Určení tematické konzistence dokumentu

Varování

Publikace nespadá pod Filozofickou fakultu, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.
Autoři

MATERNA Jiří

Rok publikování 2011
Druh Článek ve sborníku
Konference Znalosti 2011
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
www http://znalosti.ics.upjs.sk
Obor Informatika
Klíčová slova fulltext search engine; topic consistency; backlinks
Popis Cílem této práce bylo navrhnout a implementovat nástroj, který pro libovolný textový dokument v českém jazyce určí, do jaké míry je jeho text tematicky (in)konzistentní a současně rozhodne, zda je vhodné použít jeho odkazy pro výpočet relevance ve fulltextovém vyhledávání (na základě tematické konzistence). Ukazuje se totiž, že by odkazy tematicky nesouroudé webové stránky měly mít menší váhu než odkazy stránky tematicky sourodé. Navržený nástroj je založen na statistických i heuristických metodách a na testovací množině 200 dokumentů dosahuje přesnosti 93,5 %
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.