Inteligentní software pro sémantické hledání dokumentů (ISSHD)

Projekt nespadá pod Filozofickou fakultu, ale pod Fakultu informatiky. Oficiální stránka projektu je na webu muni.cz.

Logo poskytovatele
Kód projektu
TD03000295
Období řešení
1/2016 - 12/2017
Investor / Programový rámec / typ projektu
Technologická agentura ČR
Fakulta / Pracoviště MU
Fakulta informatiky
WWW stránky projektu
https://scaletext.com
Klíčová slova
škálovatelný systém sémantického vyhledávání; sémantické vyhledávání; modelování témat dokumentůů strojové učení; vyhledávání; hluboké učení
Spolupracující organizace
RaRe Technologies s.r.o.

Naše společensko-vědní kultura je definována slovy, které v dnešní
informační společnosti konstituují _dokumenty_.
Cílem projektu je vytvoření databázového systému (software),
který umožní hledání _významově_ příbuzných dokumentů.
Systém Scaletext se skládá ze tří částí:

  • sémantická analýza: strojově analyzuje libovolný nestrukturovaný


dokument v přirozeném jazyce (čeština, angličtina)

  • indexace: nalezená témata a strukturu každého dokumentu vnitřně uloží


ve vhodné reprezentaci _významů_ slov tak, aby systém umožnil posléze
hledat podobné dokumenty k dotazu (=dokumentu), index vizualizovat

  • vyhledávání: pro vstupní dokument nalezne ty dokumenty, které odpovídají


(latentnímu) významu dotazu, a to i když nesdílí stejná slova

Výsledky

https://www.rvvi.cz/cep?s=jednoduche-vyhledavani&ss=detail&n=0&h=TD03000295

Publikace

Počet publikací: 9