Gensim -- Statistical Semantics in Python
Název česky | Gensim -- statistická sémantika v Pythonu |
---|---|
Autoři | |
Rok publikování | 2011 |
Druh | Další prezentace na konferencích |
Fakulta / Pracoviště MU | |
Citace | |
Přiložené soubory | |
Popis | \texttt{Gensim} je knihovna naprogramovaná jazyce Python, která je užitečná na dvou frontách: 1) pro indexaci elektronických dokumentů a pro podobnostní hledání; a 2) pro rychlou, paměťově omezenou a efektivní škálovatelnou implementaci algoritmů pro Singular Value Decomposition a Latent Dirichlet Allocation. Vazba mezi oběma užitími je semantická analýza textů (bez učitele) v rozsáhlých digitálních kolekcích a knihovnách. Gensim byl vytvořen pro velké digitální knihovny, ale jím implementované algoritmy pro velké, distribuované, online užití SVD a LDA jsou švýcarským nožíkem analýzy dat a jako takové jsou užitečné i mimo doménu Natural Language Processing. |
Související projekty: |