Subspace Tracking for Latent Semantic Analysis

Varování

Publikace nespadá pod Filozofickou fakultu, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.
Autoři

ŘEHŮŘEK Radim

Rok publikování 2011
Druh Článek ve sborníku
Konference Proceedings of the 33rd European Conference on Information Retrieval (ECIR)
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
www http://ecir2011.dcu.ie/
Doi http://dx.doi.org/10.1007/978-3-642-20161-5_29
Obor Teorie informace
Klíčová slova scalability svd subspace tracking
Popis Modern applications of Latent Semantic Analysis (LSA) must deal with enormous (often practically infinite) data collections, calling for a single-pass matrix decomposition algorithm that operates in constant memory w.r.t. the collection size. This paper introduces a \emph{streamed distributed algorithm for incremental SVD updates}. Apart from the theoretical derivation, we present experiments measuring numerical accuracy and runtime performance of the algorithm over several data collections, one of which is the whole of the English Wikipedia.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.