The Art of Mathematics Retrieval
Název česky | Umění indexování a vyhledávání matematiky |
---|---|
Autoři | |
Rok publikování | 2011 |
Druh | Článek ve sborníku |
Konference | Proceedings of the 2011 ACM Symposium on Document Engineering |
Fakulta / Pracoviště MU | |
Citace | |
www | |
Doi | http://dx.doi.org/10.1145/2034691.2034703 |
Obor | Informatika |
Klíčová slova | math indexing and retrieval; mathematical digital libraries; information systems; information retrieval; mathematical content search; document ranking of mathematical papers; math text mining; MIaS; WebMIaS |
Přiložené soubory | |
Popis | V článku je navržena architektura nového systému, MIaS (Math Indexer and Searcher), a návrh je zdůvodněn. Byl zvolen přístup založený na podobnosti matematických formulí v prezentačním MathML. Systém byl implementován a návrh verifikován na široce používaném indexačním systému Apache Lucene. Škálovatelnost byla ověřena na více než 400,000 odborných matematických článcích z archivu arXiv s 158 miliony matematickými formulemi. To představovalo indexování téměř tří bilionů matematických podformulí v MathML pomocí Solr-kompatibilního rozšíření Lucene. |
Související projekty: |