Informace o projektu
Inteligentní back office
- Kód projektu
- CZ.01.1.02/0.0/0.0/21_374/0026711
- Období řešení
- 7/2021 - 5/2023
- Investor / Programový rámec / typ projektu
-
Ministerstvo průmyslu a obchodu ČR
- Operační program Podnikání a inovace pro konkurenceschopnost
- Fakulta / Pracoviště MU
-
Fakulta informatiky
- doc. RNDr. Petr Sojka, Ph.D.
- Mgr. Mikuláš Bankovič
- Mgr. Martin Geletka
- RNDr. Vít Starý Novotný, Ph.D.
- Mgr. Michal Štefánik
- Spolupracující organizace
-
Dactyl Group s.r.o.
- Odpovědná osoba Ing. Milan Doubek
- Odpovědná osoba Johnson Darkwah
Cílem projektu je vývoj moderního inovativního řešení pro elektronické zpracování a kontrolu finančních dokumentů za použití pokročilých nástrojů umělé inteligence. Výstupem projektu bude software využívaný v licencované webové službě. Vlastní řešení partneři vystaví na následujících komponentách: a) na unikátním propojení metod zpracování obrazu a přirozeného jazyka; b) na modelování jazyka; c) na pokročilých nástrojích pro extrakci textu z dokumentu s využitím neuronových sítí; d) na klasifikátoru pro přesnou kategorizaci zpracovávaných dokumentů; e) na automatizovaném detektoru nestandardních entit ve finančních dokumentech/ operacích, opřených o neuronovou architekturu tzv. „transformerů“; f) na navrženém a natrénovaném rekurentním modelu pro určení vztahů mezi dokumenty; a v neposlední řadě na g) nástroji pro validaci dokumentu a detekci anomálií s využitím vybraných statistických modelů. Zajímavým prvkem systému bude h) „doporučovač”, který uživateli poskytne radu pro další kroky v rámci prováděných pracovních úkonů. Funkční nadstavbou se stane i) přehledné grafické prostředí (dostupné z běžného internetového prohlížeče), které poskytne výstupy ve formě přehledných a snadno upravitelných „Business Intelligence“ reportů. V souladu s mezinárodní ambicí bude mít vyvíjené řešení podporu multijazyčnosti.
Cíle udržitelného rozvoje
Masarykova univerzita se hlásí k cílům udržitelného rozvoje OSN, jejichž záměrem je do roku 2030 zlepšit podmínky a kvalitu života na naší planetě.
Publikace
Počet publikací: 3
2023
-
Document Visual Question Answering with CIVQA: Czech Invoice Visual Question Answering Dataset
Recent Advances in Slavonic Natural Language Processing (RASLAN 2023), rok: 2023
2022
-
Information Extraction from Business Documents
Recent Advances in Slavonic Natural Language Processing (RASLAN 2022), rok: 2022
-
Towards General Document Understanding through Question Answering
Recent Advances in Slavonic Natural Language Processing (RASLAN 2022), rok: 2022