Task #3875
closed
Task #3633: Etapa 01 - Příprava dat a datových struktur, testy existujících metod
Task #3803: OCR - jazykový model v Tesseractu
Zjistit jak dostat z Tesseractu lattices pro další zpracování/rescoring
Added by Soutner Daniel almost 9 years ago.
Updated over 8 years ago.
Description
Půjde nějak dostat z Tessractu lattices? Abychom mohli udělat rescoring RNN jaz.modelem...
- % Done changed from 0 to 20
Prozatím mám způsob jak dostat lattices s grafémy. Je třeba se napojit na API a trochu programování v C++, ale je to schůdné.
- % Done changed from 20 to 50
Napojení na API + testovací prográmek hotov. Lze vypsat pro každý grafém jeho varianty s confidence. Otázka je, jestli toto zkoušet i pro slova nebo jestli si další dekodování zařídit sami (přes transducery?)
- Due date changed from 31.05.2016 to 30.09.2016
- Status changed from Assigned to Closed
- % Done changed from 50 to 100
Also available in: Atom
PDF