Převod dokumentů pomocí OCR technologie

Pro práci s textem je nutné naskenované obrazy převést do takového formátu, který pracuje s jendotlivými znaky a objekty (typickým příkladem je formát doc - MS Word). Takový dokument se dá vytvořit dvěma způsoby:

  • ručním přepisem informací
  • automatickým převodem pomocí OCR technologie

Automatickým převodem pomocí OCR technologie se rozumí takový proces, kdy je na vstupu dávka obrazů, uprostřed "čtecí" program a na výstupu dávka textových dokumentů připravených pro další zpracování a úpravy. Současné OCR softwary jsou schopné dosáhnout průměrné přesnosti 99 % (závisí především na čitelnosti originálního obrazu).

OCR proces

Výhody OCR - ABBYY FineReader

  • Přesnost, zachování rozložení dokumentu
  • Rozpoznání tabulek a vlastností buněk
  • Rozpoznání fontů, jazyků
  • Zachování odrážek a číslování
  • Zachování odkazů (hyperlinků)

Pro zpracování dokumentů pomocí OCR technologie používáme několikrát oceněný software ABBYY FineReader. FineReader dokáže automaticky rozpoznat základní oblasti dokumentu (obrázek, text, tabulka), jazyk i font, zachovat rozložení dokumentu, vlastnosti buněk v tabulce, nastavení odrážek a číslování. Dále umí dávkově zpracovávat dokumenty dle přednastavené akce a automaticky exportovat do zvoleného formátu.