Vyzera, ze samotny engine ABBYY je aj na linux. Kazdopadne cuneiform vyzera byt dost kvalitny OCR engine. Nepodarilo sa mi najst nejake rozumne porovnanie tychto dvoch (a pripadne inych) OCR enginov, asi treba pripadne skusit.
Ja by som to pomerne casto pouzil pri prevode PDF do nejakeho ebook formatu, nevedel som, ze OCR-ka zvladaju uz tak kvalitne detekovat odstavce, odrazky a podobne. Na samotnej detekcii textu v pripade PDF asi nezalezi.
Ja som tiež našiel nejaké odkazy na ABBYY pod linuxom, ale keď som napísal priamo predajcovi, tak som dostal odpoveď, že ABBYY pod linuxom nepredávajú. Skúšal som rôzne OCR pod linuxom, ale žiadny sa nevyrovná ABBYY Fine Readerovi. Ani kvalitou výstupu, ani ovládaním. Sú viac-menej použiteľné len na menšie texty, kde nie je problém následne si chyby opravovať.
ABBYY pre linux existuje už pár rokov... hneď sme po ňom skočili, ABBYY (a scaner s win-only ovládačom) bol jediný dôvod, prečo sme v práci mali posledné 2ks počítačov s windows.
Licencia je o dosť odlišná od ABBYY for Windows (na počet strán na rok, pri registrácii sa kontroluje hardware a dovolí len jednu inštaláciu - to sme ale vyriešili inštaláciou do kvm :-)), a teda cena je niekde inde.
Funguje skvele, ale je ukážkový príklad, ako NEpísať CLI programy - veľmi veľa parametrov pri spúšťaní, na ich poradí záleží, GNU konvenciu to nedodržiava, do pipe sa dať nedá...