Jak si mohu vybrat nejlepší OCR software?
Software OCR nebo software pro optické rozpoznávání znaků je software určený k překladu obrázků textu do skutečného textu, který počítač dokáže přečíst. Obecně se software OCR používá po naskenování obrázku do počítače, lze však použít i jiné formy vstupu. Software OCR funguje nejlépe na textu, který již byl zadán, a to buď v případech, kdy byl původní výtisk ztracen, nebo při skenování listů napsaných na psacím stroji. Dobrý software může být také schopen překládat ručně psaný text, i když míra chyb na tomto druhu převodu bývá mnohem vyšší.
Skutečný pojem OCR software je trochu zavádějící, protože nejmodernější OCR software ve skutečnosti nepoužívá optické rozpoznávání znaků, ale ve skutečnosti používá digitální rozpoznávání znaků. Je to proto, že před několika lety se pole efektivně sloučila a obě pole přijala atraktivnější termín optické rozpoznávání znaků. Software OCR v posledních letech značně pokročil a moderní programy jsou v identifikaci textu podstatně lepší než jejich předchůdci.
Ve skutečnosti časný software OCR vyžadoval školení programu na konkrétní písmo, než mohl být přesně vložen. Podobně by při zadávání rukopisu musel být program vyškolen, což je proces, který by mohl být neuvěřitelně časově náročný. Metody se však zlepšily a inteligentnější systémy jsou nyní normou. Používané metody jsou nyní relativně statické, pouze s trochou výzkumu jde o vývoj zcela nových metod a většina výzkumu jde o zdokonalení stávajících postupů, aby byly stále přesnější. Časný OCR software byl používán v široké škále aplikací, s hlavními společnostmi používat to číst otisky kreditní karty v padesátých létech a Spojené státy poštovní služba používat to třídit poštu od střední-šedesátá léta.
Před deseti lety byl výběr kusu softwaru OCR obtížný, protože mnoho programů bylo v určitých úkolech docela špatné a v jiných docela dobré. V dnešní době však bylo pole do značné míry vyrovnáno. Míra přesnosti v jakémkoli dobrém softwaru OCR pro překlad latinských skriptů, které byly zadány, je vyšší než 99%. Pokud však jde o vkládání rukopisu nebo složitějších typů písma, software OCR má stále relativně velký rozsah.
Náklady na software OCR také kolísají, často ve vztahu k míře přesnosti, kterou se může pochlubit. Lze nalézt velké množství bezplatného softwaru OCR, který je vhodný pro vkládání tiskovin, a některé lze najít, což je poměrně dobré v detekci rukopisu, zejména s určitým školením. Dražší softwarové sady, jako je sada OmniPage, která za domácí verzi stojí přibližně 100 USD (USD) a pro profesionální verzi přibližně 450 USD, se mohou pochlubit působivými poli funkcí a obecně vyšší mírou úspěchu.
Bohužel stále neexistuje nic takového jako dokonalý software OCR, takže výběr programu na nákup může být do značné míry frustrující. Dokonce i ty nejlepší programy pravděpodobně budou mít s rukopisem těžké časy a chyby se nevyhnutelně proklouznou i na nízkých úrovních. Výběr programu, který se má koupit, se většinou týká dalších funkcí: vícejazyčná podpora, integrace skenování a převodu jedním dotykem, automatická konverze PDF a rozpoznávání celého slova ve specializovaných oborech, jako jsou právní a lékařské obory.