Hvordan velger jeg den beste OCR-programvaren?
OCR-programvare, eller optisk karaktergjenkjenningsprogramvare, er programvare designet for å oversette bilder av tekst til faktisk tekst som en datamaskin kan lese. Vanligvis brukes OCR-programvare etter at et bilde er skannet inn i en datamaskin, selv om andre former for inngang også kan brukes. OCR-programvare fungerer best på tekst som allerede er skrevet, enten i tilfeller hvor en original utskrift har gått tapt, eller ved skanning av ark som er skrevet på en skrivemaskin. God programvare kan også være i stand til å oversette håndskrevet tekst, selv om feilraten på denne typen konvertering har en tendens til å være mye høyere.
Selve uttrykket OCR-programvare er litt misvisende, ettersom de fleste moderne OCR-programvare faktisk ikke bruker optisk karaktergjenkjenning, men faktisk bruker digital karaktergjenkjenning. Dette er fordi feltene for noen år siden effektivt slo seg sammen, og begge feltene tok i bruk det mer attraktive uttrykket optisk karaktergjenkjenning. OCR-programvare har avansert mye de siste årene, med moderne programmer vesentlig bedre enn forgjengerne sine til å identifisere tekst.
Faktisk krevde tidlig OCR-programvare opplæring av programmet på en bestemt skrift før det kunne skrives inn nøyaktig. Tilsvarende, når du skriver inn håndskrift, ville programmet trent, en prosess som kan være utrolig tidkrevende. Metodene har imidlertid blitt bedre, og mer intelligente systemer er nå normen. Metodene som er brukt er nå relativt statiske, med bare litt forskning som går ut på å utvikle helt nye metoder, og mest forskning som går ut på å foredle eksisterende prosedyrer for å gjøre dem stadig mer nøyaktige. Tidlig OCR-programvare ble brukt i et bredt spekter av applikasjoner, hvor store selskaper brukte den til å lese avtrykk av kredittkort på 1950-tallet, og USAs posttjeneste brukte den til å sortere post siden midten av 1960-tallet.
For ti år siden var det vanskelig å velge et stykke OCR-programvare, ettersom mange programmer var ganske dårlige til visse oppgaver, og rimelig bra på andre. I disse dager har imidlertid feltet stort sett blitt jevnet. Nøyaktighetsgraden i hvilken som helst god OCR-programvare for å oversette latinske skript som er skrevet er over 99%. Når det gjelder å legge inn håndskrift, eller mer intrikate skrifter, har imidlertid OCR-programvaren et relativt høyt område.
Kostnadene for OCR-programvare svinger også mye, ofte i forhold til nøyaktighetsgraden den har. En god del gratis OCR-programvare kan bli funnet som er egnet for å legge inn trykksaker, og noen kan bli funnet som er relativt gode til å oppdage håndskrift, spesielt med litt trening. Dyrere programvarepakker, for eksempel OmniPage-pakken, som koster rundt USD 100 dollar for hjemmeversjonen og rundt $ 450 USD for den profesjonelle versjonen, har imponerende utvalg av funksjoner og generelt høyere suksessrater.
Dessverre er det fortsatt ingen ting som perfekt OCR-programvare, så å velge et program å kjøpe kan fremdeles i stor grad være en frustrerende prosess. Selv de beste programmene vil sannsynligvis ha en vanskelig tid med håndskrift, og feil vil uunngåelig krype gjennom, selv på lave nivåer. Det meste, å velge et program å kjøpe kommer ned til ekstra funksjoner: flerspråklig støtte, one-touch skanning og konvertering integrasjon, automatisk PDF-konvertering og hele ordgjenkjenning på tvers av spesialiserte fagområder som juridiske og medisinske felt.