Hvordan vælger jeg den bedste OCR-software?

OCR-software eller optisk tegngenkendelsessoftware er software designet til at oversætte billeder af tekst til faktisk tekst, som en computer kan læse. Generelt bruges OCR-software, efter at et billede er blevet scannet til en computer, skønt andre former for input også kan bruges. OCR-software fungerer bedst på tekst, der allerede er skrevet, enten i tilfælde, hvor en original udskrift er gået tabt, eller i scanningsark, der er indtastet på en skrivemaskine. God software er muligvis også i stand til at oversætte håndskrevet tekst, selvom fejlprocenten ved denne type konvertering har en tendens til at være meget højere.

Selve udtrykket OCR-software er lidt vildledende, da de fleste moderne OCR-software faktisk ikke bruger optisk tegngenkendelse, men faktisk bruger digital tegngenkendelse. Dette skyldes, at felterne for nogle år siden effektivt fusionerede, og begge felter vedtog det mere attraktive udtryk optisk karaktergenkendelse. OCR-software har udviklet sig meget i de senere år med moderne programmer væsentligt bedre end deres forgængere til at identificere tekst.

Faktisk krævede tidlig OCR-software at træne programmet på en bestemt skrifttype, før det kunne indtastes nøjagtigt. Tilsvarende, når man indtaster håndskrift, ville programmet skulle trænes, en proces, der kan være utroligt tidskrævende. Metoder er imidlertid forbedret, og mere intelligente systemer er nu normen. De anvendte metoder er nu relativt statiske, med kun en lille smule forskning, der skal udvikle helt nye metoder, og mest forskning, der undersøger eksisterende procedurer for at gøre dem stadig mere nøjagtige. Tidlig OCR-software blev brugt i en lang række applikationer, hvor store virksomheder brugte den til at læse kreditkortaftryk i 1950'erne, og USA's posttjeneste brugte den til at sortere post siden midten af ​​1960'erne.

For ti år siden var det vanskeligt at vælge et stykke OCR-software, da mange programmer var ret dårlige til visse opgaver og rimeligt gode til andre. I disse dage er marken imidlertid stort set plan. Nøjagtighedsgrader i enhver god OCR-software til oversættelse af latinske scripts, der er indtastet, er over 99%. Når det kommer til indtastning af håndskrift, dog mere eller mere indviklede skrifttyper, har OCR-software stadig et relativt højt interval.

Omkostningerne ved OCR-software svinger også vidt, ofte i forhold til nøjagtighedsgraden, det praler med. Der findes en rimelig mængde gratis OCR-software, som er egnet til at indtaste tryksager, og nogle kan findes, som er relativt god til at opdage håndskrift, især med en vis træning. Dyrere softwarepakker, såsom OmniPage-pakken, der koster omkring $ 100 US Dollars (USD) til hjemmeversionen og omkring $ 450 USD for den professionelle version, kan prale af imponerende matrixer af funktioner og generelt højere succesrater.

Desværre er der stadig ingen ting som perfekt OCR-software, så valg af et program til at købe kan stadig stort set være en frustrerende proces. Selv de bedste programmer vil sandsynligvis have en vanskelig tid med håndskrift, og fejl vil uundgåeligt krybe igennem, selv på lave niveauer. For det meste kommer valg af et program til at købe ned på ekstra funktioner: flersproget support, one-touch scanning og konvertering integration, automatisk PDF-konvertering og hele ordgenkendelse på tværs af specialiserede discipliner som juridiske og medicinske områder.

ANDRE SPROG

Hjalp denne artikel dig? tak for tilbagemeldingen tak for tilbagemeldingen

Hvordan kan vi hjælpe? Hvordan kan vi hjælpe?