Hvordan vælger jeg den bedste OCR -software?
OCR -software eller optisk karaktergenkendelsessoftware er software designet til at oversætte billeder af tekst til faktisk tekst, som en computer kan læse. Generelt bruges OCR -software, efter at et billede er blevet scannet til en computer, selvom andre former for input også kan bruges. OCR -software fungerer bedst på tekst, der allerede er skrevet, enten i tilfælde, hvor en original udskrivning er gået tabt, eller i scanningsark, der er skrevet på en skrivemaskine. God software kan dog også være i stand til at oversætte håndskrevet tekst, selvom fejlfrekvensen på denne form for konvertering har en tendens til at være meget højere.
Den faktiske udtryk OCR -software er lidt vildledende, da de fleste moderne OCR -software faktisk ikke bruger optisk karaktergenkendelse, men faktisk bruger digital karaktergenkendelse. Dette skyldes, at felterne for nogle år siden fusionerede effektivt, og begge felter vedtog den mere attraktive udtryk optiske karaktergenkendelse. OCR -software har avanceret meget i de senere år med moderne progRams væsentligt bedre end deres forgængere til at identificere tekst.
Faktisk krævede tidlig OCR -software at uddanne programmet på en bestemt skrifttype, før det kunne indtastes nøjagtigt. Tilsvarende, når du indtaster håndskrift, skulle programmet blive trænet, en proces, der kan være utroligt tidskrævende. Metoder er dog forbedret, og mere intelligente systemer er nu normen. De anvendte metoder er nu relativt statiske, hvor kun en lille smule forskning går til at udvikle helt nye metoder, og mest forskning, der går i raffinering af eksisterende procedurer for at gøre dem stadig mere nøjagtige. Tidlig OCR-software blev brugt i en lang række applikationer, hvor store virksomheder brugte det til at læse kreditkortaftryk i 1950'erne, og USAs posttjeneste ved hjælp af den til at sortere mail siden midten af 1960'erne.
for ti år siden var det vanskeligt at vælge et stykke OCR -software, da mange prograMS var ret dårlige ved visse opgaver og rimeligt gode hos andre. I disse dage er feltet imidlertid stort set blevet udjævnet. Nøjagtighedsrater i enhver god OCR -software til oversættelse af latinske scripts, der er skrevet, er over 99%. Når det kommer til at indtaste håndskrift, eller mere indviklede skrifttyper, har OCR -software stadig et relativt højt interval.
Omkostningerne ved OCR -software svinger også vidt, ofte i forhold til den nøjagtighedshastighed, den kan prale af. Der findes en god mængde gratis OCR -software, der er egnet til at indtaste trykt stof, og nogle kan findes, som er relativt god til at detektere håndskrift, især med en vis træning. Dyrere software -suiter, såsom Omnipage Suite, der koster omkring $ 100 amerikanske dollars (USD) til hjemmeversionen og omkring $ 450 USD for den professionelle version, kan prale af imponerende arrays af funktioner og generelt højere succesrater.
Desværre er der stadig ikke sådan noget som perfekt OCR -software, så det at vælge enProgram at købe kan stadig i vid udstrækning være en frustrerende proces. Selv de bedste programmer vil sandsynligvis have en vanskelig tid med håndskrift, og fejl vil uundgåeligt krybe igennem, selv på lave niveauer. For det meste kommer valg af et program til at købe ned på ekstra funktioner: multi-lingual support, one-touch scanning og konverteringsintegration, automatisk PDF-konvertering og anerkendelse af hele ord på tværs af specialiserede discipliner som juridiske og medicinske områder.