Hur väljer jag den bästa OCR-programvaran?
OCR-programvara, eller optisk teckenigenkänningsprogramvara, är programvara som är utformad för att översätta bilder av text till faktisk text som en dator kan läsa. I allmänhet används OCR-programvara efter att en bild har skannats in i en dator, även om andra former av input kan också användas. OCR-programvaran fungerar bäst på text som redan har skrivits, antingen i fall där en originalutskrift har gått förlorad eller i skanningsark som skrivs på en skrivmaskin. Bra programvara kanske också kan översätta handskriven text, men felhastigheten för denna typ av konvertering tenderar att vara mycket högre.
Den faktiska termen OCR-programvara är lite vilseledande, eftersom de flesta moderna OCR-programvaror faktiskt inte använder optiskt teckenigenkänning, utan faktiskt använder digitalt teckenigenkänning. Detta beror på att för fyra år sedan fälten effektivt slogs samman, och båda fälten antog den mer attraktiva termen optisk teckenigenkänning. OCR-programvara har avancerat mycket under de senaste åren, med moderna program väsentligt bättre än sina föregångare när det gäller att identifiera text.
I själva verket krävde tidig OCR-programvara utbildning av programmet på ett specifikt teckensnitt innan det kunde matas in korrekt. På samma sätt, när man skriver in handskrift, måste programmet tränas, en process som kan vara oerhört tidskrävande. Metoder har dock förbättrats, och mer intelligenta system är nu normen. Metoderna som används är nu relativt statiska, med bara lite forskning som går ut på att utveckla helt nya metoder, och mest forskning som går ut på att förfina befintliga förfaranden för att göra dem allt mer exakta. Tidig OCR-programvara användes i ett brett spektrum av applikationer, där stora företag använde den för att läsa kreditkortsavtryck på 1950-talet, och USA: s posttjänst använde den för att sortera e-post sedan mitten av 1960-talet.
För tio år sedan var det svårt att välja en bit OCR-programvara, eftersom många program var ganska dåliga på vissa uppgifter och ganska bra på andra. Dessa dagar har fältet emellertid i stort sett varit jämnt. Noggrannhetsgraden i någon bra OCR-programvara för att översätta latinska skript som har skrivits är över 99%. När det gäller att skriva in handskrivning, eller mer intrikata typsnitt, har OCR-programvaran fortfarande ett relativt högt intervall.
Kostnaden för OCR-programvara varierar också mycket, ofta i förhållande till noggrannhetsgraden den har. Det finns en hel del gratis OCR-programvara som är lämplig för att mata in trycksaker, och en del kan hittas som är relativt bra på att upptäcka handskrift, särskilt med viss utbildning. Dyrare mjukvarusviter, till exempel OmniPage-sviten, som kostar cirka $ 100 US dollar (USD) för hemversionen och cirka $ 450 USD för den professionella versionen, har imponerande uppsättningar av funktioner och generellt högre framgångsgrader.
Tyvärr finns det fortfarande inget sådant som perfekt OCR-programvara, så att välja ett program att köpa kan fortfarande till stor del vara en frustrerande process. Även de bästa programmen kommer troligtvis ha en svår tid med handskrivning, och fel kommer oundvikligen att krypa igenom, även på låga nivåer. Att välja ett program för att köpa kommer oftast att tänka på extra funktioner: flerspråkigt stöd, one-touch scan och konverteringsintegration, automatisk PDF-konvertering och hela ordigenkännande inom specialiserade discipliner som juridiska och medicinska områden.