Hoe kies ik de beste OCR -software?

OCR -software, of optische tekenherkenningssoftware, is software die is ontworpen om afbeeldingen van tekst te vertalen in echte tekst die een computer kan lezen. Over het algemeen wordt OCR -software gebruikt nadat een afbeelding in een computer is gescand, hoewel ook andere vormen van invoer kunnen worden gebruikt. OCR -software werkt het beste op tekst die al is getypt, hetzij in gevallen waarin een originele afdruk verloren is gegaan, of in scanbladen getypt op een typemachine. Goede software kan mogelijk ook handgeschreven tekst vertalen, hoewel het foutenpercentage op dit soort conversie vaak veel hoger is.

De werkelijke term OCR -software is een beetje misleidend, omdat de meeste moderne OCR -software in feite geen optische karakterherkenning gebruikt, maar daadwerkelijk gebruik van digitale karakterherkenning. Dit komt omdat enkele jaren geleden de velden effectief fuseerden en beide velden de aantrekkelijkere term optische karakterherkenning hebben aangenomen. OCR Software is de afgelopen jaren veel vooruitgegaan, met moderne progRammen aanzienlijk beter dan hun voorgangers bij het identificeren van tekst.

Vroege OCR -software vereiste in feite het training van het programma op een specifiek lettertype voordat het nauwkeurig kon worden ingevoerd. Evenzo zou het programma bij het invoeren van handschrift moeten worden getraind, een proces dat ongelooflijk tijdrovend zou kunnen zijn. Methoden zijn echter verbeterd en meer intelligente systemen zijn nu de norm. De gebruikte methoden zijn nu relatief statisch, met slechts een beetje onderzoek naar het ontwikkelen van geheel nieuwe methoden, en het meeste onderzoek naar het verfijnen van bestaande procedures om ze steeds nauwkeuriger te maken. Vroege OCR-software werd gebruikt in een breed scala aan applicaties, met grote bedrijven die het gebruikten om creditcardafdrukken te lezen in de jaren 1950, en de Postal Service van de Verenigde Staten die het sinds het midden van de jaren zestig gebruiken.

.

Tien jaar geleden was het kiezen van een stuk OCR -software moeilijk, zoals veel prograMS was vrij slecht in bepaalde taken en redelijk goed in andere. Tegenwoordig is het veld echter grotendeels geëgaliseerd. Nauwkeurigheidspercentages in goede OCR -software voor het vertalen van Latijnse scripts die zijn getypt, zijn hoger dan 99%. Als het gaat om het invoeren van handschrift echter, of meer ingewikkelde lettertypen, heeft OCR -software nog steeds een relatief hoog bereik.

De kosten van OCR -software schommelen ook breed, vaak in relatie tot de nauwkeurigheidspercentages die het heeft. Er is een behoorlijke hoeveelheid gratis OCR -software te vinden die geschikt is voor het invoeren van gedrukte materie, en sommige kunnen worden gevonden die relatief goed zijn in het detecteren van handschrift, vooral met enige training. Dure softwaresuites, zoals de Omnipage Suite, die ongeveer $ 100 US dollar (USD) kost voor de thuisversie en ongeveer $ 450 USD voor de professionele versie, beschikt over indrukwekkende arrays van functies en over het algemeen hogere slagingspercentages.

Helaas bestaat er nog steeds niet zoiets als perfecte OCR -software, dus het kiezen van eenProgramma om te kopen kan nog steeds grotendeels een frustrerend proces zijn. Zelfs de beste programma's zullen het waarschijnlijk moeilijk hebben met handschrift, en fouten zullen onvermijdelijk doorkruisen, zelfs op lage niveaus. Meestal komt het kiezen van een programma om te kopen neer op extra functies: multi-lingual ondersteuning, one-touch scan en conversie-integratie, automatische PDF-conversie en herkenning van de hele woorden op gespecialiseerde disciplines zoals juridische en medische gebieden.

ANDERE TALEN