Jak wybrać najlepsze oprogramowanie OCR?
Oprogramowanie OCR lub oprogramowanie do optycznego rozpoznawania znaków to oprogramowanie zaprojektowane do tłumaczenia obrazów tekstu na rzeczywisty tekst, który komputer może odczytać. Zasadniczo oprogramowanie OCR jest używane po zeskanowaniu obrazu do komputera, chociaż można również użyć innych form wprowadzania. Oprogramowanie OCR działa najlepiej na już napisanym tekście, w przypadku zagubienia oryginalnego wydruku lub na arkuszach skanowanych na maszynie do pisania. Dobre oprogramowanie może jednak być w stanie tłumaczyć odręcznie tekst, chociaż wskaźnik błędów w tego rodzaju konwersji jest zwykle znacznie wyższy.
Rzeczywisty termin oprogramowanie OCR jest nieco mylące, ponieważ większość współczesnych programów OCR w rzeczywistości nie wykorzystuje optycznego rozpoznawania znaków, ale faktycznie używa cyfrowego rozpoznawania znaków. Jest tak, ponieważ kilka lat temu pola skutecznie się połączyły, a oba pola przyjęły bardziej atrakcyjny termin optyczne rozpoznawanie znaków. Oprogramowanie OCR znacznie się rozwinęło w ostatnich latach, a nowoczesne programy są znacznie lepsze niż ich poprzednicy w rozpoznawaniu tekstu.
W rzeczywistości wczesne oprogramowanie OCR wymagało przeszkolenia programu w zakresie konkretnej czcionki, zanim będzie można ją dokładnie wprowadzić. Podobnie podczas wprowadzania pisma ręcznego program musiałby zostać przeszkolony, co może być niezwykle czasochłonne. Jednak metody uległy poprawie, a bardziej inteligentne systemy są teraz normą. Stosowane metody są obecnie względnie statyczne, a jedynie niewielka część badań dotyczy opracowania całkowicie nowych metod, a większość badań dotyczy udoskonalenia istniejących procedur, aby były one jeszcze dokładniejsze. Wczesne oprogramowanie OCR było używane w szerokim zakresie aplikacji, a duże korporacje używały go do odczytywania odcisków kart kredytowych w latach 50. XX wieku, a usługa pocztowa Stanów Zjednoczonych używała go do sortowania poczty od połowy lat 60. XX wieku.
Dziesięć lat temu wybór oprogramowania OCR był trudny, ponieważ wiele programów było dość kiepskich w niektórych zadaniach i dość dobrych w innych. Jednak w dzisiejszych czasach pole zostało w dużej mierze wyrównane. Wskaźniki dokładności w każdym dobrym oprogramowaniu OCR do tłumaczenia pisanych skryptów łacińskich wynoszą ponad 99%. Jeśli chodzi o wprowadzanie pisma ręcznego lub bardziej skomplikowane kroje pisma, oprogramowanie OCR nadal ma stosunkowo duży zasięg.
Koszt oprogramowania OCR również znacznie się zmienia, często w stosunku do wskaźników dokładności, jakie może pochwalić. Można znaleźć sporo darmowego oprogramowania OCR, które jest odpowiednie do wprowadzania materiałów drukowanych, a niektóre można znaleźć, które są stosunkowo dobre w wykrywaniu pisma ręcznego, szczególnie przy pewnym szkoleniu. Droższe pakiety oprogramowania, takie jak pakiet OmniPage, który kosztuje około 100 USD za wersję domową i około 450 USD za wersję profesjonalną, oferuje imponujący zestaw funkcji i ogólnie wyższe wskaźniki sukcesu.
Niestety, wciąż nie ma czegoś takiego jak doskonałe oprogramowanie OCR, więc wybór programu do zakupu może nadal być w dużej mierze frustrującym procesem. Nawet najlepsze programy prawdopodobnie będą miały trudności z pisaniem odręcznym, a błędy nieuchronnie będą się pojawiać, nawet na niskich poziomach. Przeważnie wybór programu do zakupu sprowadza się do dodatkowych funkcji: obsługa wielu języków, integracja skanowania i konwersji jednym dotknięciem, automatyczna konwersja PDF i rozpoznawanie całego słowa w specjalistycznych dyscyplinach, takich jak dziedziny prawa i medycyny.