Co to jest OCR (optyczne rozpoznawanie znaków)?
Optyczne rozpoznawanie znaków (OCR) to proces przekształcania drukowanych materiałów w pliki tekstowe lub edytory tekstu, które można łatwo edytować i przechowywać. Technologia umożliwiła przechowywanie takich materiałów przy użyciu o wiele mniejszej przestrzeni niż materiały w formie papierowej. Technologia OCR wywarła ogromny wpływ na sposób przechowywania, udostępniania i edytowania informacji. Przed optycznym rozpoznawaniem znaków, jeśli ktoś chciał zamienić książkę w plik edytora tekstu, każda strona musiałaby być wpisana słowo w słowo.
Technologia OCR wymaga zarówno sprzętu, jak i oprogramowania. Ponadto zaawansowane systemy OCR wymagają dodatkowej płytki drukowanej w samym komputerze, aby zakończyć proces. Skaner optyczny skanuje tekst na stronie, a następnie rozkłada czcionki na serię kropek zwanych bitmapą. Oprogramowanie odczytuje najczęściej używane czcionki i rozróżnia, gdzie linie zaczynają się i kończą. Ta mapa bitowa jest następnie tłumaczona na tekst komputerowy.
Chociaż w ostatnich latach dokonano ogromnego postępu w optycznym rozpoznawaniu znaków, nadal nie zawsze sprawdza się w rozpoznawaniu pisma ręcznego lub czcionek, które wyglądają podobnie do pisma ręcznego. W branży bankowej istnieją systemy, które wykorzystują technologię OCR do odczytywania kwot na odręcznych czekach, a także do zdolności komputera do odczytywania numerów tras i kont.
Aby dać wyobrażenie o mocy OCR, warto spojrzeć na przykład z prawdziwego świata. Wyobraź sobie wydział policji, który przechowuje wszystkie swoje rejestry karne w rozległych szafach na akta. Chociaż skanowanie milionów stron byłoby kosztownym i czasochłonnym przedsięwzięciem, korzyści są ogromne.
Gdy system OCR przekształci strony w tekst czytelny dla komputera, na przykład detektyw może przeszukać całą historię w ciągu kilku sekund. Ręczne odnalezienie konkretnego rekordu może nie być zbyt trudne, ale wyobraź sobie detektywa próbującego wyszukać wszystkie przestępstwa popełnione na pewnym skrzyżowaniu między 8:00 a 8:30. Ten przykład tylko rysuje powierzchnię możliwości wyszukiwania tekstu i jest to tylko jeden z powodów, dla których wiele firm i instytucji wydaje miliony dolarów na OCR swoich starszych danych.