Co je OCR (Optical Character Recognition)?

Optické rozpoznávání znaků (OCR) je proces převodu tištěných materiálů do textových nebo textových souborů, které lze snadno upravovat a ukládat. Tato technologie umožnila ukládání takových materiálů s použitím mnohem menšího úložného prostoru než u tištěných materiálů. Technologie OCR má obrovský dopad na způsob, jakým jsou informace ukládány, sdíleny a upravovány. Pokud by někdo chtěl před optickým rozpoznáváním znaků převést knihu do souboru pro zpracování textu, musela by být na každé stránce napsáno slovo pro slovo.

Technologie OCR vyžaduje hardware i software. Kromě toho sofistikované systémy OCR vyžadují pro dokončení procesu další desku s obvody v samotném počítači. Optický skener naskenuje text na stránce a poté rozdělí písma do řady bodů nazývaných bitmapa. Software umí číst nejběžnější písma a rozlišovat, kde se řádky začínají a zastavují. Tato bitmapa je poté přeložena do počítačového textu.

Optické rozpoznávání znaků sice v posledních letech zaznamenalo obrovský pokrok, ale stále ne vždy dobře rozpoznává rukopis nebo písma, která vypadají podobně jako rukopis. V bankovním průmyslu existují systémy, které využívají technologii OCR ke čtení částek na ručně psaných šekech, spolu s možností počítače číst směrování a čísla účtů.

Pro představu o síle OCR může pomoci podívat se na příklad ze skutečného světa. Představte si policejní oddělení, které má všechny své rejstříky trestů uloženy v rozsáhlých kartotékách. Přestože skenování milionů stránek by bylo nákladné a časově náročné, výhody jsou obrovské.

Jakmile systém OCR převede stránky na text čitelný počítačem, může například detektiv během několika sekund procházet celou historii. Ruční nalezení konkrétního záznamu nemusí být příliš obtížné, ale představte si detektiva, který se snaží hledat všechny zločiny spáchané na určité křižovatce mezi 8:00 a 8:30. Tento příklad pouze škrábe povrch síly prohledávatelného textu a je to jediný důvod, proč mnoho společností a institucí utrácí miliony dolarů na OCR za svá stará data.

JINÉ JAZYKY

Pomohl vám tento článek? Děkuji za zpětnou vazbu Děkuji za zpětnou vazbu

Jak můžeme pomoci? Jak můžeme pomoci?