OCR (광학 문자 인식)이란 무엇입니까?
광학 문자 인식 (OCR)은 인쇄물을 텍스트 또는 워드 프로세싱 파일로 변환하는 프로세스로 쉽게 편집하고 저장할 수있는 프로세스입니다. 이 기술은 이러한 재료가 하드 카피 재료보다 훨씬 적은 저장 공간을 사용하여 저장할 수있게 해주었다. OCR 기술은 정보를 저장, 공유 및 편집하는 방식에 큰 영향을 미쳤습니다. 광학 문자 인식 전에 누군가가 책을 단어 처리 파일로 전환하려면 각 페이지를 단어로 입력해야합니다.
OCR 기술에는 하드웨어와 소프트웨어가 모두 필요합니다. 또한 정교한 OCR 시스템에는 프로세스를 완료하기 위해 컴퓨터 자체의 추가 회로 보드가 필요합니다. 광학 스캐너는 페이지에서 텍스트를 스캔 한 다음 글꼴을 비트 맵이라는 일련의 도트로 나눕니다. 이 소프트웨어는 가장 일반적인 글꼴을 읽고 라인이 시작하고 중지되는 위치를 구별 할 수 있습니다. 이 비트 맵은 컴퓨터 텍스트로 변환됩니다.
광학 문자 인식이 크게 만들어졌지만최근 몇 년간 발전해도 필기와 유사한 필기 또는 글꼴을 인식하는 데 여전히 잘 작동하는 것은 아닙니다. 은행 업계에는 OCR 기술을 사용하여 손으로 쓴 수표의 금액을 읽고 컴퓨터의 라우팅 및 계정 번호를 읽을 수있는 능력과 함께 사용하는 시스템이 있습니다.
OCR의 힘에 대한 아이디어를 제공하기 위해 실제 예를 살펴 보는 데 도움이 될 수 있습니다. 모든 범죄 기록이 광대 한 파일 캐비닛에 저장된 경찰서를 상상해보십시오. 수백만 페이지를 스캔하는 것은 비싸고 시간이 많이 걸리는 사업 일 것이지만, 이점은 엄청납니다.
OCR 시스템이 페이지를 컴퓨터로 읽을 수있는 텍스트로 변환 한 후에는 형사가 몇 초 안에 전체 기록을 검색 할 수 있습니다. 수동으로 특정 레코드를 찾는 것은 어렵지 않을 수 있지만 형사가 시어 보려고한다고 상상해보십시오.8:00에서 8:30 사이의 특정 교차로에 저지른 모든 범죄에 대한 C. 이 예제는 검색 가능한 텍스트의 힘의 표면을 긁는 것만으로, 많은 회사와 기관이 레거시 데이터를 OCR에 수백만 달러를 소비하는 이유 중 하나 일뿐입니다.
.