OCRとは何ですか(光学文字認識)?
光学文字認識(OCR)は、印刷された資料を簡単に編集および保存できるワードプロセッシングファイルに変換するプロセスです。 このテクノロジーにより、このような材料は、ハードコピー材料よりもはるかに少ないストレージスペースを使用して保管できます。 OCRテクノロジーは、情報の保存、共有、編集の方法に大きな影響を与えました。光学文字認識の前に、誰かが本をワードプロセッシングファイルに変えたい場合、各ページは単語のために入力する必要があります。
OCRテクノロジーにはハードウェアとソフトウェアの両方が必要です。 さらに、洗練されたOCRシステムでは、プロセスを完了するためにコンピューター自体に追加の回路基板が必要です。光学スキャナーはページ上のテキストをスキャンし、フォントをビットマップと呼ばれる一連のドットに分割します。 ソフトウェアは、最も一般的なフォントを読み取り、行がどこで開始されて停止するかを区別できます。 このビットマップはコンピューターテキストに翻訳されます。
光学文字認識が大きくなっています近年の進歩は、手書きに似た手書きやフォントを認識する上で常にうまく機能するわけではありません。 銀行業界内には、OCRテクノロジーを使用して、手書きのチェックの金額を読み取るために、ルーティングとアカウント番号を読み取るコンピューターの機能と一緒にシステムがあります。
OCRの力を示すために、実際の例を見るのに役立ちます。 すべての犯罪歴があり、広大なファイルキャビネットに保管されている警察署を想像してください。 数百万ページをスキャンすることは、高価で時間のかかる仕事になるでしょうが、利点は膨大です。
OCRシステムがページをコンピューター可読テキストに変換すると、たとえば探偵は数秒で履歴全体を検索することができます。 特定のレコードを手動で見つけることはそれほど難しくないかもしれませんが、探偵が焼けようとしていると想像してください8:00から8:30の間に特定の交差点で行われたすべての犯罪に対してCH。 この例は、検索可能なテキストの力の表面を引っ掻くだけであり、多くの企業や機関が彼らの遺産データに数百万ドルを費やしている理由の1つにすぎません。