Was ist OCR (optische Charaktererkennung)?
optische Charaktererkennung (OCR) ist ein Prozess, in dem gedruckte Materialien in Text- oder Textverarbeitungsdateien konvertiert werden können, die leicht bearbeitet und gespeichert werden können. Die Technologie hat ermöglicht, dass solche Materialien mit viel weniger Speicherplatz als die Hardcopy -Materialien gespeichert werden. Die OCR -Technologie hat einen großen Einfluss auf die Art und Weise, wie Informationen gespeichert, geteilt und bearbeitet werden. Vor der optischen Charaktererkennung müsste jede Seite ein Buch für Wort eingeben, wenn jemand ein Buch in eine Textverarbeitungsdatei verwandeln wollte.
OCR -Technologie erfordert sowohl Hardware als auch Software. Darüber hinaus erfordern anspruchsvolle OCR -Systeme eine zusätzliche Leiterplatte im Computer selbst, um den Prozess abzuschließen. Ein optischer Scanner scannt den Text auf einer Seite und unterteilt dann die Schriftarten in eine Reihe von Punkten, die als Bitmap bezeichnet werden. Die Software kann die meisten gebräuchlichen Schriftarten lesen und unterscheiden, wo Linien beginnen und anhalten. Diese Bitmap wird dann in Computertext übersetzt.Fortschritte in den letzten Jahren erkennen immer noch nicht immer gut, um Handschrift oder Schriftarten zu erkennen, die der Handschrift ähnlich aussehen. Es gibt Systeme in der Bankenbranche, die die OCR-Technologie verwenden, um zu versuchen, die Beträge von handgeschriebenen Schecks zu lesen, um mit der Fähigkeit des Computers die Fähigkeit des Computers zu lesen, die Routing- und Kontonummern zu lesen.
Um eine Vorstellung von der Kraft von OCR zu geben, kann es hilfreich sein, sich ein Beispiel in der Praxis anzusehen. Stellen Sie sich eine Polizeibehörde vor, in der alle Strafregister in riesigen Aktenkabinen gespeichert sind. Obwohl das Scannen von Millionen von Seiten ein teures und zeitaufwändiges Unterfangen wäre, sind die Vorteile groß.
Sobald das OCR-System die Seiten in computerlesbaren Text umgewandelt hat, könnte ein Detektiv beispielsweise in wenigen Sekunden den gesamten Geschichte durchsuchen. Manuelles Finden einer bestimmten Aufzeichnung ist möglicherweise nicht zu schwierig, aber stellen Sie sich vor, ein Detektiv, der versucht, anbraten zuCh für alle Verbrechen, die zwischen 8:00 und 8:30 Uhr an einer bestimmten Kreuzung begangen wurden. Dieses Beispiel kratzt nur die Oberfläche der Leistung durchsuchbarer Text, und es ist nur ein Grund, dass viele Unternehmen und Institutionen Millionen von Dollar ausgeben, um ihre Legacy -Daten zu übertreffen.