Wie arbeitet die Texterkennung (OCR) im Computer

Was macht die Texterkennung?

Texterkennung bezeichnet in der Informationstechnik die automatisierte Texterkennung/ Schrifterkennung innerhalb von Bildern.

Der Begriff wird abgekürzt durch OCR (optical character recognition). In der Entstehungszeit dieser Technik wurde versucht, einzelne Buchstaben zu erkenn und zu Wörtern zusammenzufassen. Heute wird Texterkennung zunehmend durch neuronale Netze, die ganze Zeilen statt einzelner Zeichen verarbeiten, realisiert.

OCR-Software wird mit Rechtschreib- und Grammatik-Prüfprogrammen kombiniert, um automatisch Fehler zu entfernen. Es werden Methoden der Kontextanalyse (Intelligent Character Recognition , ICR) angewandt, mit denen die erkannten Text ggf. korrigiert werden können.

Anwendungen

Es gibt viele verschiedene Anwendungsmöglichkeiten für die elektronische Texterkennung.

  • Gewinnen von Textinformation aus Bilddateien
  • Erkennung von Merkmalen zur elektronischen Einsortierung eines Schriftstücks
  • Volltextsuche in PDFs und Bilder
  • Erkennung von Kfz-Kennzeichen
  • Erstellung von Dokumenten, das der gescannten Vorlage bezüglich Text-, Bild- und Tabellenanordnung möglichst nahekommt.
  • Blinde können sich eingescannte Texte auf Bilder vorlesen zu lassen

Verfügbare OCR-Software

Im Sektor Proprietäre Software ist hauptsächlich FineReader (ABBYY) und OmniPage (Kofax) zu nennen.

Freie Software

Es gibt viele verschiedenen Freie Projekte, die sich mit dem Thema Texterkennung beschäftigen. Am ausgereiftesten und sehr stark verbreitet ist die Software Tesseract. Tesseract wird von Ray Smith in Zusammenarbeit mit Google LLC entwickelt.