
Inhaltsverzeichnis
Was macht die Texterkennung?
Texterkennung bezeichnet in der Informationstechnik die automatisierte Texterkennung/ Schrifterkennung innerhalb von Bildern.
Der Begriff wird abgekürzt durch OCR (optical character recognition). In der Entstehungszeit dieser Technik wurde versucht, einzelne Buchstaben zu erkenn und zu Wörtern zusammenzufassen. Heute wird Texterkennung zunehmend durch neuronale Netze, die ganze Zeilen statt einzelner Zeichen verarbeiten, realisiert.
OCR-Software wird mit Rechtschreib- und Grammatik-Prüfprogrammen kombiniert, um automatisch Fehler zu entfernen. Es werden Methoden der Kontextanalyse (Intelligent Character Recognition , ICR) angewandt, mit denen die erkannten Text ggf. korrigiert werden können.
Anwendungen
Es gibt viele verschiedene Anwendungsmöglichkeiten für die elektronische Texterkennung.
- Gewinnen von Textinformation aus Bilddateien
- Erkennung von Merkmalen zur elektronischen Einsortierung eines Schriftstücks
- Volltextsuche in PDFs und Bilder
- Erkennung von Kfz-Kennzeichen
- Erstellung von Dokumenten, das der gescannten Vorlage bezüglich Text-, Bild- und Tabellenanordnung möglichst nahekommt.
- Blinde können sich eingescannte Texte auf Bilder vorlesen zu lassen
Verfügbare OCR-Software
Im Sektor Proprietäre Software ist hauptsächlich FineReader (ABBYY) und OmniPage (Kofax) zu nennen.
Freie Software
Es gibt viele verschiedenen Freie Projekte, die sich mit dem Thema Texterkennung beschäftigen. Am ausgereiftesten und sehr stark verbreitet ist die Software Tesseract. Tesseract wird von Ray Smith in Zusammenarbeit mit Google LLC entwickelt.