OCR (Optical Character Recognition)

OCR steht für "Optical Character Recognition" (optische Zeichenerkennung). OCR ist eine Technologie zur Erkennung von Text in einem digitalen Bild und wird häufig zur Erfassung von Texten in gescannten Dokumenten verwendet, dient aber auch vielen anderen Zwecken.

Optische Zeichenerkennung ist die mechanische oder elektronische Umwandlung von Bildern von maschinengeschriebenem, handgeschriebenem oder gedrucktem Text in maschinencodierten Text, sei es von einem gescannten Dokument, einem Foto eines Dokuments, einem Szenenfoto oder von einem Untertiteltext, der einem Bild überlagert ist.

Vorteile der OCR

Suchen und Bearbeiten von Daten

Die Möglichkeit der OCR, eine Textversion gescannter Dokumente zu erzeugen, ermöglicht die Suche nach Text und das Auffinden von Abschnitten des Dokuments durch die Suche nach Schlüsselwörtern. Sie ermöglicht es Ihnen auch, das gescannte Dokument mit einem Textverarbeitungsprogramm zu editieren.

Hilfe für Sehbehinderte und Blinde

Bildschirmlesegeräte können maschinenlesbaren Text entziffern und die Wörter vorlesen, so dass sehbehinderte Menschen verstehen können.

Schnellere Datenerfassung

Im Allgemeinen kann OCR die Arbeit im Büro wesentlich effektiver und effizienter gestalten. Das liegt daran, dass in den meisten Büros viel gescannt wird und eine hohe Anzahl von Dokumenten anfällt, und es besteht ein großer Bedarf an hoher Produktivität und effizienteren Prozessen.

Wie funktioniert OCR?

Um die Zeichen zu erkennen, untersucht die Software das Bild Pixel für Pixel und sucht dabei nach Formen, die den Zeichenmerkmalen entsprechen. Je nach dem Grad der Komplexität oder dem Entwicklungsstand der Software sucht sie nach Übereinstimmungen mit den im Programm verfügbaren Zeichen und Quellen oder versucht, die Zeichen durch Analyse ihrer Merkmale zu identifizieren.

Die OCR kann die Elemente des Dokuments (Textblöcke, Bilder, Tabellen...) analysieren, wobei Leerzeichen untersucht und der Text in Zeilen, Wörter und Zeichen zerlegt wird.

Wozu wird OCR verwendet?

OCR ist eine Querschnittstechnologie, die in verschiedenen Bereichen und Branchen für die Digitalisierung von Formularen, Verwaltungsdokumenten, Berichten usw. einsetzbar ist, da die Vorteile, die sie bietet, allen gemeinsam sind.

In der Kulturindustrie, z.B. im Bereich der Erhaltung des Kulturerbes, wird OCR hauptsächlich bei der Digitalisierung historischer Dokumente auf Papier oder Mikroformen eingesetzt.

Dank dieser Technologie werden Ausweisdokumente, Pässe oder Führerscheine digital verifiziert, so dass unsere Benutzer ihre Kunden auf bequeme und sichere Weise registrieren können.

Stand: 15.06.2020