Was ist SmartReco-L?
SmartReco-L ...
- ist eine qualitativ hochwertige, flexible und schnelle ICR/OCR-Software zur Erkennung von Handblockschrift- oder Maschinenschrift-Zeilen in Binär-Bildern.
- kann mit Hilfe der speziellen Bilddatei-Schnittstelle "SmartReco-L Image-File-Interface" auch Farb- und Grau-Bilder verarbeiten.
- ruft intern den Einzelzeichen-Erkenner SmartReco-C auf.
- muß nicht mühsam vom Anwender trainiert werden, sondern benutzt leistungsfähige Klassifikatoren, die von RecoScript problemspezifisch berechnet und konfiguriert wurden.
- ist kein Endkundenprodukt, sondern eine Unterprogramm-Bibliothek für Software-Entwickler.
- basiert auf komplexen mathematischen Transformationen und bietet ein Höchstmaß an Erkennungssicherheit.
- wurde in ANSI-C realisiert. C#- und Java-Entwickler werden durch entsprechenden Interface-Code unterstützt.
- besteht aus drei Funktionen, die sich sehr leicht integrieren lassen und deren Benutzung an die Dateibearbeitung mit fopen, fread und fclose erinnert:
- srl_open öffnet einen Handblockschrift- oder Maschinenschrift-Klassifikator,
- srl_read liest mit Hilfe des Klassifikators eine Handschrift- oder Maschinenschrift-Zeile,
- srl_close schließt den Klassifikator und gibt den zugehörigen Speicher frei.
- wurde Plattform-unabhängig konzipiert und ist mittlerweile als statische oder dynamische C-Bibliothek für Windows/X86 (32-Bit), Windows/X64 (64-Bit), Linux/X86 (32-Bit) und Linux/X64 (64-Bit) verfügbar.
----------------------------------------
Das folgende Diagramm veranschaulicht den Aufruf der Funktion srl_read in einer typischen SmartReco-L Anwendung (Formularleser):
Es soll ein Stapel gleichartiger Binär-Bilder (von Formularen, Dokumenten usw.) verarbeitet werden, wobei jedes Bild mehrere OCR-Lesebereiche (in unserem Beispiel einen Maschinenschrift-Numerik- und einen Handschrift-Alphanumerik-Lesebereich) enthält.
Zunächst werden mit srl_open alle benötigten Klassifikatoren geöffnet.
Danach werden sämtliche Bilder mit srl_read gelesen, wobei pro Aufruf das jeweilige Bild, die Koordinaten eines Lesebereichs, das zugehörige Klassifikator-Handle und (optional) diverse Konfigurations-Parameter zu übergeben sind. srl_read erzeugt zu jedem Zeichen der Zeile einen Ergebnis-Datensatz, der u.a. eine Liste möglicher Unicodes mit zugehörigen Qualitätswerten (Wahrscheinlichkeiten) enthält. Das Anwendungsprogramm bildet dann mit Hilfe seines Kontext-Wissens aus den Ergebnis-Datensätzen der einzelnen Zeichen das Leseergebnis der Zeile (z.B. "ROUTE 65").
Nachdem der Stapel verarbeitet ist, werden die geöffneten Klassifikatoren mit srl_close geschlossen.