Was ist SmartReco-C?
SmartReco-C ...
- ist eine qualitativ hochwertige, flexible und schnelle ICR/OCR-Software zur Erkennung von Handschrift- oder Maschinenschrift-Einzelzeichen oder -Symbolen in Binär-Bildern.
- muß nicht mühsam vom Anwender trainiert werden, sondern benutzt leistungsfähige Klassifikatoren, die von RecoScript problemspezifisch berechnet und konfiguriert wurden.
- ist kein Endkundenprodukt, sondern eine Unterprogramm-Bibliothek für Software-Entwickler.
- setzt voraus, daß segmentierte Einzelzeichen oder Symbole vorliegen.
- kann als zentrale Basis-Komponente eines Zeilenlesers oder als zusätzlicher Erkenner in einem Voting-System eingesetzt werden.
- basiert auf komplexen mathematischen Transformationen und bietet ein Höchstmaß an Erkennungssicherheit.
- wurde in ANSI-C realisiert. C#- und Java-Entwickler werden durch entsprechenden Interface-Code unterstützt.
- besteht aus drei Funktionen, die sich sehr leicht integrieren lassen und deren Benutzung an die Dateibearbeitung mit fopen, fread und fclose erinnert:
- src_open öffnet einen Einzelzeichen- oder Symbol-Klassifikator,
- src_read liest mit Hilfe des Klassifikators ein Zeichen oder Symbol,
- src_close schließt den Klassifikator und gibt den zugehörigen Speicher frei.
- wurde Plattform-unabhängig konzipiert und ist mittlerweile als statische oder dynamische C-Bibliothek für Windows/X86 (32-Bit), Windows/X64 (64-Bit), Linux/X86 (32-Bit) und Linux/X64 (64-Bit) verfügbar.
----------------------------------------
Das folgende Diagramm veranschaulicht den Aufruf der Funktion src_read in einer typischen SmartReco-C Anwendung (Zeilenleser):
Es soll das in einem Binär-Bild enthaltene Handschrift-Wort "WORLD" gelesen werden.
Zunächst wird mit src_open der gewünschte Klassifikator (z.B. Handschrift-Alphanumerik USA) geöffnet.
Dann werden alle Einzelzeichen durch das Anwendungsprogramm extrahiert und mit src_read verarbeitet, wobei pro Aufruf ein Zeichen und das zugehörige Klassifikator-Handle zu übergeben sind. src_read erzeugt zu jedem Zeichen einen Ergebnis-Datensatz, der u.a. eine Liste möglicher Unicodes mit zugehörigen Qualitätswerten (Wahrscheinlichkeiten) enthält. Das Anwendungsprogramm bildet dann mit Hilfe seines Kontext-Wissens und der Qualitätswerte aus den Ergebnis-Datensätzen der einzelnen Zeichen das gesuchte Wort "WORLD".