Freiformbasierte Datenextraktion

smart.XTRACT ist die wichtigste Komponente bei der automatischen Dokumentenerfassung bzw. -Indexierung. Sie läuft als Dienst auf dem smart.CAPTURE-Dokumentenserver und verarbeitet nicht- bzw. teilstrukturierte Dokumente wie beispielsweise Rechnungen, Gutschriften, Auftragsbestätigungen, Zahlungsavise etc. smart.XTRACT liest jeweils relevante Belegfelder automatisch, d.h. ohne vorausgehenden Anlernprozess, aus.

Egal, wo und auf welcher Seite sich z.B. Rechnungsdatum, -nummer u. -betrag, Mehrwertsteuer oder jedes andere zur Verbuchung benötigte Datenfeld befinden: smart.XTRACT findet sie und extrahiert den Inhalt. Einzige Voraussetzung ist die maschinelle Lesbarkeit der Textzeichen beim OCR-Prozess, die im Wesentlichen von der Scan-Qualität abhängt. Falls es sich um eine digital übermittelte PDF-Datei handelt, wird diese sofort, d.h. ohne Scan-Vorgang ausgelesen. Durch automatische Prüfungen und Datenbankabgleiche lässt sich jeder gewünschte Sicherheitsgrad bei den Extraktionsergebnissen erreichen.

tl_files/digidok/artikel/Screen05Zu-AbschlägeXSmall.jpg

Zusätzlich können vom Anwender noch individuelle Belegfelder in wenigen Minuten je Lieferant definiert und interaktiv getestet werden. Ihre Dateninhalte werden danach vom System zuverlässig extrahiert und in die entsprechenden Felder der Erfassungsmaske übertragen.