- Offizieller Beitrag
Jetzt nochmal, damals wolltest du doch das das Abschlussfax nicht an den EM übergeben wird und verworfen wird, oder? Das funktioniert ja nach wie vor. Sehe ich das richtig dass du auch keinen Ausdruck haben möchtest?
Jetzt nochmal, damals wolltest du doch das das Abschlussfax nicht an den EM übergeben wird und verworfen wird, oder? Das funktioniert ja nach wie vor. Sehe ich das richtig dass du auch keinen Ausdruck haben möchtest?
Genau, das Abschlussfax wird nicht an den EM übergeben, das klappt hervorragend. Es wird aber ausgedruckt (auch dreimal, wie das Alarmfax). Wir benötigen das Abschlussfax allerdings gar nicht weiter, da die Einsätze anderweitig verarbeitet werden. Vorher würden auch nur die Alarmfax ausgedruckt.
Gruß Thomas
Ok alles klar, ich werd was einbauen...
Mach bei den Ausgabe-Einstellungen den Haken bei "Marker setzen" rein, dann wird an das Ende der übersetzten .txt Datei "---ENDE---" eingefügt. Das kannst du dann im AutoParser als "Lesen bis" angeben, dann liest er auch mehere Zeilen ein.
Du kannst auch einfach bei "Suchbegriff" den ganzen Text z.B. "Bemerkung-----------------" angeben, dann liest er auch erst ab dem letzten "-" Zeichen. Dann sparst du dir die Suchen und Ersetzen Funktion. Sollte aber grundsätzlich beides funktionieren.
Super danke, das hat geklappt.
Bringt mich gleich zur nächsten Frage... Ich hab zwar die 19 Seiten schon mal überflogen, aber nichts gefunden (ich schließe nicht aus, es überlesen zu haben).
Und zwar ist unser Fax manchmal mehrseitig. Da aber die 2. Seite nicht immer voll ist, endet die Seite schon nach ein paar Zeilen. Ich vermute, dass deshalb das Format nicht passt.
Jedenfalls hängt sich dann EM-OCR reproduzierbar auf. Die TIF Datei ist dann aus dem EM-OCR Ordner verschwunden, eine Textdatei im EM Eingangsordner erscheint nicht.
Ebensowenig gibt das EM-OCR-Log was her...
Ist das schon bekannt?
*********UPDATE********* V1.0.30
-> Negativen Identifier für Druckeinstellungen 1/2 hinzugefügt. Bei Auffinden des Schlüsselwortes wird das Fax nicht ausgedruckt.
-> System eingebaut, dass Dateien, die sich noch in Erstellung befinden (z.B. Fax erstellt Datei in Ordner und benötigt dafür längere Zeit), erkannt werden und erst bearbeitet werden, wenn diese vollständig geschrieben wurden. Ebenso werden Dateien erkannt, die z.B. während der Erstellung eine andere Dateiendung haben (z.B. .tif_/.tif). Ich gebe allerdings keine Garantie darauf dass dies für für sämtliche Faxtypen funktioniert.
-> Erweitertes Fehlerhandling für noch höhere Ausfallsicherheit auch im Fehlerfall.
Das ist bekannt, jedoch aufgrund fehlender Beispieldateien nicht nachvollziehbar. Wenn möglich sende mir bitte die Datei zu, mit der der Fehler auftritt.
Stefan Seider Du bist der Hammer. Vielen Dank. Ich werde es morgen gleich einspielen.
Das ist bekannt, jedoch aufgrund fehlender Beispieldateien nicht nachvollziehbar. Wenn möglich sende mir bitte die Datei zu, mit der der Fehler auftritt.
Könnte ich dir schicken, hätte da grad eins zur Hand von einer Übung... Email?
Ich habe den Fehler gefunden, die von mir verwendete Tesseract-Version ist anscheinend nicht Multipage-fähig und kann damit keine mehrseitigen TIFs auswerten. Ich muss die Version auf 3.05.02 updaten, mit dieser funktioniert es. Ich werde die Änderung in V1.0.31 mit einpflegen, ab dann muss allerdings Tesseract eigens installiert werden. Stellt aber prinzipiell kein Problem dar.
Das ging ja mal (wieder) schnell! Vielen Dank schon mal dafür!
Stefan Seider wie gibt's das, zumindest 4-seitige Faxe funktionierten doch bislang problemlos? Eben nochmal getestet.
@Martin
PDF oder TIFF?
*********UPDATE********* V1.0.31
-> Tesseract ausgelagert, um Multipage-fähig zu sein.
Ab V1.0.31 ist tesseract kein integrierter Bestandteil von EM-OCR mehr, die für EM-OCR benötigte Software muss ab sofort unter folgenden Links abgerufen und selbst installiert werden. Diese Schritte müssen nur einmalig durchgeführt werden.
TESSERACT INSTALLATION:
Bei der Installation von Tesseract könnt ihr euch zusätzlich das Language-File für "Germany" mit anklicken, falls Ihr mit der alarm.traineddata bisher nicht den gewünschten erfolg hattet. Ansonsten bitte die Datei -> alarm.traineddata <- herunterladen und im Tesseract-Programmordner (C:\Program Files (x86)\Tesseract-OCR\tessdata\) kopieren.
GHOSTSCRIPT INSTALLATION:
Hier sind keine weiteren Schritte nötig.
Bitte aktualisiert falls notwendig im Anschluss die im EM-OCR angegebenen Ordner-Pfade für Tesseract bzw. GhostScript!
Stefan Seider Die Ausgangsdatei war bei mir immer ein PDF.
@Martin
Mit mehrseitigen TIFFs ging es bisher leider nicht. Deswegen das Update von Tesseract...
Alles anzeigen*********UPDATE********* V1.0.31
-> Tesseract ausgelagert, um Multipage-fähig zu sein.
ACHTUNG
Ab V1.0.31 ist tesseract kein integrierter Bestandteil von EM-OCR mehr, die für EM-OCR benötigte Software muss ab sofort unter folgenden Links abgerufen und selbst installiert werden. Diese Schritte müssen nur einmalig durchgeführt werden.
TESSERACT INSTALLATION:
Bei der Installation von Tesseract könnt ihr euch zusätzlich das Language-File für "Germany" mit anklicken, falls Ihr mit der alarm.traineddata bisher nicht den gewünschten erfolg hattet. Ansonsten bitte die Datei -> alarm.traineddata <- herunterladen und im Tesseract-Programmordner (C:\Program Files (x86)\Tesseract-OCR\tessdata\) kopieren.
GHOSTSCRIPT INSTALLATION:
Hier sind keine weiteren Schritte nötig.
Bitte aktualisiert falls notwendig im Anschluss die im EM-OCR angegebenen Ordner-Pfade für Tesseract bzw. GhostScript!
Hab es bei mir neu installiert. Allerdings kommt bei mir nun folgende Meldung. --->> er findet die Sprach-Datei nicht
ZitatAlles anzeigen31.10.2018 21:09:21 - Programmstart
31.10.2018 21:10:21 - Tesseract-Pfad geändert
31.10.2018 21:10:28 - Service gestartet
31.10.2018 21:10:41 - Datei "C:\Users\patri\Desktop\EM-OCR\Input\20185127055121.tif" erkannt
31.10.2018 21:10:41 - Tesseract:
Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/deu.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'deu'
Tesseract couldn't load any languages!
Could not initialize tesseract.
31.10.2018 21:10:41 - TIF verarbeitet
31.10.2018 21:10:41 - FEHLER - Datei nicht lesbar
31.10.2018 21:10:41 - Vorgang 20181031091041 beendet
31.10.2018 21:10:49 - Service gestoppt
31.10.2018 21:11:05 - Service gestartet
31.10.2018 21:11:07 - Datei "C:\Users\patri\Desktop\EM-OCR\Input\20185127055121.tif" erkannt
31.10.2018 21:11:07 - Tesseract:
Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/alarm.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'alarm'
Tesseract couldn't load any languages!
Could not initialize tesseract.
31.10.2018 21:11:07 - TIF verarbeitet
31.10.2018 21:11:07 - FEHLER - Datei nicht lesbar
31.10.2018 21:11:07 - Vorgang 20181131091107 beendet
31.10.2018 21:11:11 - Service gestoppt
31.10.2018 21:11:18 - Service gestartet
31.10.2018 21:11:19 - Datei "C:\Users\patri\Desktop\EM-OCR\Input\20185127055121.tif" erkannt
31.10.2018 21:11:19 - Tesseract:
Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/deu.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'deu'
Tesseract couldn't load any languages!
Could not initialize tesseract.
31.10.2018 21:11:19 - TIF verarbeitet
31.10.2018 21:11:19 - FEHLER - Datei nicht lesbar
31.10.2018 21:11:19 - Vorgang 20181131091119 beendet
31.10.2018 21:11:41 - Service gestoppt
31.10.2018 21:12:18 - GhostScript-Pfad geändert
31.10.2018 21:12:18 - Service gestartet
31.10.2018 21:12:24 - Datei "C:\Users\patri\Desktop\EM-OCR\Input\20185127055121.tif" erkannt
31.10.2018 21:12:24 - Tesseract:
Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/deu.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'deu'
Tesseract couldn't load any languages!
Could not initialize tesseract.
31.10.2018 21:12:24 - TIF verarbeitet
31.10.2018 21:12:24 - FEHLER - Datei nicht lesbar
31.10.2018 21:12:24 - Vorgang 20181231091224 beendet
31.10.2018 21:13:03 - Service gestoppt
31.10.2018 21:13:29 - Service gestartet
31.10.2018 21:13:39 - Datei "C:\Users\patri\Desktop\EM-OCR\Input\20185127055121.tif" erkannt
31.10.2018 21:13:39 - Tesseract:
Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/deu.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'deu'
Tesseract couldn't load any languages!
Could not initialize tesseract.
31.10.2018 21:13:39 - TIF verarbeitet
31.10.2018 21:13:39 - FEHLER - Datei nicht lesbar
31.10.2018 21:13:39 - Vorgang 20181331091339 beendet
31.10.2018 21:15:31 - Service gestoppt
31.10.2018 21:15:42 - Service gestartet
31.10.2018 21:15:48 - Datei "C:\Users\patri\Desktop\EM-OCR\Input\20185127055121.tif" erkannt
31.10.2018 21:15:48 - Tesseract:
Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/alarm.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'alarm'
Tesseract couldn't load any languages!
Could not initialize tesseract.
31.10.2018 21:15:48 - TIF verarbeitet
31.10.2018 21:15:48 - FEHLER - Datei nicht lesbar
31.10.2018 21:15:48 - Vorgang 20181531091548 beendet
Dann fehlt dir die alarm bzw deu traineddata. Hast du sie wie beschrieben in den Ordner kopiert?
Dann fehlt dir die alarm bzw deu traineddata. Hast du sie wie beschrieben in den Ordner kopiert?
Hab ich gemacht.
Dann schau mal bitte unter:
-> Systemsteuerung -> System und Sicherheit -> System -> Erweiterte Systemeinstellungen -> Umgebungsvariablen
ob hier eine Umgebungsvariable für Tesseract auf ein falsches Verzeichnis eingetragen ist.
bzw. gib mal das in den Explorer oben ein und sag mir wo du raus kommst:
\Program Files (x86)\Tesseract-OCR\tessdata/