Installiert habe ich Tesseract auf meiner D Festplatte.
bei den umgebungsvariablen steht nichts von tesseract drin
Installiert habe ich Tesseract auf meiner D Festplatte.
bei den umgebungsvariablen steht nichts von tesseract drin
Dann installier es doch bitte auf dem C Laufwerk zum Test
Bin mir nicht sicher, aber ich glaube dass deine Verlinkung zur Alarm.traineddata falsch ist.
Und deshalb auch die Fehlermeldung beim @patrick.samardzija kommt.
Ich kann sie z.B. nicht als Datei runterladen (evtl. bin ich auch nur zu blöd), und Ziel speichern bringt nicht die gewünschte Datei...
Kannst du das bitte mal überprüfen.
Nein, der Pfad ist korrekt, sonst würde tesseract ja gar nicht starten. Einfach tesseract auf Laufwerk C installieren, dann klappt es.
Der Link im Anfangspost zur alarm.traineddata funktioniert, gerade getestet...
Bin mir nicht sicher, aber ich glaube dass deine Verlinkung zur Alarm.traineddata falsch ist.
Und deshalb auch die Fehlermeldung beim @patrick.samardzija kommt.
Ich kann sie z.B. nicht als Datei runterladen (evtl. bin ich auch nur zu blöd), und Ziel speichern bringt nicht die gewünschte Datei...
Kannst du das bitte mal überprüfen.
Link speichern funktioniert nicht, weil hier ein referrer dazwischen hängt. Wenn man die Datei mitm Edge laden will, wird sie als Text angezeigt. Probier nen anderen Browser. Mit Chrome hats bei mir funktioniert.
Link speichern funktioniert nicht, weil hier ein referrer dazwischen hängt. Wenn man die Datei mitm Edge laden will, wird sie als Text angezeigt. Probier nen anderen Browser. Mit Chrome hats bei mir funktioniert.
Danke dir für den Tipp!
Dann installier es doch bitte auf dem C Laufwerk zum Test
Also so hat es funktioniert, warum auch immer.
Desweiteren funktioniert das mit der Datei erkennung funktioniert bei mir noch immer nicht richtig. Ich werde heute Mittag den Log nochmals posten.
Ich bin dran, dauert aber etwas...
Stefan - Thematik Datei wird nicht erkannt.
https://docs.microsoft.com/de-de/dotnet/a…framework-4.7.2
Idee: Hast du den Rename Eventhandler in der Verarbeitungsroutine registriert?
Ich muss 2 Filesystemwatcher kombinieren, damit auch Dateien die während der Erstellung eine andere Dateiendung haben (z.B. tif_/tif) und gleichzeitig mehrere Sekunden zum vollständigen schreiben benötigen, erkannt (und nur 1 x erkannt) werden. Das mach ich mit einem FSW auf OnCreated und einem 2. FSW auf OnRenamed.
Ist aber noch etwas tricky, vorallem den richtigen NotificationFilter rauszukriegen und die beiden FSW zur richtigen Zeit gegeneinander zu sperren...
*********UPDATE********* V1.0.32
-> Änderungen am Filesystemwatcher durchgeführt.
-> Bugfixing Netzwerklaufwerk und verzögerte Dateierstellung
@patrick.samardzija
Bitte testen
Meine ersten Tests liefen alle fehlerfrei durch!
Jetzt noch abwarten wie es ohne Testbedingung reagiert.
Danke dir schon mal für die, wie immer schnelle, Problem Annahme und Behebung!
Alles anzeigen*********UPDATE********* V1.0.32
-> Änderungen am Filesystemwatcher durchgeführt.
-> Bugfixing Netzwerklaufwerk und verzögerte Dateierstellung
@patrick.samardzija
Bitte testen
Also bei mir funktioniert es nicht.
Mein Programm welches die FAXen(?) auf dem PC speichert, bringt nun eine Fehlermeldung das er nicht genug Speicherplatz habe.
Sobald ich den Ordner wechsle, welcher nicht der EM-OCR Input Ordner ist, kann ich die FAXen(?) wieder speichern.
Alles anzeigen*********UPDATE********* V1.0.32
-> Änderungen am Filesystemwatcher durchgeführt.
-> Bugfixing Netzwerklaufwerk und verzögerte Dateierstellung
@patrick.samardzija
Bitte testen
Regressionstest für die neue Tesseract-/Ghostscript-/EM-OCR-Version bestanden:
30 Alarmfaxe, in einem Abstand von 60 Sekunden pro Fax, in den EM-OCR-Eingangsordner (FritzBox Netzlaufwerk) kopiert.
Meine Tests waren vielversprechend, aber der erste Einsatz wurde leider wieder nicht ausgewertet.
Fehler entsteht weiterhin in Verbindung mit Ghostscript.
Hoffe du findest bald eine potentielle Lösung dafür.
Wenn das Fax über die interne Faxfunktion der Fritzbox kommt, scheint es nicht zu funktionieren.
03.11.2018 17:23:41 - Datei\\Fritz-nas\fritz.nas\FRITZ\faxbox\03.11.18_17.23_Telefax.0814122815.pdf wurde erstellt
03.11.2018 17:23:41 - Vorgang 20182303052341 gestartet
03.11.2018 17:23:42 - GhostScript:
GPL Ghostscript 9.22 (2017-10-04)
Copyright (C) 2017 Artifex Software, Inc. All rights reserved.
This software comes with NO WARRANTY: see the file PUBLIC for details.
03.11.2018 17:23:42 - PDF verarbeitet
03.11.2018 17:23:42 - Tesseract Retry 1
03.11.2018 17:23:43 - Tesseract Retry 2
03.11.2018 17:23:44 - Tesseract Retry 3
03.11.2018 17:23:45 - Tesseract:
Tesseract Open Source OCR Engine v3.02 with Leptonica
Cannot open input file: C:\Users\PC\AppData\Local\Temp\EM-OCR\20182303052341.tif
03.11.2018 17:23:45 - TIF verarbeitet
03.11.2018 17:23:45 - FEHLER - Datei nicht lesbar
03.11.2018 17:23:45 - Die Datei C:\Users\PC\AppData\Local\Temp\EM-OCR\20182303052341.tif konnte nicht gefunden werden.
03.11.2018 17:23:45 - Vorgang 20182303052341 beendet
Wenn ich die Fax-Datei (pdf) aus dem internen Fax-Ordner nehme und wieder hinzufüge, dann kann der EM-OCR es korrekt auswerten
03.11.2018 18:26:09 - Datei\\Fritz-nas\fritz.nas\FRITZ\faxbox\03.11.18_17.23_Telefax.0814122815.pdf wurde erstellt
03.11.2018 18:26:09 - Warten bis Input-Datei vollständig geschrieben wurde...
03.11.2018 18:26:11 - Vorgang 20182603062611 gestartet
03.11.2018 18:26:13 - GhostScript:
GPL Ghostscript 9.22 (2017-10-04)
Copyright (C) 2017 Artifex Software, Inc. All rights reserved.
This software comes with NO WARRANTY: see the file PUBLIC for details.
Processing pages 1 through 1.
Page 1
03.11.2018 18:26:13 - PDF verarbeitet
03.11.2018 18:26:13 - Tesseract:
Tesseract Open Source OCR Engine v3.02 with Leptonica
03.11.2018 18:26:13 - TIF verarbeitet
03.11.2018 18:26:13 - Ausgabeeinstellung 1 angewendet
03.11.2018 18:26:13 - Ausgabeeinstellung 2 angewendet
03.11.2018 18:26:13 - Ausgabeeinstellung 3 angewendet
03.11.2018 18:26:13 - Ausgabeeinstellung 4 angewendet
03.11.2018 18:26:13 - AutoParser gestartet ******************************************************
03.11.2018 18:26:13 - RIC RETTUNGSDIENST 03.11.2018 #########
03.11.2018 18:26:13 - Einsatznummer
03.11.2018 18:26:13 - Einsatzbeginn
03.11.2018 18:26:13 - Straße ###########
03.11.2018 18:26:13 - Segment #############
03.11.2018 18:26:13 - Ort #################
03.11.2018 18:26:13 - Koordinaten ######## / #########
03.11.2018 18:26:13 - Objekt
03.11.2018 18:26:13 - Zusatzinformation10
03.11.2018 18:26:14 - Zusatzinformation9
03.11.2018 18:26:14 - Sachverhalt #########
03.11.2018 18:26:14 - Einsatzstichwort RD 2
03.11.2018 18:26:14 - Zusatzinformation1 #########
PATIENT
###### Name: ##### Vorname: #######
ZIELORT
STRAßE:
ORTSTEIL/ORT:
OBJEKT:
STATION:
03.11.2018 18:26:14 - AAO
#######################
#######################
#######################
03.11.2018 18:26:14 - AutoParser beendet ********************************************************
03.11.2018 18:26:14 - Externes Programm gestartet
03.11.2018 18:26:14 - Drucker 1: Identifier nicht vorhanden - Datei wird nicht gedruckt
03.11.2018 18:26:14 - Drucker 2: Identifier vorhanden
03.11.2018 18:26:24 - Drucker 2: Originaldatei (PDF) gedruckt - 1
03.11.2018 18:26:24 - Vorgang 20182603062611 beendet
Versuche mal anstatt dem UNC-Pfad, dass du ein Laufwerk verbindest und darüber zugreifst:
\\Fritz-nas\fritz.nas\FRITZ\faxbox\03.11.18_17.23_Telefax.0814122815.pdf
Z:\03.11.18_17.23_Telefax.0814122815.pdf
EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung
Versuche mal anstatt dem UNC-Pfad, dass du ein Laufwerk verbindest und darüber zugreifst:
\\Fritz-nas\fritz.nas\FRITZ\faxbox\03.11.18_17.23_Telefax.0814122815.pdf
Z:\03.11.18_17.23_Telefax.0814122815.pdf
EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung
Bisher hatte ich mit meinem Pfad (ist doch prinzipiell auch ein Netzlaufwerk) auch nie Probleme, ging immer alles reibungslos.
Aber ich versuch gerne deinen Weg mal. Danke dir derweil schon mal. Hoffe ich bekomm die EM-Maschinerie so wieder zum laufen!
Beim Ersten Versuch wurde das pdf nicht verabeitet:
03.11.2018 17:23:42 - GhostScript:
GPL Ghostscript 9.22 (2017-10-04)
Copyright (C) 2017 Artifex Software, Inc. All rights reserved.
This software comes with NO WARRANTY: see the file PUBLIC for details.
03.11.2018 17:23:42 - PDF verarbeitet
Beim zweiten Versuch schon:
GPL Ghostscript 9.22 (2017-10-04)
Copyright (C) 2017 Artifex Software, Inc. All rights reserved.
This software comes with NO WARRANTY: see the file PUBLIC for details.
Processing pages 1 through 1.
Page 1
03.11.2018 18:26:13 - PDF verarbeitet
Das bedeutet, GhostScript hat die PDF aus irgendeinem Grund nicht verarbeitet. Ich schick dir ne neue Version zum Testen, gib mir bitte schnellstmöglich Rückmeldung ob es funktioniert oder nicht, danach werde ich sie für alle veröffentlichen.
*********UPDATE********* V1.0.34
-> Bugfixing Filesystemwatcher
-> Bugfixing my.settings
-> Erweitertes Fehlerhandling
-> Fehler beim Erstmaligen Start nach Update behoben
@patrick.samardzija
@Markus82
Bitte testen, danke!
Werde ich am Freitag testen.