EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung

  • Installiert habe ich Tesseract auf meiner D Festplatte.

    bei den umgebungsvariablen steht nichts von tesseract drin

  • Bin mir nicht sicher, aber ich glaube dass deine Verlinkung zur Alarm.traineddata falsch ist.

    Und deshalb auch die Fehlermeldung beim @patrick.samardzija kommt.

    Ich kann sie z.B. nicht als Datei runterladen (evtl. bin ich auch nur zu blöd), und Ziel speichern bringt nicht die gewünschte Datei...

    Kannst du das bitte mal überprüfen.

  • Bin mir nicht sicher, aber ich glaube dass deine Verlinkung zur Alarm.traineddata falsch ist.

    Und deshalb auch die Fehlermeldung beim @patrick.samardzija kommt.

    Ich kann sie z.B. nicht als Datei runterladen (evtl. bin ich auch nur zu blöd), und Ziel speichern bringt nicht die gewünschte Datei...

    Kannst du das bitte mal überprüfen.

    Link speichern funktioniert nicht, weil hier ein referrer dazwischen hängt. Wenn man die Datei mitm Edge laden will, wird sie als Text angezeigt. Probier nen anderen Browser. Mit Chrome hats bei mir funktioniert.

  • Dann installier es doch bitte auf dem C Laufwerk zum Test

    Also so hat es funktioniert, warum auch immer.


    Desweiteren funktioniert das mit der Datei erkennung funktioniert bei mir noch immer nicht richtig. Ich werde heute Mittag den Log nochmals posten.

    • Offizieller Beitrag

    Ich muss 2 Filesystemwatcher kombinieren, damit auch Dateien die während der Erstellung eine andere Dateiendung haben (z.B. tif_/tif) und gleichzeitig mehrere Sekunden zum vollständigen schreiben benötigen, erkannt (und nur 1 x erkannt) werden. Das mach ich mit einem FSW auf OnCreated und einem 2. FSW auf OnRenamed.

    Ist aber noch etwas tricky, vorallem den richtigen NotificationFilter rauszukriegen und die beiden FSW zur richtigen Zeit gegeneinander zu sperren...=O

    • Offizieller Beitrag

    *********UPDATE********* V1.0.32

    -> Änderungen am Filesystemwatcher durchgeführt.

    -> Bugfixing Netzwerklaufwerk und verzögerte Dateierstellung

    @patrick.samardzija

    Maxl

    Bitte testen

  • Also bei mir funktioniert es nicht.

    Mein Programm welches die FAXen(?) auf dem PC speichert, bringt nun eine Fehlermeldung das er nicht genug Speicherplatz habe.

    Sobald ich den Ordner wechsle, welcher nicht der EM-OCR Input Ordner ist, kann ich die FAXen(?) wieder speichern.

  • Regressionstest für die neue Tesseract-/Ghostscript-/EM-OCR-Version bestanden:

    30 Alarmfaxe, in einem Abstand von 60 Sekunden pro Fax, in den EM-OCR-Eingangsordner (FritzBox Netzlaufwerk) kopiert.

  • Meine Tests waren vielversprechend, aber der erste Einsatz wurde leider wieder nicht ausgewertet.

    Fehler entsteht weiterhin in Verbindung mit Ghostscript.

    Hoffe du findest bald eine potentielle Lösung dafür.

    Wenn das Fax über die interne Faxfunktion der Fritzbox kommt, scheint es nicht zu funktionieren.


    03.11.2018 17:23:41 - Datei\\Fritz-nas\fritz.nas\FRITZ\faxbox\03.11.18_17.23_Telefax.0814122815.pdf wurde erstellt

    03.11.2018 17:23:41 - Vorgang 20182303052341 gestartet

    03.11.2018 17:23:42 - GhostScript:

    GPL Ghostscript 9.22 (2017-10-04)

    Copyright (C) 2017 Artifex Software, Inc. All rights reserved.

    This software comes with NO WARRANTY: see the file PUBLIC for details.

    03.11.2018 17:23:42 - PDF verarbeitet

    03.11.2018 17:23:42 - Tesseract Retry 1

    03.11.2018 17:23:43 - Tesseract Retry 2

    03.11.2018 17:23:44 - Tesseract Retry 3

    03.11.2018 17:23:45 - Tesseract:

    Tesseract Open Source OCR Engine v3.02 with Leptonica

    Cannot open input file: C:\Users\PC\AppData\Local\Temp\EM-OCR\20182303052341.tif
    03.11.2018 17:23:45 - TIF verarbeitet

    03.11.2018 17:23:45 - FEHLER - Datei nicht lesbar

    03.11.2018 17:23:45 - Die Datei C:\Users\PC\AppData\Local\Temp\EM-OCR\20182303052341.tif konnte nicht gefunden werden.

    03.11.2018 17:23:45 - Vorgang 20182303052341 beendet


    Wenn ich die Fax-Datei (pdf) aus dem internen Fax-Ordner nehme und wieder hinzufüge, dann kann der EM-OCR es korrekt auswerten

    03.11.2018 18:26:09 - Datei\\Fritz-nas\fritz.nas\FRITZ\faxbox\03.11.18_17.23_Telefax.0814122815.pdf wurde erstellt

    03.11.2018 18:26:09 - Warten bis Input-Datei vollständig geschrieben wurde...

    03.11.2018 18:26:11 - Vorgang 20182603062611 gestartet

    03.11.2018 18:26:13 - GhostScript:

    GPL Ghostscript 9.22 (2017-10-04)

    Copyright (C) 2017 Artifex Software, Inc. All rights reserved.

    This software comes with NO WARRANTY: see the file PUBLIC for details.

    Processing pages 1 through 1.

    Page 1

    03.11.2018 18:26:13 - PDF verarbeitet

    03.11.2018 18:26:13 - Tesseract:

    Tesseract Open Source OCR Engine v3.02 with Leptonica
    03.11.2018 18:26:13 - TIF verarbeitet

    03.11.2018 18:26:13 - Ausgabeeinstellung 1 angewendet

    03.11.2018 18:26:13 - Ausgabeeinstellung 2 angewendet

    03.11.2018 18:26:13 - Ausgabeeinstellung 3 angewendet

    03.11.2018 18:26:13 - Ausgabeeinstellung 4 angewendet

    03.11.2018 18:26:13 - AutoParser gestartet ******************************************************

    03.11.2018 18:26:13 - RIC RETTUNGSDIENST 03.11.2018 #########

    03.11.2018 18:26:13 - Einsatznummer

    03.11.2018 18:26:13 - Einsatzbeginn

    03.11.2018 18:26:13 - Straße ###########

    03.11.2018 18:26:13 - Segment #############

    03.11.2018 18:26:13 - Ort #################

    03.11.2018 18:26:13 - Koordinaten ######## / #########

    03.11.2018 18:26:13 - Objekt

    03.11.2018 18:26:13 - Zusatzinformation10

    03.11.2018 18:26:14 - Zusatzinformation9

    03.11.2018 18:26:14 - Sachverhalt #########

    03.11.2018 18:26:14 - Einsatzstichwort RD 2

    03.11.2018 18:26:14 - Zusatzinformation1 #########
    PATIENT
    ###### Name: ##### Vorname: #######
    ZIELORT
    STRAßE:
    ORTSTEIL/ORT:
    OBJEKT:
    STATION:

    03.11.2018 18:26:14 - AAO
    #######################

    #######################

    #######################
    03.11.2018 18:26:14 - AutoParser beendet ********************************************************

    03.11.2018 18:26:14 - Externes Programm gestartet

    03.11.2018 18:26:14 - Drucker 1: Identifier nicht vorhanden - Datei wird nicht gedruckt

    03.11.2018 18:26:14 - Drucker 2: Identifier vorhanden

    03.11.2018 18:26:24 - Drucker 2: Originaldatei (PDF) gedruckt - 1

    03.11.2018 18:26:24 - Vorgang 20182603062611 beendet

    Einmal editiert, zuletzt von Maxl (3. November 2018 um 18:33)

  • Versuche mal anstatt dem UNC-Pfad, dass du ein Laufwerk verbindest und darüber zugreifst:

    \\Fritz-nas\fritz.nas\FRITZ\faxbox\03.11.18_17.23_Telefax.0814122815.pdf

    Z:\03.11.18_17.23_Telefax.0814122815.pdf

    EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung

    Bisher hatte ich mit meinem Pfad (ist doch prinzipiell auch ein Netzlaufwerk) auch nie Probleme, ging immer alles reibungslos.

    Aber ich versuch gerne deinen Weg mal. Danke dir derweil schon mal. Hoffe ich bekomm die EM-Maschinerie so wieder zum laufen!

    • Offizieller Beitrag

    Beim Ersten Versuch wurde das pdf nicht verabeitet:


    03.11.2018 17:23:42 - GhostScript: GPL Ghostscript 9.22 (2017-10-04) Copyright (C) 2017 Artifex Software, Inc. All rights reserved. This software comes with NO WARRANTY: see the file PUBLIC for details. 03.11.2018 17:23:42 - PDF verarbeitet

    Beim zweiten Versuch schon:
    GPL Ghostscript 9.22 (2017-10-04) Copyright (C) 2017 Artifex Software, Inc. All rights reserved. This software comes with NO WARRANTY: see the file PUBLIC for details. Processing pages 1 through 1. Page 1 03.11.2018 18:26:13 - PDF verarbeitet

    Das bedeutet, GhostScript hat die PDF aus irgendeinem Grund nicht verarbeitet. Ich schick dir ne neue Version zum Testen, gib mir bitte schnellstmöglich Rückmeldung ob es funktioniert oder nicht, danach werde ich sie für alle veröffentlichen.

    • Offizieller Beitrag

    *********UPDATE********* V1.0.34

    -> Bugfixing Filesystemwatcher

    -> Bugfixing my.settings

    -> Erweitertes Fehlerhandling

    -> Fehler beim Erstmaligen Start nach Update behoben

    @patrick.samardzija

    Maxl

    @Markus82

    Bitte testen, danke!