EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung

  • Hallo,

    wir haben nun jahrelang ein Fax-PDF ausgewertet was auch einwandfrei funktioniert.

    Nun sendet uns die Leistelle eine E-Mail mit einem PDF im Anhang. Anders als bei dem in PDF konvertierte Fax, ist das PDF in der Mail in Text-Form - sprich ich kann den Tex innerhalb des PDFs markieren.

    Ich möchte nun erreichen dass ich das Fax nicht erst durch die OCR-Erkennung schleußen muss, sondern direkt auswerten kann. Kann mir jemand sagen, welche Parameter ich hier im tesseract bzw. ghostscript setzen muss dass das funktioniert?? Wenn ich es richtig interpretiere macht das Ghostscript ja erst ein Tiff aus dem PDF...

  • Servus Admin_FFW Rock,

    diese Problem besteht seit etwa Mitte 2020. (siehe auch hier im Forum)

    Ich glaube die letzte funktionierende Firmware bei der FritzBox war die 7.12.

    Leider gibt es soweit mir bekannt auch nach wie vor keine Lösung dafür. Ausser den Einsatz von Zusatzprogrammen.

    mit Batch Datei funktioniert es wieder.

    Danke an alle

  • Wie genau, wenn man fragen darf? 8)

    Oder meinst du die Lösung bzw. das Script von „DeQua“?

    sorry für die späte Rückmeldung. Ja, mit dem Script von DeQua. Läuft im Hintergrund. Man muss lediglich die Pfade ändern. Batch Datei am besten in Autostart reinkopieren.

    hab es noch erweitert, damit man über einen WLAN Schalter den Monitor einschalten kann.

  • Hallo,

    gibt es in diesem Tool die möglichkeit in der Textdatei zeilen mit bestimmten werten zu löschen oder ist es möglich sowas noch einzufügen?

    viele Grüße

  • Hallo Community,

    wir haben seit einiger Zeit Probleme mit der Auswertung. Der EMC kann die PDF aus dem Fritzboxordner nicht mehr verarbeiten da die Fehlermeldung zu viele gleichzeitige Änderungen im Ordner erscheint.

    Das Problem liegt daran das die Fritzbox seit dem letzten Update, eine Datei erstellt und zwar die .FAXMETA.xml .

    Hat hier jemand einen Lösungsvorschlag. Wir kommen momentan leider nicht weiter mit dem Fehler.

    Besten Dank im Vorraus.

    FF Bogenberg

  • ne, bin aber am überlegen den Code ggf. Im Sommer mit in den EM direkt zu übernehmen. Je nachdem was da so los ist.

    Sven bist du denn schon weiter gekommen was die direkte Faxauswertung (inkl. OCR) durch dem Einsatzmonitor angeht? :)

  • DeQua vielen Dank für das Skript. Ist Top. Meinst es wäre großer Aufwand noch hinzuzufügen dass die Quelldatei im Quellordner gelöscht wird?

  • DeQua vielen Dank für das Skript. Ist Top. Meinst es wäre großer Aufwand noch hinzuzufügen dass die Quelldatei im Quellordner gelöscht wird?

    Ich habe mir dafür ein kleines Programm in AutoIt geschrieben. Dieses verschiebt die Dateien sodass sich diese nicht mehr im Quell-Ordner befinden. Wenn ich @home bin, kann ich es ja auch mal hochstellen. Hatte es zuerst auch mit Dropit versucht aber das Programm hat hohe CPU-Last erzeugt und ist nach einem Tag immer abgestürzt.

    Das Script von DeQua kenn ich nicht aber sollte sich bestimmt auch einfach anpassen lassen. Hast du evtl. ne Post Nr.?

    EDIT:

    Habe das Script gefunden, mir angeguckt und umgeschrieben. Es macht exakt das gleiche wie das Original (nur kopieren wenn nicht vorhanden, nur *.pdf Dateien, schon existierende verbleiben im Quellordner sowie die Protokollierung der Vorgänge), nur das es nach dem erfolgreichen Kopiervorgang die Datei im Quellordner löscht.

    Ich hoffe ich konnte dir helfen. Und wie immer, vorher bitte testen, denn ich nutzt, wie gesagt, solch ein Script nicht.

    EDIT #2:

    Es hat nun doch etwas länger gedauert, da ich das Programm noch etwas anpassen wollte, damit es verständlicher wird und man es ohne Hintergrundwissen benutzen kann. Aufgrund von Zeitmangel kam ich erst jetzt dazu.

    Das Programm macht hier auch nicht mehr als alle hier schon geposteten Skripte oder Tools. Es ist einfach auf das nötigste heruntergebrochen und war meine Lösung auf das FritzBox Problem. Im Gegensatz zu den Skripten, muss kein Fenster offen gelassen werden, was ggf. in den Vordergrund kommen könnte. Es gibt keinen Mucks von sich, sobald es eingerichtet wurde und läuft.

    Das Programm lässt sich über die Taskleiste/ -bar auch nicht einfach beenden, sodass es nicht aus Versehen geschlossen werden kann. Einzig über den Taskmanager kann man es "beenden".

    Der erste Start ruft die Konfiguration auf und man kann alles einstellen. Danach verschwindet es in den Hintergrund.

    Unter Umständen schlagen ein paar Virenscanner aus was aber einzig an der Scriptsprache liegt. Sie wird halt gerne auch für Bots benutzt:

    VirusTotal - File - e9da7f1a0fd21aac6b617064ae6e65acc044efea6c0b2d9d0fce629ce3648017

    Der Quellcode liegt bei, sodass sich jeder selber davon überzeugen kann.

  • Vielen Dank werd ich mit mal ansehen :)

  • Hallo Kameraden,

    bin gerade dabei die Auswertung des Einsatzfaxes welches wir per Mail bekommen im EM-OCR umzusetzen PDF-Datei wird auch in TXT umgewandelt,

    nur ist das Ergebnis nicht zu frieden stellend. Brauche da unbedingt Hilfe. Habe die Original Einsatzmeldung und die daraus erstellte TXT beigefügt.

  • Hallo Kameraden,

    bin gerade dabei die Auswertung des Einsatzfaxes welches wir per Mail bekommen im EM-OCR umzusetzen PDF-Datei wird auch in TXT umgewandelt,

    nur ist das Ergebnis nicht zu frieden stellend. Brauche da unbedingt Hilfe. Habe die Original Einsatzmeldung und die daraus erstellte TXT beigefügt.

    Intreressant das es in dieser Leitstelle doch mit Alarmfaxe via Email funktioniert.

    Da unsere Ortswehr auch aus Brandenburg ist. Haben Wir das selben FAX Aufbau.

    Un die Qualität bei euch ist perfekt. Du musst jetzt mit OCR arbeiten.

    Schau mal Seite 1. Wir arbeiten auch mit der neusten Version von Tesseract.Das geht dann schon relativ gut.

  • Hey,
    gibt es eine Möglichkeit den EM-OCR in den Autostart zu nehmen und ihn gleich starten zu lassen, ohne "Klick" ?

    Falls der Rechner sich doch mal neustartet, dass das Tool gleich wieder startet?

    (evtl wurde das irgendwo hier schon mit erfragt?)

    Vielen Dank

  • Hi Chondremos, geht das ganze auch ohne Löschen des Originals, also nur mit Kopieren?

    Gruß Zwibl

  • Hi Chondremos, geht das ganze auch ohne Löschen des Originals, also nur mit Kopieren?

    Gruß Zwibl

    Hi,

    theoretisch klappt das schon, nur fehlt dem Programm noch eine entsprechende Logik, um mit schon kopierten Dateien umgehen zu können. Jetzt reagiert es sofort auf eine neue Datei und würde dann in einer Endlosschleife enden, würde diese nur kopiert werden.

    Man könnte einen Flag in den NTFS-Stream der Datei schreiben, sodass die Datei übersprungen wird, was dann aber auch ein NTFS-Dateisystem benötigen würde, sofern man keine Listen pflegen möchte. Oder man hängt ein pre/suffix an die Datei.

    Du kannst dem EM-OCR aber auch sagen, dass er die Originale behalten soll. Dieser legt diese dann mit ab. Wie du im Screenshot vom Stefan siehst, kannst du hier eine Option für aktivieren. Sollte dir das nicht reichen, kann ich das gerne noch einmal umprogrammieren.

    PS:
    Hilfreich wäre auch zu wissen, was du genau vor hast, damit man nicht aneinander vorbeiredet :)

    2 Mal editiert, zuletzt von Chondremos (20. Juni 2022 um 10:04)

  • Hi,

    theoretisch klappt das schon, nur fehlt dem Programm noch eine entsprechende Logik, um mit schon kopierten Dateien umgehen zu können. Jetzt reagiert es sofort auf eine neue Datei und würde dann in einer Endlosschleife enden, würde diese nur kopiert werden.

    Man könnte einen Flag in den NTFS-Stream der Datei schreiben, sodass die Datei übersprungen wird, was dann aber auch ein NTFS-Dateisystem benötigen würde, sofern man keine Listen pflegen möchte. Oder man hängt ein pre/suffix an die Datei.

    Du kannst dem EM-OCR aber auch sagen, dass er die Originale behalten soll. Dieser legt diese dann mit ab. Wie du im Screenshot vom Stefan siehst, kannst du hier eine Option für aktivieren. Sollte dir das nicht reichen, kann ich das gerne noch einmal umprogrammieren.

    PS:
    Hilfreich wäre auch zu wissen, was du genau vor hast, damit man nicht aneinander vorbeiredet :)

    Vielen Dank für deine Bemühungen, aber ich glaube mein Problem ist gelöst. Ich versende das Fax per Mail direkt an die Kdt. aus der Fritzbox raus. Ich dachte, dass das Kopieren so schnell geht, da keine Mails mehr ankamen. Der Übeltäter war aber ein Googlekonto als Absender in der FB, das nicht mehr funktionierte. Das sollte jetzt laufen. Hilfreich wäre bei deinem Programm vielleicht eine kleine Pause von ein paar Sekunden vor dem Verschieben neuer Dateien, dann sollte es endgültig keine Probleme mit der Mail geben. Aber trotzdem vielen Dank an alle, die die Sachen programmieren und uns zur Verfügung stellen!

    Gruß Thomas

  • Hallo,

    wir haben das Programm EM-OCR bei uns installiert.

    Jedoch funktioniert die PDF Auswertung noch nicht nzw. kann die Verarbeitung aufgrund des Dateizugriffes nicht gestartet werden.

    Hat dazu jemand eine Lösung?

  • Wie es scheint, gibt es wohl ein kleines Problem mit dem EM-OCR unter Windows 11 (22H2 - 22621.1194). Mit Windows 11 22H1 funktionierte dies noch. Bei der Auswahl der Ordnerpfade wird der Dateibaum nicht mehr angezeigt bzw. nur noch der Desktop:

    Sollte jemand dies auch haben, dann kann er sich vorerst damit behelfen, indem die Konfigurationsdatei von Hand angepasst wird - ohne die GUI. Diese befindet sich in: %LOCALAPPDATA%\EM_OCR\[...]\user.config

    Update:
    Auf einem anderen Testsystem scheint es keine Probleme mit dem Ordnerbaum zu geben. Ist dann wohl doch eher ein lokales Problem...

    Einmal editiert, zuletzt von Chondremos (3. Februar 2023 um 15:22)