EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung

Fisch2005

Hallo,

wir haben nun jahrelang ein Fax-PDF ausgewertet was auch einwandfrei funktioniert.

Nun sendet uns die Leistelle eine E-Mail mit einem PDF im Anhang. Anders als bei dem in PDF konvertierte Fax, ist das PDF in der Mail in Text-Form - sprich ich kann den Tex innerhalb des PDFs markieren.

Ich möchte nun erreichen dass ich das Fax nicht erst durch die OCR-Erkennung schleußen muss, sondern direkt auswerten kann. Kann mir jemand sagen, welche Parameter ich hier im tesseract bzw. ghostscript setzen muss dass das funktioniert?? Wenn ich es richtig interpretiere macht das Ghostscript ja erst ein Tiff aus dem PDF...

Admin_FFW-Rock

Zitat von Christian_FFW

Servus Admin_FFW Rock,
diese Problem besteht seit etwa Mitte 2020. (siehe auch hier im Forum)
Ich glaube die letzte funktionierende Firmware bei der FritzBox war die 7.12.
Leider gibt es soweit mir bekannt auch nach wie vor keine Lösung dafür. Ausser den Einsatz von Zusatzprogrammen.

mit Batch Datei funktioniert es wieder.

Danke an alle

Christian_FFW

Zitat von Admin_FFW-Rock

mit Batch Datei funktioniert es wieder.
Danke an alle

Wie genau, wenn man fragen darf?

Oder meinst du die Lösung bzw. das Script von „DeQua“?

Admin_FFW-Rock

Zitat von Christian_FFW

Wie genau, wenn man fragen darf?
Oder meinst du die Lösung bzw. das Script von „DeQua“?

sorry für die späte Rückmeldung. Ja, mit dem Script von DeQua. Läuft im Hintergrund. Man muss lediglich die Pfade ändern. Batch Datei am besten in Autostart reinkopieren.

hab es noch erweitert, damit man über einen WLAN Schalter den Monitor einschalten kann.

tragge

Hallo,

gibt es in diesem Tool die möglichkeit in der Textdatei zeilen mit bestimmten werten zu löschen oder ist es möglich sowas noch einzufügen?

viele Grüße

FF Bogenberg

Hallo Community,

wir haben seit einiger Zeit Probleme mit der Auswertung. Der EMC kann die PDF aus dem Fritzboxordner nicht mehr verarbeiten da die Fehlermeldung zu viele gleichzeitige Änderungen im Ordner erscheint.

Das Problem liegt daran das die Fritzbox seit dem letzten Update, eine Datei erstellt und zwar die .FAXMETA.xml .

Hat hier jemand einen Lösungsvorschlag. Wir kommen momentan leider nicht weiter mit dem Fehler.

Besten Dank im Vorraus.

FF Bogenberg

mwo

Zitat von Sven

ne, bin aber am überlegen den Code ggf. Im Sommer mit in den EM direkt zu übernehmen. Je nachdem was da so los ist.

Sven bist du denn schon weiter gekommen was die direkte Faxauswertung (inkl. OCR) durch dem Einsatzmonitor angeht?

mwo

Zitat von DeQua

Hallo zusammen,
für alle die mit der Umstellung auf SMB3 der Fritzbox Probleme haben und mit DropIt o.ä. extra Programmen nicht glücklich geworden sind, so wie ich (u.a. Unzuverlässig, hohe CPU-Last, ...), hätte ich einen schlanken Behelfslösung bis es im EM-OCR oder EM gefixt wird.
Ich hab für uns ein Batch-Skript erstellt, dass den Fritzbox-Faxordner auf ein Lokales Verzeichnis "synchronisiert" und den EM-OCR auf das lokale Verzeichnis gelegt.
Skript siehe Anhang, Funktionen:
Es werden nur Datein kopiert die im Ziel noch nicht vorhanden sind, bereits vorhanden Datein werden nicht überschrieben.
Bei Kopieraktionen wird in ein Log-File geschrieben.
Aktion wird alle 5 Sekunden wiederholt.
Pfade zu Quelle, Ziel, Log und Zeit sind anpassbar.
Funktioniert bei uns seit einigen Wochen sehr gut.
Vl. hilft es ja dem Einen oder Anderen.
Viele Grüße
Andreas

Alles anzeigen

DeQua vielen Dank für das Skript. Ist Top. Meinst es wäre großer Aufwand noch hinzuzufügen dass die Quelldatei im Quellordner gelöscht wird?

Chondremos

Zitat von mwo

DeQua vielen Dank für das Skript. Ist Top. Meinst es wäre großer Aufwand noch hinzuzufügen dass die Quelldatei im Quellordner gelöscht wird?

Ich habe mir dafür ein kleines Programm in AutoIt geschrieben. Dieses verschiebt die Dateien sodass sich diese nicht mehr im Quell-Ordner befinden. Wenn ich @home bin, kann ich es ja auch mal hochstellen. Hatte es zuerst auch mit Dropit versucht aber das Programm hat hohe CPU-Last erzeugt und ist nach einem Tag immer abgestürzt.

Das Script von DeQua kenn ich nicht aber sollte sich bestimmt auch einfach anpassen lassen. Hast du evtl. ne Post Nr.?

EDIT:

Habe das Script gefunden, mir angeguckt und umgeschrieben. Es macht exakt das gleiche wie das Original (nur kopieren wenn nicht vorhanden, nur *.pdf Dateien, schon existierende verbleiben im Quellordner sowie die Protokollierung der Vorgänge), nur das es nach dem erfolgreichen Kopiervorgang die Datei im Quellordner löscht.

Ich hoffe ich konnte dir helfen. Und wie immer, vorher bitte testen, denn ich nutzt, wie gesagt, solch ein Script nicht.

EDIT #2:

Es hat nun doch etwas länger gedauert, da ich das Programm noch etwas anpassen wollte, damit es verständlicher wird und man es ohne Hintergrundwissen benutzen kann. Aufgrund von Zeitmangel kam ich erst jetzt dazu.

Das Programm macht hier auch nicht mehr als alle hier schon geposteten Skripte oder Tools. Es ist einfach auf das nötigste heruntergebrochen und war meine Lösung auf das FritzBox Problem. Im Gegensatz zu den Skripten, muss kein Fenster offen gelassen werden, was ggf. in den Vordergrund kommen könnte. Es gibt keinen Mucks von sich, sobald es eingerichtet wurde und läuft.

Das Programm lässt sich über die Taskleiste/ -bar auch nicht einfach beenden, sodass es nicht aus Versehen geschlossen werden kann. Einzig über den Taskmanager kann man es "beenden".

Der erste Start ruft die Konfiguration auf und man kann alles einstellen. Danach verschwindet es in den Hintergrund.

Unter Umständen schlagen ein paar Virenscanner aus was aber einzig an der Scriptsprache liegt. Sie wird halt gerne auch für Bots benutzt:

VirusTotal - File - e9da7f1a0fd21aac6b617064ae6e65acc044efea6c0b2d9d0fce629ce3648017

Der Quellcode liegt bei, sodass sich jeder selber davon überzeugen kann.

mwo

Zitat von Chondremos

Ich habe mir dafür ein kleines Programm in AutoIt geschrieben. Dieses verschiebt die Dateien sodass sich diese nicht mehr im Quell-Ordner befinden. Wenn ich @home bin, kann ich es ja auch mal hochstellen. Hatte es zuerst auch mit Dropit versucht aber das Programm hat hohe CPU-Last erzeugt und ist nach einem Tag immer abgestürzt.
Das Script von DeQua kenn ich nicht aber sollte sich bestimmt auch einfach anpassen lassen. Hast du evtl. ne Post Nr.?
EDIT:
Habe das Script gefunden, mir angeguckt und umgeschrieben. Es macht exakt das gleiche wie das Original (nur kopieren wenn nicht vorhanden, nur *.pdf Dateien, schon existierende verbleiben im Quellordner sowie die Protokollierung der Vorgänge), nur das es nach dem erfolgreichen Kopiervorgang die Datei im Quellordner löscht.
Ich hoffe ich konnte dir helfen. Und wie immer, vorher bitte testen, denn ich nutzt, wie gesagt, solch ein Script nicht.
EDIT #2:
Es hat nun doch etwas länger gedauert, da ich das Programm noch etwas anpassen wollte, damit es verständlicher wird und man es ohne Hintergrundwissen benutzen kann. Aufgrund von Zeitmangel kam ich erst jetzt dazu.
Das Programm macht hier auch nicht mehr als alle hier schon geposteten Skripte oder Tools. Es ist einfach auf das nötigste heruntergebrochen und war meine Lösung auf das FritzBox Problem. Im Gegensatz zu den Skripten, muss kein Fenster offen gelassen werden, was ggf. in den Vordergrund kommen könnte. Es gibt keinen Mucks von sich, sobald es eingerichtet wurde und läuft.
Das Programm lässt sich über die Taskleiste/ -bar auch nicht einfach beenden, sodass es nicht aus Versehen geschlossen werden kann. Einzig über den Taskmanager kann man es "beenden".
Der erste Start ruft die Konfiguration auf und man kann alles einstellen. Danach verschwindet es in den Hintergrund.
Unter Umständen schlagen ein paar Virenscanner aus was aber einzig an der Scriptsprache liegt. Sie wird halt gerne auch für Bots benutzt:
VirusTotal - File - e9da7f1a0fd21aac6b617064ae6e65acc044efea6c0b2d9d0fce629ce3648017
Der Quellcode liegt bei, sodass sich jeder selber davon überzeugen kann.

Alles anzeigen

Vielen Dank werd ich mit mal ansehen

micjoe

Hallo Kameraden,

bin gerade dabei die Auswertung des Einsatzfaxes welches wir per Mail bekommen im EM-OCR umzusetzen PDF-Datei wird auch in TXT umgewandelt,

nur ist das Ergebnis nicht zu frieden stellend. Brauche da unbedingt Hilfe. Habe die Original Einsatzmeldung und die daraus erstellte TXT beigefügt.

bosst

Zitat von micjoe

Hallo Kameraden,
bin gerade dabei die Auswertung des Einsatzfaxes welches wir per Mail bekommen im EM-OCR umzusetzen PDF-Datei wird auch in TXT umgewandelt,
nur ist das Ergebnis nicht zu frieden stellend. Brauche da unbedingt Hilfe. Habe die Original Einsatzmeldung und die daraus erstellte TXT beigefügt.

Intreressant das es in dieser Leitstelle doch mit Alarmfaxe via Email funktioniert.

Da unsere Ortswehr auch aus Brandenburg ist. Haben Wir das selben FAX Aufbau.

Un die Qualität bei euch ist perfekt. Du musst jetzt mit OCR arbeiten.

Schau mal Seite 1. Wir arbeiten auch mit der neusten Version von Tesseract.Das geht dann schon relativ gut.

Tony

Hey,
gibt es eine Möglichkeit den EM-OCR in den Autostart zu nehmen und ihn gleich starten zu lassen, ohne "Klick" ?

Falls der Rechner sich doch mal neustartet, dass das Tool gleich wieder startet?

(evtl wurde das irgendwo hier schon mit erfragt?)

Vielen Dank

Stefan Seider

Ja, einfach anhaken:

Zwibl

Zitat von Chondremos

Ich habe mir dafür ein kleines Programm in AutoIt geschrieben. Dieses verschiebt die Dateien sodass sich diese nicht mehr im Quell-Ordner befinden. Wenn ich @home bin, kann ich es ja auch mal hochstellen. Hatte es zuerst auch mit Dropit versucht aber das Programm hat hohe CPU-Last erzeugt und ist nach einem Tag immer abgestürzt.
Das Script von DeQua kenn ich nicht aber sollte sich bestimmt auch einfach anpassen lassen. Hast du evtl. ne Post Nr.?
EDIT:
Habe das Script gefunden, mir angeguckt und umgeschrieben. Es macht exakt das gleiche wie das Original (nur kopieren wenn nicht vorhanden, nur *.pdf Dateien, schon existierende verbleiben im Quellordner sowie die Protokollierung der Vorgänge), nur das es nach dem erfolgreichen Kopiervorgang die Datei im Quellordner löscht.
Ich hoffe ich konnte dir helfen. Und wie immer, vorher bitte testen, denn ich nutzt, wie gesagt, solch ein Script nicht.
EDIT #2:
Es hat nun doch etwas länger gedauert, da ich das Programm noch etwas anpassen wollte, damit es verständlicher wird und man es ohne Hintergrundwissen benutzen kann. Aufgrund von Zeitmangel kam ich erst jetzt dazu.
Das Programm macht hier auch nicht mehr als alle hier schon geposteten Skripte oder Tools. Es ist einfach auf das nötigste heruntergebrochen und war meine Lösung auf das FritzBox Problem. Im Gegensatz zu den Skripten, muss kein Fenster offen gelassen werden, was ggf. in den Vordergrund kommen könnte. Es gibt keinen Mucks von sich, sobald es eingerichtet wurde und läuft.
Das Programm lässt sich über die Taskleiste/ -bar auch nicht einfach beenden, sodass es nicht aus Versehen geschlossen werden kann. Einzig über den Taskmanager kann man es "beenden".
Der erste Start ruft die Konfiguration auf und man kann alles einstellen. Danach verschwindet es in den Hintergrund.
Unter Umständen schlagen ein paar Virenscanner aus was aber einzig an der Scriptsprache liegt. Sie wird halt gerne auch für Bots benutzt:
VirusTotal - File - e9da7f1a0fd21aac6b617064ae6e65acc044efea6c0b2d9d0fce629ce3648017
Der Quellcode liegt bei, sodass sich jeder selber davon überzeugen kann.

Alles anzeigen

Hi Chondremos, geht das ganze auch ohne Löschen des Originals, also nur mit Kopieren?

Gruß Zwibl

Chondremos

Zitat von Zwibl

Hi Chondremos, geht das ganze auch ohne Löschen des Originals, also nur mit Kopieren?
Gruß Zwibl

Hi,

theoretisch klappt das schon, nur fehlt dem Programm noch eine entsprechende Logik, um mit schon kopierten Dateien umgehen zu können. Jetzt reagiert es sofort auf eine neue Datei und würde dann in einer Endlosschleife enden, würde diese nur kopiert werden.

Man könnte einen Flag in den NTFS-Stream der Datei schreiben, sodass die Datei übersprungen wird, was dann aber auch ein NTFS-Dateisystem benötigen würde, sofern man keine Listen pflegen möchte. Oder man hängt ein pre/suffix an die Datei.

Du kannst dem EM-OCR aber auch sagen, dass er die Originale behalten soll. Dieser legt diese dann mit ab. Wie du im Screenshot vom Stefan siehst, kannst du hier eine Option für aktivieren. Sollte dir das nicht reichen, kann ich das gerne noch einmal umprogrammieren.

PS:
Hilfreich wäre auch zu wissen, was du genau vor hast, damit man nicht aneinander vorbeiredet

Zwibl

Zitat von Chondremos

Hi,
theoretisch klappt das schon, nur fehlt dem Programm noch eine entsprechende Logik, um mit schon kopierten Dateien umgehen zu können. Jetzt reagiert es sofort auf eine neue Datei und würde dann in einer Endlosschleife enden, würde diese nur kopiert werden.
Man könnte einen Flag in den NTFS-Stream der Datei schreiben, sodass die Datei übersprungen wird, was dann aber auch ein NTFS-Dateisystem benötigen würde, sofern man keine Listen pflegen möchte. Oder man hängt ein pre/suffix an die Datei.
Du kannst dem EM-OCR aber auch sagen, dass er die Originale behalten soll. Dieser legt diese dann mit ab. Wie du im Screenshot vom Stefan siehst, kannst du hier eine Option für aktivieren. Sollte dir das nicht reichen, kann ich das gerne noch einmal umprogrammieren.
PS:
Hilfreich wäre auch zu wissen, was du genau vor hast, damit man nicht aneinander vorbeiredet

Vielen Dank für deine Bemühungen, aber ich glaube mein Problem ist gelöst. Ich versende das Fax per Mail direkt an die Kdt. aus der Fritzbox raus. Ich dachte, dass das Kopieren so schnell geht, da keine Mails mehr ankamen. Der Übeltäter war aber ein Googlekonto als Absender in der FB, das nicht mehr funktionierte. Das sollte jetzt laufen. Hilfreich wäre bei deinem Programm vielleicht eine kleine Pause von ein paar Sekunden vor dem Verschieben neuer Dateien, dann sollte es endgültig keine Probleme mit der Mail geben. Aber trotzdem vielen Dank an alle, die die Sachen programmieren und uns zur Verfügung stellen!

Gruß Thomas

Feuerwehr-Gebirge

Hallo,

wir haben das Programm EM-OCR bei uns installiert.

Jedoch funktioniert die PDF Auswertung noch nicht nzw. kann die Verarbeitung aufgrund des Dateizugriffes nicht gestartet werden.

Hat dazu jemand eine Lösung?

Code

18.11.2022 11:14:45 - Programmstart EM-OCR V2.04
18.11.2022 11:15:40 - Service starten...
18.11.2022 11:15:40 - Service gestartet
18.11.2022 11:16:17 - Datei C:\Users\Win10\Desktop\Einsatzmonitor\Eingang\1.pdf wurde erstellt
18.11.2022 11:16:19 - Warten auf Dateizugriff...
18.11.2022 11:16:19 - Warten auf Dateizugriff...
18.11.2022 11:16:20 - Warten auf Dateizugriff...
18.11.2022 11:16:20 - Warten auf Dateizugriff...
18.11.2022 11:16:21 - Warten auf Dateizugriff...
18.11.2022 11:16:21 - Warten auf Dateizugriff...
18.11.2022 11:16:22 - Warten auf Dateizugriff...
18.11.2022 11:16:22 - Warten auf Dateizugriff...
18.11.2022 11:16:23 - Warten auf Dateizugriff...
18.11.2022 11:16:23 - Warten auf Dateizugriff...
18.11.2022 11:16:24 - Warten auf Dateizugriff...

Alles anzeigen

Chondremos

versuch es erst einmal mit der aktuellsten Version: EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung

Wenn ein Virenscanner vorhanden ist, hast du das Verzeichnis von der Überprüfung ausgenommen?

Kannst du die PDF-Datei uns zur Verfügung stellen?

Chondremos

Wie es scheint, gibt es wohl ein kleines Problem mit dem EM-OCR unter Windows 11 (22H2 - 22621.1194). Mit Windows 11 22H1 funktionierte dies noch. Bei der Auswahl der Ordnerpfade wird der Dateibaum nicht mehr angezeigt bzw. nur noch der Desktop:

Sollte jemand dies auch haben, dann kann er sich vorerst damit behelfen, indem die Konfigurationsdatei von Hand angepasst wird - ohne die GUI. Diese befindet sich in: %LOCALAPPDATA%\EM_OCR\[...]\user.config

Update:
Auf einem anderen Testsystem scheint es keine Probleme mit dem Ordnerbaum zu geben. Ist dann wohl doch eher ein lokales Problem...

Tags