EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung

Christian_FFW

Dein GhostScript Pfad ist zudem was Markus82 geschrieben hat auch nicht ganz korrekt.

Du musst in deinem Fall die ...gswin32c.exe verwenden

Florian Holzhauen

danke habs geändert und klappt

Zitat von Markus82

Tesseract-Pfad zu Tesseract.exe 😉
Du hast auf die traindata verwiesen und nicht auf die Tesseract.exe

Koebi

Guten Abend.

Hätte mal wieder eine Verständnisfrage... Diesmal zum AutoParser.

Die eingehenden Faxe der Leitstelle unterscheiden sich manchmal in kleinen Details. Einsatzstichwort, Ort etc. sind immer vorhanden / gleich.

Nun gibt es aber lageabhängig z. B. manchmal die Zeile Objekt oder Kreuzstraße; manchmal gibt es die Zeile Meldedetail oder Bemerkung. U. ä.

Wie gehe ich mich solchen "flexiblen" Werten im Fax bezüglich der Einstellung des AutoParsers um??

Bei Suchbegriff "Objekt" und "Kreuzstraße" - kann ich dann beispielsweise bei beiden bei EM-Datentyp "Zusatzinformation1" wählen?

Oder wie muss ich vorgehen? Ich hoffe, ich habe mich halbwegs verständlich ausgedrückt 🙈

Stefan Seider

Sämtliche Suchbegriffe angeben und den Haken bei n/A setzen. Den Datentyp auf den entsprechenden Typ setzen. Der sagt aber nur aus wie er in der Textdatei benannt werden soll.

Im EM dann im Pattern eben alle Suchbegriffe auch wieder den richtigen Typen zuordnen.

Koebi

Zitat von Stefan Seider

Sämtliche Suchbegriffe angeben und den Haken bei n/A setzen. Den Datentyp auf den entsprechenden Typ setzen. Der sagt aber nur aus wie er in der Textdatei benannt werden soll.
Im EM dann im Pattern eben alle Suchbegriffe auch wieder den richtigen Typen zuordnen.

Okay, hab ich gemacht.

Nun hab ich beim Pattern aber z. B. drei Mal "Sachverhalt" stehen. Einmal den tatsächlichen (z. B. "brennt LKW") und zweimal "n/A". Klar, den tatsächlichen weise ich beim Pattern auch wieder den Sachverhalt zu - also Rechtsklick auf "brennt LKW" und Schverhalt zuweisen.

Was mache ich mit den beiden "Sachverhalt n/A"? Im Pattern einfach löschen bzw. unbearbeitet lassen?

Bane

Hallo,

bei unserem Fax haben wir auch die Einsatzstichworte für THL, Brand und Unwetter an verschiedenen positionen.
hierzu sind dann 3 verschiedene pattern notwendig.

In der Parser Auswertung habe ich Zusatzinformation 1-3 an den jeweiligen stellen eingefügt, und jedes Pattern sicht nur nach der jeweils benötigten.
Hier darf allerding nicht n/a als Ersatz eingetragen werden, da sonst immer das erste Pattern verwendet wiird, und dann n/a ausgegeben wird.

Koebi

Ich versuche mich mal anders auszudrücken... Dass man für verschiedene "Faxtypen" verschiedene Pattern anlegen muss, habe ich soweit verstanden.

Ich verstehe jedoch das Zusammenspiel AutoParser und das anschließende Pattern immer noch nicht so ganz.

Beispiel: Im AutoParser habe ich u. a. als Suchbegriffe "Meldedetail", "Meldebild" und "Bemerkung" - alle drei sind unter EM-Datentyp als "Sachverhalt" definiert [n/A ist bei allen aktiviert] (das jeweilige Fax gibt also einen der drei Begriffe her - entweder "Meldedetail", "Meldebild" oder "Bemerkung"; alles meint aber das gleiche - den Sachverhalt).

Nun kopiere ich ja beim Pattern einen Einsatztext zur Bearbeitung. Nehmen wir mal an, dass das Fax den Begriff "Meldedetail" hergibt, die Begriffe "Meldebild" und "Bemerkung" aber nicht. Nun werden mir ja aufgrund des AutoParsers beim Pattern trotzdem alle drei Begriffe angezeigt. Einmal "Meldedetail" mit dem Inhalt z. B. "brennt LKW" und hinter "Meldebild" und "Bemerkung" steht jeweils "n/A" - da die beiden Suchbegriffe ja nicht gefunden wurden, weil das Fax sie nicht hergibt.

Meine Frage ist nun, wie ich mit den Suchbegriffen umgehe, die das Fax nicht hergibt. Lösche ich sie einfach beim Pattern komplett? Oder muss ich dann irgendwie Platzhalter für beliebige Inhalte wählen?

Bane

Falls immer nur eines der 3 ausgefüllt ist nimmst du 3 verschiedene Pattern. Je eins für Meldedetail (Zusatzinfo1), Meldebild (Zusatzinfo2) und Bemerkung (Zusatzinfo3). In jedem der Pattern wird nur eine der Zusatzinfos abgefragt und

Du darfst allerdings hier n/a nicht setzen, da sonst immer das erste Pattern verwendet wird, da „n/a“ vom Pattern als Inhalt erkannt wird.

Die nicht verwendeten Zusatzinfos lässt du weg.

Koebi

Okay, eigentlich verstanden.

Trotzdem noch zwei Fragen:

- Also kann ich Sachverhalt gar nicht nutzen?

- Was ist denn, wenn ich z. B. aber noch weitere Infos zusätzlich im Fax stehen habe - z. B. Straßenkreuzung - und ich diese Info auch gerne auslesen würde? Das kann ich dann nicht zusätzlich über Zusatzinfo machen!?

Juergen

Hallo,

als erstes mal danke für die Software und die Arbeit die Ihr hier macht. Nun zu meiner Frage, kann mir jemand Testfaxe von der ILS Bamberg/Forchheim zur Verfügung stellen, damit ich die Alarmierung weiter testen und in betrieb nehmen kann. Mit den Testfaxen der ILS Augsburg hab ich schon meine ersten Erfolge erzielt.

holger

denk daran das jeder ILS seine FAX'e anders aufgebaut hat.

Christian_FFW

Hallo zusammen,

jetzt hat es diese Woche auch uns erwischt. Unsere Leitstelle (ILS Rosenheim) hat die Schrift vom Alarmfax geändert.

Im Moment ist leider keine Auswertung des Alarmfaxes mehr möglich.

Leider funktionieren auch die hier im Forum bereitgestellten Einstellungen und Tesseract-Dateien nicht

Die einzige Datei bei der im Ansatz etwas erkennbares rauskommt ist die „by-Datei“.

Aber leider bei weitem nicht zufriedenstellend.

Ich weiß, blöde Frage, aber welche Möglichkeiten bleiben mir?

Hab schon stundenlang das Internet durchforstet aber ich komm da irgendwie nicht wirklich weiter.

Wollte es mit dem Weg über SunnyPage versuchen, nur finde ich nichts wo ich die Software downloaden kann.

Oder gibts andere Alternativen? Evtl. sind hier ja Profis in diesem Bereich unter uns

Vielleicht kann mir jemand weiterhelfen.

Bin über jeden erdenklichen Tipp von euch sehr dankbar.

Juergen

Zitat von holger

denk daran das jeder ILS seine FAX'e anders aufgebaut hat.

Ja genau deshalb möchte ich jetzt mit den richtigen weiter machen. Meine FW ist im Landkreis Bamberg

Koebi

Guten Abend.

Heute hat die Fax-Auswertung leider nicht funktioniert.

Kann es daran liegen, dass wir über die FRITZ!Box auch die Weiterleitung per E-Mail aktiviert haben und sich die beiden Prozesse Auswertung EM-OCR und E-Mail - Weiterleitung gegenseitig stören?

Ich hänge mal den zugehörigen Log-Report dazu, vielleicht kann das dann einer von euch Profis besser deuten:

17.05.2019 14:25:58 - Datei Z:\Intenso-RainbowLine-01\FRITZ\faxbox\17.05.19_14.25_Telefax.XXXXXXXXXXX.pdf wurde erstellt

17.05.2019 14:26:00 - Vorgang 20192617022600 gestartet

17.05.2019 14:26:01 - GhostScript starten...

17.05.2019 14:26:01 - GhostScript Ausgabe:

GPL Ghostscript 9.23 (2018-03-21)

This software comes with NO WARRANTY: see the file PUBLIC for details.

**** Error: Cannot find a 'startxref' anywhere in the file.

Output may be incorrect.

**** Error: An error occurred while reading an XREF table.

**** The file has been damaged. This may have been caused

**** by a problem while converting or transfering the file.

**** Ghostscript will attempt to recover the data.

**** However, the output may be incorrect.

**** Error: Trailer dictionary not found.

Output may be incorrect.

No pages will be processed (FirstPage > LastPage).

**** This file had errors that were repaired or ignored.

**** Please notify the author of the software that produced this

**** file that it does not conform to Adobe's published PDF

**** specification.

**** The rendered output from this file may be incorrect.

17.05.2019 14:26:01 - GhostScript beendet

17.05.2019 14:26:02 - Warten auf Dateizugriff...

17.05.2019 14:26:02 - Datei "C:\Users\Nutzer\AppData\Local\Temp\EM-OCR\20192617022600.tif" nicht mehr vorhanden - Vorgang abgebrochen

17.05.2019 14:26:02 - Vorgang 20192617022600 beendet in: 2,17 s

Besten Dank im Voraus schon mal!

Markus82

Christian_FFW

Welche Varianten hast du denn schon ausprobiert?

Sind wir mal positiver Dinge und die FaxSoftware/Schriftart der ILS Rosenheim ist nicht gänzlich neu zu den bisherigen ILS-Umstellungen.

Wie wir (ILS Landshut) von der Umstellung betroffen waren, sind folgende Varianten zur Auswahl gestanden:

1. Tesseract 3.05.02 mit alarm.traindata (bestes Ergebnis alte Schriftart)

2. Tesseract 3.05.02 mit by.traindata (Neue FAxsoftware bei den ILS in Bayern)

3. Tesseract 4.0 mit deu.traindata (2016 - https://github.com/tesseract-ocr/…deu.traineddata)

4. Tesseract 4.0 mit deu.traindata (2018 - https://github.com/tesseract-ocr/…deu.traineddata)

Das beste Ergebnis haben wir mit der Variante 4 hinbekommen.

Beachte hierbei, dass die deu.traindata mit Tesseract 3.05.02 nicht unterstützt wird.

EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung

Christian_FFW

@Markus82

vielen Dank für deine Nachricht.

Variante 1-3 hatte ich schon versucht....ohne zufriedenstellenden Erfolg.

Variante 4 habe hab ich auf diese Info hin getestet....schon besser.

Meiner Meinung nach liegt das Problem auch an der „Qualität“ der verschiedenen Testfaxe die ich zur Verfügung habe.

Da wir seit der Umstellung letzte Woche noch keinen Einsatz hatten, habe ich jetzt mal Kontakt mit unserer Leitstelle aufgenommen und mir ein Testfax mit dem kompletten Alphabet in Groß-& Kleinschreibung, Zahlen und den gängigsten Sonderzeichen auf dem normalen Alarmweg schicken lassen.

Siehe da, Test verlief fast perfekt mit Variante 4.

Einzige Fehler in meinem Fall waren, dass bei der Auswertung statt nem z —> Z, v —> V, § —> 5 und der Bindestrich bzw. der Gedankenstrich unterschiedlich erkannt wird. (mal so - oder so –)

Jetzt mal schauen, ob es beim nächsten Alarm auch klappt.

Markus82

Danke für die Rückmeldung.

Die Groß-/Kleinschreibung werde ich bei uns mal beobachten.

Wir haben auch eher wenig Einsätze.

Die Erkennung des Gedankenstrich/Bindestrich kann ich bestätigen.

Feuerwehr-Gebirge

Hallo,

Kann mir jemand sagen was hier falsch ist ?

Tesseract Meldungen:

Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/-psm.traineddata

Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.

Failed loading language '-psm'

Tesseract couldn't load any languages!

Could not initialize tesserac

Stefan Seider

Tesseract Einstellungen im EM-OCR falsch?

Feuerwehr-Gebirge

Also die Pfade zu den Dateien / Ordnern habe ich angelegt.

Gibt es irgendwo eine Beschreibung was wie und wo auszufüllen ist?

Wäre nicht schlecht wenn die im 1. Post mit ware.

Danke!

Tags