EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung

  • Guten Abend.

    Hätte mal wieder eine Verständnisfrage... Diesmal zum AutoParser.

    Die eingehenden Faxe der Leitstelle unterscheiden sich manchmal in kleinen Details. Einsatzstichwort, Ort etc. sind immer vorhanden / gleich.

    Nun gibt es aber lageabhängig z. B. manchmal die Zeile Objekt oder Kreuzstraße; manchmal gibt es die Zeile Meldedetail oder Bemerkung. U. ä.

    Wie gehe ich mich solchen "flexiblen" Werten im Fax bezüglich der Einstellung des AutoParsers um??

    Bei Suchbegriff "Objekt" und "Kreuzstraße" - kann ich dann beispielsweise bei beiden bei EM-Datentyp "Zusatzinformation1" wählen?

    Oder wie muss ich vorgehen? Ich hoffe, ich habe mich halbwegs verständlich ausgedrückt 🙈

    • Offizieller Beitrag

    Sämtliche Suchbegriffe angeben und den Haken bei n/A setzen. Den Datentyp auf den entsprechenden Typ setzen. Der sagt aber nur aus wie er in der Textdatei benannt werden soll.

    Im EM dann im Pattern eben alle Suchbegriffe auch wieder den richtigen Typen zuordnen.

  • Sämtliche Suchbegriffe angeben und den Haken bei n/A setzen. Den Datentyp auf den entsprechenden Typ setzen. Der sagt aber nur aus wie er in der Textdatei benannt werden soll.

    Im EM dann im Pattern eben alle Suchbegriffe auch wieder den richtigen Typen zuordnen.

    Okay, hab ich gemacht.

    Nun hab ich beim Pattern aber z. B. drei Mal "Sachverhalt" stehen. Einmal den tatsächlichen (z. B. "brennt LKW") und zweimal "n/A". Klar, den tatsächlichen weise ich beim Pattern auch wieder den Sachverhalt zu - also Rechtsklick auf "brennt LKW" und Schverhalt zuweisen.

    Was mache ich mit den beiden "Sachverhalt n/A"? Im Pattern einfach löschen bzw. unbearbeitet lassen?

  • Hallo,

    bei unserem Fax haben wir auch die Einsatzstichworte für THL, Brand und Unwetter an verschiedenen positionen.
    hierzu sind dann 3 verschiedene pattern notwendig.

    In der Parser Auswertung habe ich Zusatzinformation 1-3 an den jeweiligen stellen eingefügt, und jedes Pattern sicht nur nach der jeweils benötigten.
    Hier darf allerding nicht n/a als Ersatz eingetragen werden, da sonst immer das erste Pattern verwendet wiird, und dann n/a ausgegeben wird.

  • Ich versuche mich mal anders auszudrücken... Dass man für verschiedene "Faxtypen" verschiedene Pattern anlegen muss, habe ich soweit verstanden.

    Ich verstehe jedoch das Zusammenspiel AutoParser und das anschließende Pattern immer noch nicht so ganz.

    Beispiel: Im AutoParser habe ich u. a. als Suchbegriffe "Meldedetail", "Meldebild" und "Bemerkung" - alle drei sind unter EM-Datentyp als "Sachverhalt" definiert [n/A ist bei allen aktiviert] (das jeweilige Fax gibt also einen der drei Begriffe her - entweder "Meldedetail", "Meldebild" oder "Bemerkung"; alles meint aber das gleiche - den Sachverhalt).

    Nun kopiere ich ja beim Pattern einen Einsatztext zur Bearbeitung. Nehmen wir mal an, dass das Fax den Begriff "Meldedetail" hergibt, die Begriffe "Meldebild" und "Bemerkung" aber nicht. Nun werden mir ja aufgrund des AutoParsers beim Pattern trotzdem alle drei Begriffe angezeigt. Einmal "Meldedetail" mit dem Inhalt z. B. "brennt LKW" und hinter "Meldebild" und "Bemerkung" steht jeweils "n/A" - da die beiden Suchbegriffe ja nicht gefunden wurden, weil das Fax sie nicht hergibt.

    Meine Frage ist nun, wie ich mit den Suchbegriffen umgehe, die das Fax nicht hergibt. Lösche ich sie einfach beim Pattern komplett? Oder muss ich dann irgendwie Platzhalter für beliebige Inhalte wählen?

  • Falls immer nur eines der 3 ausgefüllt ist nimmst du 3 verschiedene Pattern. Je eins für Meldedetail (Zusatzinfo1), Meldebild (Zusatzinfo2) und Bemerkung (Zusatzinfo3). In jedem der Pattern wird nur eine der Zusatzinfos abgefragt und

    Du darfst allerdings hier n/a nicht setzen, da sonst immer das erste Pattern verwendet wird, da „n/a“ vom Pattern als Inhalt erkannt wird.

    Die nicht verwendeten Zusatzinfos lässt du weg.

  • Okay, eigentlich verstanden.

    Trotzdem noch zwei Fragen:

    - Also kann ich Sachverhalt gar nicht nutzen?

    - Was ist denn, wenn ich z. B. aber noch weitere Infos zusätzlich im Fax stehen habe - z. B. Straßenkreuzung - und ich diese Info auch gerne auslesen würde? Das kann ich dann nicht zusätzlich über Zusatzinfo machen!?

  • Hallo,

    als erstes mal danke für die Software und die Arbeit die Ihr hier macht. Nun zu meiner Frage, kann mir jemand Testfaxe von der ILS Bamberg/Forchheim zur Verfügung stellen, damit ich die Alarmierung weiter testen und in betrieb nehmen kann. Mit den Testfaxen der ILS Augsburg hab ich schon meine ersten Erfolge erzielt.

  • Hallo zusammen,

    jetzt hat es diese Woche auch uns erwischt. Unsere Leitstelle (ILS Rosenheim) hat die Schrift vom Alarmfax geändert.

    Im Moment ist leider keine Auswertung des Alarmfaxes mehr möglich.

    Leider funktionieren auch die hier im Forum bereitgestellten Einstellungen und Tesseract-Dateien nicht ||

    Die einzige Datei bei der im Ansatz etwas erkennbares rauskommt ist die „by-Datei“.

    Aber leider bei weitem nicht zufriedenstellend.

    Ich weiß, blöde Frage, aber welche Möglichkeiten bleiben mir?

    Hab schon stundenlang das Internet durchforstet aber ich komm da irgendwie nicht wirklich weiter.

    Wollte es mit dem Weg über SunnyPage versuchen, nur finde ich nichts wo ich die Software downloaden kann.

    Oder gibts andere Alternativen? Evtl. sind hier ja Profis in diesem Bereich unter uns 8)

    Vielleicht kann mir jemand weiterhelfen.

    Bin über jeden erdenklichen Tipp von euch sehr dankbar.

  • Guten Abend.

    Heute hat die Fax-Auswertung leider nicht funktioniert.

    Kann es daran liegen, dass wir über die FRITZ!Box auch die Weiterleitung per E-Mail aktiviert haben und sich die beiden Prozesse Auswertung EM-OCR und E-Mail - Weiterleitung gegenseitig stören?

    Ich hänge mal den zugehörigen Log-Report dazu, vielleicht kann das dann einer von euch Profis besser deuten:

    17.05.2019 14:25:58 - Datei Z:\Intenso-RainbowLine-01\FRITZ\faxbox\17.05.19_14.25_Telefax.XXXXXXXXXXX.pdf wurde erstellt

    17.05.2019 14:26:00 - Vorgang 20192617022600 gestartet

    17.05.2019 14:26:01 - GhostScript starten...

    17.05.2019 14:26:01 - GhostScript Ausgabe:

    GPL Ghostscript 9.23 (2018-03-21)

    Copyright (C) 2018 Artifex Software, Inc. All rights reserved.

    This software comes with NO WARRANTY: see the file PUBLIC for details.

    **** Error: Cannot find a 'startxref' anywhere in the file.

    Output may be incorrect.

    **** Error: An error occurred while reading an XREF table.

    **** The file has been damaged. This may have been caused

    **** by a problem while converting or transfering the file.

    **** Ghostscript will attempt to recover the data.

    **** However, the output may be incorrect.

    **** Error: Trailer dictionary not found.

    Output may be incorrect.

    No pages will be processed (FirstPage > LastPage).

    **** This file had errors that were repaired or ignored.

    **** Please notify the author of the software that produced this

    **** file that it does not conform to Adobe's published PDF

    **** specification.

    **** The rendered output from this file may be incorrect.

    17.05.2019 14:26:01 - GhostScript beendet

    17.05.2019 14:26:02 - Warten auf Dateizugriff...

    17.05.2019 14:26:02 - Datei "C:\Users\Nutzer\AppData\Local\Temp\EM-OCR\20192617022600.tif" nicht mehr vorhanden - Vorgang abgebrochen

    17.05.2019 14:26:02 - Vorgang 20192617022600 beendet in: 2,17 s


    Besten Dank im Voraus schon mal!

  • Christian_FFW

    Welche Varianten hast du denn schon ausprobiert?

    Sind wir mal positiver Dinge und die FaxSoftware/Schriftart der ILS Rosenheim ist nicht gänzlich neu zu den bisherigen ILS-Umstellungen.

    Wie wir (ILS Landshut) von der Umstellung betroffen waren, sind folgende Varianten zur Auswahl gestanden:

    1. Tesseract 3.05.02 mit alarm.traindata (bestes Ergebnis alte Schriftart)

    2. Tesseract 3.05.02 mit by.traindata (Neue FAxsoftware bei den ILS in Bayern)

    3. Tesseract 4.0 mit deu.traindata (2016 - https://github.com/tesseract-ocr/…deu.traineddata)

    4. Tesseract 4.0 mit deu.traindata (2018 - https://github.com/tesseract-ocr/…deu.traineddata)

    Das beste Ergebnis haben wir mit der Variante 4 hinbekommen.

    Beachte hierbei, dass die deu.traindata mit Tesseract 3.05.02 nicht unterstützt wird.

    EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung

    EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung

  • @Markus82

    vielen Dank für deine Nachricht.

    Variante 1-3 hatte ich schon versucht....ohne zufriedenstellenden Erfolg.

    Variante 4 habe hab ich auf diese Info hin getestet....schon besser.

    Meiner Meinung nach liegt das Problem auch an der „Qualität“ der verschiedenen Testfaxe die ich zur Verfügung habe.

    Da wir seit der Umstellung letzte Woche noch keinen Einsatz hatten, habe ich jetzt mal Kontakt mit unserer Leitstelle aufgenommen und mir ein Testfax mit dem kompletten Alphabet in Groß-& Kleinschreibung, Zahlen und den gängigsten Sonderzeichen auf dem normalen Alarmweg schicken lassen.

    Siehe da, Test verlief fast perfekt mit Variante 4.

    Einzige Fehler in meinem Fall waren, dass bei der Auswertung statt nem z —> Z, v —> V, § —> 5 und der Bindestrich bzw. der Gedankenstrich unterschiedlich erkannt wird. (mal so - oder so –)

    Jetzt mal schauen, ob es beim nächsten Alarm auch klappt.

  • Danke für die Rückmeldung.

    Die Groß-/Kleinschreibung werde ich bei uns mal beobachten.

    Wir haben auch eher wenig Einsätze.

    Die Erkennung des Gedankenstrich/Bindestrich kann ich bestätigen.

  • Hallo,

    Kann mir jemand sagen was hier falsch ist ?

    Tesseract Meldungen:

    Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/-psm.traineddata

    Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.

    Failed loading language '-psm'

    Tesseract couldn't load any languages!

    Could not initialize tesserac