- Offizieller Beitrag
@l_mrx verlinke doch dein Skript noch mal, ich hab es auch über die Suche nicht gefunden
@l_mrx verlinke doch dein Skript noch mal, ich hab es auch über die Suche nicht gefunden
Problem ist leider, dass das Script individuell geschrieben werden muss. Da jedes Alarmfax bzw. Textdatei anders aufgebaut ist. Bin da aber offen und biete gerne für alle die Hilfe brauchen Hilfe an. Habe schon mehrere Scripte geschrieben.
LG Luca
Es wäre gut wenn du mir mal deinen Skript zur Verfügung stellen würdest, damit ich mir den Aufbau und Funktion anschauen kann.
Ich würde mich erstmal selber daran versuchen, wenn ok
Schreib mir eben per PN, dann schick ich dir das gleich zu.
Hi @l_mrx , Hi Tony
was macht denn ein PowerShell Scrips so besonders?
Wir werten ebenfalls die Alarmfaxe einer ILS aus Bayern aus. Wenn die tesseract Umwandlung gut funktioniert, heißt die Quelldatei von guter Qualität ist und die alarm.traineddata verwendet wird, kann alles andere über einen Pattern im Einsatzmonitor gelöst werden. Zusatzinformationen können vernachlässigt werden. Vor allem wenn man das Einsatz1.txt als basis nimmt, sollte dies mit einem Pattern gelöst werden können. Das Unterscheidet sich nicht wirklich zu unserem Fax.
Und wie Sven schon beschrieben hat brauchst du so gut wie immer einen Fix/Endpunkt. Das macht das ganze einfacher.
Mein Pattern sieht aktuell so aus.
STRAßE{{SONDERZEICHEN}}{{STRASSE}}
{{WORTODERZAHL}}RTSTEIL/{{WORTODERZAHL}}RT{{SONDERZEICHEN}}{{ORT}}-{{BELIEBIGERINHALT}}
KOORDINATEN{{SONDERZEICHEN}}{{RECHTSWERT}}{{SONDERZEICHEN}}{{HOCHWERT}}
{{WORTODERZAHL}}BJEKT{{SONDERZEICHEN}}{{OBJEKT}}
{{BELIEBIGERINHALT}}
MELDEBILD{{SONDERZEICHEN}}{{SACHVERHALT}}
EINSATZSTICHWORT{{SONDERZEICHEN}}{{EINSATZSTICHWORT}}
HINWEIS{{SONDERZEICHEN}}{{ZUSATZFELD1:Hinweis}}
EINSATZMITTEL{{SONDERZEICHEN}}{{BELIEBIGERINHALT}}
Zu erwähnen ist dass ich noch einen Zweiten Pattern habe, für den Fall das die ILS so gut wie keine Informationen sendet z.B. nur das Stichwort. Dieser kommt aber seit dem die Gauß Krüger Koordinaten unterstützt werden nicht mehr wirklich zum Einsatz
Weitere Details hier: https://www.feuerwehr-jesenwang.de/einsatzmonitor
Meine Inputdatei sieht für einen Probealarm z.B. so aus
Hallo Florian,
ich hatte dich ja schonmal via mail angeschrieben
zuerstmal zu tesseract
-> die ganzen Infos werden bei mir auch in eine Zeile geschrieben, schade das hier kein Zeilenumbruch gibt
-> am meisten Probleme mit tesseract macht die Erkennung in Bezug auf Umlaute . ich habe mal ein Testsystem so wie du es auf euerer Internetseite erklärst aufgebaut.
Als Test sieht das dann so aus:
Emsatzz
Stichvvortz THl
Narmierte Kräftez FFvv Brauna
Straßez Am Wa!berg 2
Da muss ich nochmal werkeln.
--> Lustiger Fakt...als ich das hier eingefügt habe, hat es den Zeilenumbruch gemacht, also ok
__________
Ein Testpattern sieht ja so aus:
{{BELIEBIGERINHALT}}
Gemeinde : {{ORT}}
Ortsteil : {{ORTSTEIL}}
Straße : {{STRASSE}} Haus-Nr: {{HAUSNUMMER}}
Stichwort: {{EINSATZSTICHWORT}} Auswahl: {{ZUSATZFELD1:Auswahl}}
Sondersignal: {{ZUSATZFELD2:Sondersognal}}
Objekt: {{ZUSATZFELD3:Objekt}}
{{BELIEBIGERINHALT}}
Was : {{SACHVERHALT}}
{{BELIEBIGERINHALT}}
{{AAO}}
{{BELIEBIGERINHALT}}
-> Der "BeliebigeInhalt" sind all die Daten die ich nicht brauche...was vorher mit einem Skript rausgefiltert werden soll
-> wie gesagt sind wir noch im Aufbau und Testen
Servus Tony,
als wenn man als Basis deine Einsatz1.txt benutzt sieht der Pattern so aus:
Gemeinde{{SONDERZEICHEN}}{{ORT}}
Ortsteil{{SONDERZEICHEN}}{{ORTSTEIL}}
Straße{{SONDERZEICHEN}}{{STRASSE}}Haus-Nr{{SONDERZEICHEN}}{{HAUSNUMMER}}
Stichwort{{SONDERZEICHEN}}{{EINSATZSTICHWORT}}Auswahl{{BELIEBIGERINHALT}}
Sondersignal{{SONDERZEICHEN}}{{ZUSATZFELD2:Sondersignal}}
Objekt{{SONDERZEICHEN}}{{OBJEKT}}
Einsatzplan{{BELIEBIGERINHALT}}
Was{{SONDERZEICHEN}}{{SACHVERHALT}}
-{{BELIEBIGERINHALT}}
Hinweise{{SONDERZEICHEN}}{{ZUSATZFELD3:Hinweis}}
-{{BELIEBIGERINHALT}}
Feuerwehrplan
Mit Einsatz1_ergänzt.txt getestet um die Inhalte zu erkennen:
Alles was bei {{BELIEBIGERINHALT}} steht wird auch ausgefiltert, dazu brauchst du kein Script....
Pattern kann gegebenenfalls noch ergänt werden, ich weiß nicht welche Angaben euch da am Wichtigsten sind.
Teste es doch mal mit weiteren "Original" Faxen - meisten fällt da dann noch etwas auf.
Grüße!
Hi ihr,
erstmal kann ich euch nur empfehlen "-psm 6" als Parameter bei Tesseract hinzuzufügen.
Die Frage was Powershell so besonders macht ist ganz einfach beantwortet
1. Du kannst entscheiden wie was passiert
2. Powershell ist eine sehr Systemnah basierende Kommandozeile, was sich bemerkbar macht. (150 Zeilen in 1 Sek abgearbeitet)
3. Die Stichworterkennung und Texterkennung vom Einsatzmonitor braucht sehr lange im Gegensatz zu Powershell (seid dem ich PowerShell nutze, zeigt der einsatzmonitor nur noch ganz kurze Zeit das Ladesymbol an und die Karten werden flott geladen, sodass sich auch mein druckproblem gelöst hat.
4. Powershell bietet ohne ende Operatoren um mit Strings zu arbeiten.
5. Die Erkennung klappt bei mir zu 100% auch mit allen Zusatzinformationen (Powershell ist da fehlertollerant, kann es ein Befehl nicht verarbeiten wird einfach weiter gemacht)
Ich werde z.b. Auch unsere Einsatzbericht darüber aus.
Vorher hat mein System 20-30Sekunden bis zur alamierung gebraucht, jetzt mit allem umgebaut 7-10 Sekunden.
VG Luca
Hi @I_mrx,
Danke für deine Ausführliche Beschreibung - ich weiß aber in etwa was ein PowerShell Script macht
Meine Frage hat eher darauf abgezielt was es in einem Auswertungsablauf genau erledigt?
Wenn ich dich richtig verstehe, lässt du Tesseract dann direkt über ein PowerShell Script laufen und entfernst im Anschluss (noch außerhalb des Einsatzmonitors) die unnötigen Informationen? Oder was macht das Script jetzt genau?
Und ohne jetzt Google bemühen zu müssen, was macht denn "-psm 6"? Ich werte ohne aus und seit mit der alarm.traineddata habe ich keine Problem
Grüße,
Flo
Hi klouisbrother ,
genau richtig das war der Grundgedanke, bei mir erledigt es mittlerweile aber noch deutlich mehr Aufgaben z.B. Die Verarbeitung, die Textersetzung, die Monitor Stromsteuerung, Die Einsatzberichtauswertung usw.. Du hast deutlich besser die Möglichkeit den Ablauf vor dem Eingang in den Einsatzmonitor zu Steuern. Natürlich funktioniert die Erkennung der wichtigsten Daten auch über ein Pattern, aber mit einem solchen Script kannst du z.B. werden bei uns bei einem Autobahneinsatz keine Koordinaten mitgeteilt, die kann ich dann durch IF Abfragen bei speziellen Stichworten im Alarmfax hinzufügen.
VG Luca
Hi @l_mrx ,
klingt interessant
Könntest du mir das Script mal per Nachricht oder Mail zukommen lassen? Dann könnte ich mir das mal genauer ansehen
Danke,
Florian
Hi Florian, klar lasse ich dir zukommen Änder nur die Schicherheitsrrlevanten Daten dann ab, alles heute nachmittag.
VG
Danke!
Übrigens hier genau der Fall, mit dem Pattern wird das nicht klappen...Mit Powershell in drei Zeilen machbar.
@l_mrx das genannte Beispiel klappt mit den Pattern, die User müssen nur verstehen, wie das Pattern überhaupt funktioniert.
@l_mrx da muss ich FFW31 zustimmen...
Aber zu verstehen wie man den Richtigen Pattern baut, ist ein "learning-by-doing" Prozess, und das dauert erstmal etwa
Spreche aus Erfahrung - aber sobald "Trennzeichen" vorhanden sind, lässt sich eigentlich alles auswerten.
Liegt hat auch noch etwas an der Konsistenz der Quelle (ILS)
Genau das ist das Problem, es gibt auch Quellen die immer unterschiedlich aufgebaut sind und unterschiedliche Informationen enthalten.
Das ich dort eine falsche Aussage getroffen hab, dafür dürft ihr mich steinigen. Das es im Normalfall mit dem Pattern klappt ist mir klar, sonst wäre es ja all die Jahre nicht gegangen.
Hallo,
wir sind auf der Zielgerade den EM in den Testbetrieb zu nehmen.
Ich habe allerdings noch ein Hindernis zu dem ich die Lösung einfach nicht finde - das Problem hier ist Tesseract und die Zeichenerkennung.
Das Problem hier ist, dass der " : " als "z" ausgegeben wird.
Tesseract liegt bei mir hier: C:\Einsatzmonitor\Tesseract-OCR
die trained-datei hier: C:\Einsatzmonitor\Tesseract-OCR\tessdata\alarm.traineddata
der Abfrageskript in der Batch_Datei lautet:
"C:\Einsatzmonitor\Tesseract-OCR\tesseract.exe" "C:\Einsatzmonitor\verarbeitung\TXT\%Letzte_Datei%" "C:\Einsatzmonitor\verarbeitung\temp\text-UTF8" -l alarm
das Ergebnis lautet: "Einsatzz Brand" sollte aber "Einsatz: Brand" sein
hat jemand eine Idee an was es liegen könnte?
Viele Grüße
Tony
Ich kann mir nur schwer vorstellen das es direkt an Tesseract liegt, was machst du den noch mit der Textdatei? 😜