Neue FAxsoftware bei den ILS in Bayern

  • Hier bitte. Eine kleine Schwachstelle habe ich zwischenzeitlich festgestellt: es gibt Schwierigkeiten bei Wörtern in Großbuchstaben. Letztere werden nicht zuverlässig erkannt. Bei normal- bzw. kleingeschriebenen Wörtern oder Zahlen funktioniert es bei mir einwandfrei.

  • Zusatzinformation3{{SONDERZEICHEN}}{{ZUSATZFELD3:Einsatznummer}}

    Zusatzinformation1{{SONDERZEICHEN}}{{ZUSATZFELD1:Mitteiler}}

    Straße{{SONDERZEICHEN}}{{STRASSE}}

    Hausnummer{{SONDERZEICHEN}}{{HAUSNUMMER}}

    Ortsteil{{SONDERZEICHEN}}{{ZUSATZFELD1:Ortsteil}}

    Ort{{SONDERZEICHEN}}{{ORT}}

    Objekt{{SONDERZEICHEN}}{{OBJEKT}}

    Zusatzinformation3{{SONDERZEICHEN}}{{ZUSATZFELD2:Station}}

    Zusatzinformation3{{SONDERZEICHEN}}{{ZUSATZFELD3:Einsatzplan}}

    UTMPosition{{SONDERZEICHEN}}{{WORTODERZAHL}}{{SONDERZEICHEN}}{{RECHTSWERT}}{{WORTODERZAHL}}{{SONDERZEICHEN}}{{HOCHWERT}}

    Einsatzstichwort{{SONDERZEICHEN}}#{{EINSATZSTICHWORT}}#{{BELIEBIGERINHALT}}#{{ZUSATZFELD3:Zusatzinfo}}

    Sachverhalt{{SONDERZEICHEN}}{{BELIEBIGERINHALT}}

    Zusatzinformation2{{SACHVERHALT}}

    ***ENDE DER DATEI***

  • Ich hab bereits eine Trainingsdatei für die neue Schriftart gebastelt. Momentan hängt es aber noch an der Umwandlung von pdf in tif, da es zuverlässig nur mit einer großen Auflösung funktioniert. Führe ich Ghostscript mit den entsprechenden Parametern und dann Tesseract getrennt aus, klappt es bei mir zu 100%. Nur bei der Verarbeitung des pdf über EM-OCR hakt es noch ein bisschen. Stefan weiß aber schon Bescheid.

  • EM-OCR V1.0.24 getestet mit:

    - by.traineddata

    - Ghostscript: -dNOPAUSE -dBATCH -sDEVICE=tiffg4 -r600x600 -sPAPERSIZE=a4

    - Tesseract: -l by -psm 6

    Ergebnis: bei mir wiederholt einwandfrei!

    Die Trainingsdatei ist im Anhang - einfach mal selbst testen....

    14.08.2018: neue Version der Trainingsdatei

  • Das wäre grundsätzlich kein Problem, dann bräuchte ich allerdings mehr Faxe. Wobei ich aber nicht sagen kann, mit wievielen Wiederholungen Tesseract angelernt werden muss/sollte.

    Dass gerade (e) schlecht erkannt werden, kann ich aber nicht nachvollziehen. Gerade diesen Buchstaben habe ich aufgrund des häufigen Vorkommens bestimmt 40- bis 50-mal markiert und somit trainiert. Wie bekommt ihr das Alarmfax und mit welchen Parametern wandelst du von pdf nach tif?

  • Hallo zusammen,

    bei uns haben seit einiger Zeit viele Wehren Probleme mit der Auswertung vom FAX, bzw. können diese gar nicht mehr ausgewertet werden.

    Wir denken, dass dies schon seit der Umstellung der Schrift nicht mehr geht.
    ILS ist Lkr. Regensburg.

    Hat hier jemand eine aktuelle Trianingsdatei, welche er zur Verfügung stellt?

    Wir wären alle sehr froh und dankbar.


    Grüße

    Maro

  • Grüß Gott an den Nachbarbereich. Versuch es mal mit der Datei aus Beitrag #46. Zusammen mit den genannten Einstellungen hatten wir bei der neuen Schritart bislang eine 100%ige Auswertung. Nicht unwerwähnt bleiben darf, dass ich "." sowie ":" und "'='' über EM-OCR durch ein Leerzeichen ersetze.

  • Grüß Gott an den Nachbarbereich. Versuch es mal mit der Datei aus Beitrag #46. Zusammen mit den genannten Einstellungen hatten wir bei der neuen Schritart bislang eine 100%ige Auswertung. Nicht unwerwähnt bleiben darf, dass ich "." sowie ":" und "'='' über EM-OCR durch ein Leerzeichen ersetze.

    Die Datei aus Beitrag #46 klappt leider nicht.

  • Also bei uns ILS Würzburg war anfang April Umstellung vorher hatten wir die by Datei zum auswerten. Seit derm Umstellung benutzen wir die deu Datei bei der ist eine 100%Auswertung vorhanden. Keine Fehler mehr.

  • Dann weiß ich leider auch nicht weiter. Was ich aber dennoch gerne verstehen möchte ist, warum es bei manchen problemlos klappt und bei anderen gar nicht.

  • Kann das auch mein Problem letztens erklären???

    aus

    MITTEILER wurde M1TTEILER,

    EINSATZORT wurde E1NSATZORT,

    EINSATZGRUND wurde E1NSATZGRUND und

    EINSATZMITTEL wurde E1NSATZMITTEL.

    Sollte man dann die trainee Datei ändern oder lieber mit der Option "Vor Auto Parsern" arbeiten dam mit aus E1N wieder EIN bzw. M1T wird?


    Greetz

    John

  • Das kann ich nicht ausschließen. Dieses Verhalten kenne ich bei meinem System nicht, ausgenommen das BIIII. Bei anderen funktioniert die by-Datei offentsichtlich gar nicht und so wie es z.B. FF Wiesentheid beschreibt darf es eigentlich gar nicht funktionieren, da ich ausschließlich die neue Schriftart trainiert hatte. Was bei mir noch der Fall ist: ich habe die Datei auf demselben Rechner trainiert, auf dem jetzt auch die Auswertung stattfindet. Ob und weshalb das eine Rolle spielen könnte, weiß ich leider nicht...

  • Hallo Leute,

    Wir haben ein Problem in unserem Landkreis.

    Seit gestern ist eine neue Fax schrift auf unserem Einsatzfax.

    Leider möchte unsere ILS das die Schrift Marschienel nicht verwendet werden kann.

    Leider ist es auch so. die Zahl 1 wird als I erkannt und somit kann die Koordinaten nicht verwendet werden usw.

    weis jemand wie man Tesseract die neue Schrift lernen kann. Hab leider keine Ahnung über diese Marterie.

    LG

    • Offizieller Beitrag

    Direkt kann ich dir nicht helfen, aber ihr solltet euch mit den anderen Feuerwehren unterhalten und anschließend auf die Leitstelle zugehen. Denn auch in Bayern findet sich folgendes "Das Feuerwehrwesen in Bayern ist Aufgabe der Gemeinden". D.h eine Leitstelle ist für euch ein Dienstleister und keine übergeordnete Stelle. Da die Gemeinden entsprechend im Feuerwehrwesen verantwortlich sind, sehe ich keinen Grund warum eine Leitstelle die Maschinelleverarbeitung der Einsatzdaten verhindern möchte, wenn eine Feuerwehr dies entsprechend anfordert.

    Versucht das Thema unter den Leitern der Feuerwehren im Landkreis zu besprechen und gebt den Beschluss entsprechend an die Leitstelle / Kreisverantwortlichen weiter. Das Thema wird wahrscheinlich auch Feuerwehren betroffen die andere Anbieter nutzen.

    • Offizieller Beitrag

    Okay, wie ich von meinem Kreisbrandmeister erfahren habe, wird die neue schrift bayern weit umgestellt da die firma ein neues Update heraus gebracht hat.

    Ja, dazu gab es vor langer Zeit ein Update im OCR Thema, mit neuer traniee Datei.