Beiträge von PlAsMa_99

    Hi,

    meinst du die englische Datei? Eine andere finde ich in dem Ordner nicht.

    Gegenüber dieser Version bekomme ich bei der von mir aktuell Eingesetzten Version leider schon deutlich bessere Ergebnisse.

    Das ganze liegt vermute ich aber auch wirklich an der miserablen Qualität der Faxe. Die fettgedruckten Wörter haben teilweise keinen Abstand mehr zwischen den einzelnen Buchstaben, so dass Tesseract ganze Wörter als einen Buchstaben deutet.

    Die von mir aktuell eingesetzte Version ist übrigens diese: https://github.com/UB-Mannheim/tesseract/wiki
    Die könnte die Genauigkeit bei dir eventuell noch verbessern.

    Hallo in die Runde,

    Nutz bereits jemand Tesseract als OCR Toll zur Faxerkennung? Die Genauigkeit mit der 3.05 Version ist, bei der teilweise miserablen Qualität im fettgedruckten Bereich der Alarmfaxe aus COBRA, leider nicht zuverlässig genug.

    Das Problem liegt darin, dass die Buchstaben teilweise so eng zusammen stehe, dass die Standard Lerndatei sie als einen Buchstaben deutet.

    Hat hier jemand eventuell schon eine angepasste Lerndatei?

    Wir sind momentan auch erst in der Einrichtungsphase, haben also noch nicht alle Möglichkeiten abgedeckt.

    Es kommt grundsätzlich aber darauf an, was du aus den Faxen alles auswerten möchtest. Wenn es dir lediglich um das Stichwort und die Adresse geht, kannst du mittels {{BELIEBIGERINHALT}} und einem definierten Wort hinter den Daten alles mit 4 - 5 Pattern abdecken.

    Wenn du die Zusatzfelder nutzen willst, potenziert es sich für jede Variante hoch.

    Wir ersetzen z.B. für Einsätze auf der Autobahn die Strasse durch Koordinaten. Dies erfolgt vor der Übergabe an EM. Dadurch muss jedes Pattern doppelt pflegen.

    Eine endgültige Lösung habe ich auch noch nicht gefunden. Im Endeffekt wird es aber darauf hinaus laufen, dass wir nicht alle Daten nutzen werden.

    Hallo,

    unsere Leitstellen scheinen die gleiche Software zu verwenden.

    Sollte dies der Fall sein, ist es zumindest bei uns so, dass in dem Fax nicht immer alle Merkmale aufgeführt werden, sondern nur die, die auch gefüllt wurden. Als Beispiel steht Meldender nur da wenn auch ein Meldender eingetragen wurde. Dies bedeutet du wirst verschiedene Pattern anlegen müssen. Schau dir hierzu am besten mal ein paar der alten Faxe an.

    Nun aber zu deiner Frage:

    In deinem Pattern musst du nicht zwingend den Zeilenumbruch als Trennzeichen verwenden, du musst hinter einem Platzhalter nur einen definierten Text schreiben, damit der EM beim Auswerten weis, an welcher Stelle z.b. die Straße endet.
    Ein Beispielt Pattern für deinen Text könnte z.B. so aussehen:

    Ja das ist klar.

    Da ich die Koordinaten aber erst über die Textersetzung einfüge, suche ich aktuell nach eine Lösung diese trotzdem nutzen zu können.

    Ich hätte auch einen gefunden:

    Ich nutze jetzt den Ort um die Angabe zu erfassen, ersetze Sie dann durch die Koordinaten in folgendem Format "53.000000, 12.000000"

    Wenn ihr nun eine kleine Änderung vornehmen würdet, könnte ich (und jeder andere mit einer kleinen Erklärung auch) es auf diese Weise tun.

    In der zusammengesetzten Adresse schreibt Ihr vor den Ort immer ein Komma. Eine Adresse die nur aus einem Ort besteht sieht also so aus:", PLZ Ort" oder in meinem Fall ", 53.000000, 12.000000". Hierbei findet Google zwar den Ort, kann aber keine Route errechnen, da die Syntax nicht korrekt ist.
    Wenn Ihr das Komma erst einfügt, wenn auch eine Strasse genutzt wird, könnte man den Ort nutzen um mittels Textersetzung über beliebige Strings im Alarmtext Koordinaten zu nutzen.

    Von der Syntax her ginge das aus meiner Sicht auch noch in Ordnung, da Longitude und Atitude zusammen einen Ort ergeben ;-).

    Der Text sieht wie folgt aus:

    Code
    Einsatzanlass
    Meldebild      PkWbrand- außerorts (Autobahn Bundes-& Landstraße), ba1
    Bemerkung      PKW Brand
                    Mit Sondersignal
    Stichwort      B ba1 Kl einbrand auß erorts, Gruppe
    Einsatzort
    Ort            XXX
    Ortsteil       XXX, XXX
    Straße         A2 XXX>Ak XXX
    EinsatzNm     usw...

    Den Teil in Zeile 9 habe ich wie oben beschrieben über die Textersetzung durch folgendes ersetzt:

    Latt 52.000000# Long 11.000000#

    Das Pattern:

    Code
    {{WORTODERZAHL}}
    Meldebild      {{BELIEBIGERINHALT}}, {{EINSATZSTICHWORT}}
    Bemerkung      {{SACHVERHALT}}
                    {{WORTODERZAHL}} Sondersignal
    {{BELIEBIGERINHALT}}
    Ortsteil {{BELIEBIGERINHALT}}
    Long {{LONGITUDE}}# Latt {{LATITUDE}}#
    EinsatzNm     {{BELIEBIGERINHALT}}

    Hallo,

    bei Einsätzen auf der Autobahn bekommen wir keine für Google verständliche Benennung:

    A2 Ausfahrt1>Ausfahrt2

    Ich möchte diesen Text nun durch die Textersetzung in folgende umwandeln:

    Latt 52.000000# Long 11.000000#

    Die Ersetzung scheint allerdings nicht zu funktionieren. Bei einer Alarmierung komme ich immer in den Fallbackmodus.

    Kann ich in der Textersetzung eingefügte Werte in Pattern nutzen? also quasi:

    Long {{LONGITUDE}}# Latt {{LATITUDE}}#

    Irgend Jemand eine Idee wo ich den Fehler mache?

    Hi,

    wie schon geschrieben, es funktioniert. Ich wollte mich nur vergewissern ob es das auch soll oder reiner Zufall ist.

    Hat aber wirklich keine Eile.

    Ich habe hier noch mit ganz anderen Widrigkeiten zu kämpfen, da unsere Leitstelle keinerlei Kennzeichnung zu den Infos schickt, sondern alles einfach nur nach einem Sternchen und die Anzahl der Informationen variiert auch noch ständig. Da können wir erstmal ein Konzept erstellen, welche Regeln wir brauchen und in welcher Reihenfolge diese abgefragt werden müssen. Das dauert also noch etwas.

    OK, das bedeutet ich kann über die Textersetzung Teile des Alarmtexts abändern.

    Dann habe ich folgende Fragen, in der Hoffnung, dass ich nicht alle Strassen einpflegen muss:

    1. Ist die Textersetzung Case sensitiv?
    2. Berücksichtigt Sie auch führende oder in meinem Fall abschließende Leerzeichen

    Sollten diese Möglichkeiten bestehen könnte ich ein großes S mit nachgestelltem Leerzeichen einfach durch Strasse ersetzen usw. (habe es jetzt mal getestet. Es funktioniert. Die Fragen bleiben aber bestehen um zu klären ist es Zufall oder gewünschtes Verhalten)

    3. Gäbe es die Möglichkeit eine fertige Tabelle mit Ersetzungen zu importieren oder direkt in die Datenbank zu schreiben?

    @timo777 das kann ich dir auch nicht genau beantworten. Vermutlich um Zeichen einzusparen. Diese Stellschraube wird zur Problemlösung aber leider nicht beitragen.

    Hallo,
    unsere Leitstelle kürzt die Strassenamen wie folgt ab:
    S = Strasse
    W = Weg
    P = Platz
    W = Weg
    usw.
    also Beispielsweise BahnhofS statt Bahnhofstraße.

    Google kann mit dieser Abkürzung nur teilweise eine gültige Adresse finden. Gibt es eine Möglichkeit den Straßennamen zu ergänzen?