EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung

  • Hallo!

    Seitdem ich unter den Ausgabe-Einstellungen eine Raute durch ein Leerzeichen ersetzen lasse, wird der Text immer in mehrere Zeilen geschrieben.

    Mir ist aufgefallen, dass nach dem Speichern unter der Einstellungen, das eine Leerzeichen durch 16 Leerzeichen ersetzt wird. Warum passiert das?

    Danke!

    MfG

    • Offizieller Beitrag

    *********UPDATE********* V1.0.29

    -> Workaround für Leerzeichen Bug (VisualStudio 2017) eingebaut

    -> Codeoptimierungen

    saiwabaua

    Das war tatsächlich eine etwas größere Geschichte, da die IDE selbst (Visual Studio) das Problem erzeugt. Ich habe dafür einen Workaround eingebaut, der auch noch funktioniert, sofern Microsoft diesen Bug doch mal beheben sollte...;)

  • Hallo zusammen,

    ich habe ein kleines Problem mit der Texterkennung des EM-OCR.

    Unser Fax generiert eine Datei im Ordner welcher überwacht wird. Allerdings erkennt der EM-OCR die Datei zu schnell (da diese noch generiert wird) und bearbeitet diese nicht weiter.

    Desweiteren findet er die Texte nicht richtig.

    Hoffe mir kann jemand weiterhelfen.

  • Was steht denn im Log?

    Anbei der Log und nochmals das Alarmfax als *.tif

    Sobald unser Fax (Borther MFC1910-W) das Fax auf den PC kopiert (*.tif_ -Datei / nach bearbeitung *.tif) steht im Log "Datei erkannt". Ab diesem Punkt passiert nichts mehr. Das einzige was ich dann machen kann, ist die *.tif Datei aus dem Ordner zu "schmeißen" und erneut rein zu ziehen. Danach erkennt er die Datei und bearbeitet sie, allerdings nicht "Perfekt"

    Auf der Seite "https://www.newocr.com/" funktioniert die erkennung Perfekt, allerdings ist die Online und muss Manuell gemacht werden.


    • Offizieller Beitrag

    An der Dateierstellungsgeschichte bin ich dran, versuch aber bis dahin mal ob du mit anderen Traineddatas für Tessereact ein besseres Ergebnis hinbekommst. Die Dateien bitte nacheinander (nicht gleichzeitig, oder den Dateinamen ändern da beide gleich heissen) entpacken und im EM-OCR Programmordner -> tesseract die Datei ablegen (im gleichen Ordner wie die alarm.traineddata). Danach im EM-OCR einfach das "alarm" in "deu" ändern bzw. in den Dateinamen der Datei die du gerade in den Ordner kopiert hast. Schau mal ob es damit besser wird. Bei mir klappt es mit beiden recht gut (bis auf Einsatzbeginn (Soll))

    Du benötigst die Datei für V3.02

    Hier -> deu.zip

    Hat bei mir allerdings schlechter als die "alarm" funktioniert...

    Ich hab dein Fax mal mit der deu getestet. Funktioniert damit deutlich besser

    Diese habe ich benutzt: deu.zip

    20182110122140.txt

  • An der Dateierstellungsgeschichte bin ich dran, versuch aber bis dahin mal ob du mit anderen Traineddatas für Tessereact ein besseres Ergebnis hinbekommst. Die Dateien bitte nacheinander (nicht gleichzeitig, oder den Dateinamen ändern da beide gleich heissen) entpacken und im EM-OCR Programmordner -> tesseract die Datei ablegen (im gleichen Ordner wie die alarm.traineddata). Danach im EM-OCR einfach das "alarm" in "deu" ändern bzw. in den Dateinamen der Datei die du gerade in den Ordner kopiert hast. Schau mal ob es damit besser wird. Bei mir klappt es mit beiden recht gut (bis auf Einsatzbeginn (Soll))

    Also mit der "deu"-Datei funktioniert es wesentlich besser. Das einzige was mir auffällt ist das er "Soll" nicht richtig erkennt. Er erkennt "So||". Was aber denke ich nicht weiter schlimm ist.

    Wird das mit der Dateierkennung jetzt noch funktionieren ist das erste Sahne :)

  • Hi zusammen, ich habe letzte Woche das Update auf die V1.0.28 gemacht. Seitdem wird bei uns das Abschlussfax wieder ausgedruckt. Im Log wird das Abschlussfax als solches erkannt und auch nicht weiter verarbeitet, allerdings wird die orginaldatei trotzdem gedruckt. Hab ich da irgendwo eine neu Einstellung übersehen?

    Ansonsten großes Lob! Das ganze läuft ansonsten absolut zuverlässig bei uns:thumbup:. Dankeschön

  • Hallo zusammen,

    erstmal danke für die tolle Software (sowohl EM als auch EM-OCR).

    Ich bin gerade am evaluieren, da ich unser AlarmWorkflow / RIS ablösen möchte.

    Wir bekommen nach der ZVEI Alarmierung ein Einsatzfax, das die ISDN Karte im Rechner entgegennimmt und als TIF speichert.

    Die Erkennung mit EM-OCR (Danke, danke, danke!!!) funktioniert bisher ganz gut. Eine Frage hätte ich dazu jedoch:

    Die Einsatzbeschreibung erfolgt bei unserem Fax am Ende der Seite (ILS Coburg). Etwa so:

    ———————- BEMERKUNG ————-

    Textzeile 1-n

    Und dann ist die Seite zu Ende.

    Kann ich dem Autoparser irgendwie sagen, dass er mir ab Bemerkung und vorzugsweise ohne die ganzen —-

    die Bemerkung mehrzeilig als Sachverhalt erkennt bis zum Ende der Seite?

    Genereller Verbesserungswunsch: Wenn mehr als 1 Minus-Zeichen in Folge kommt, wegtrimmen. Eines wäre ja z.B. Beim Straßennamen legitim...

    Danke!

    Andi

  • du kannst in den Input Einstellungen des EM-OCR die ersetzen funktion benutzen, einfach links -- eintragen und auf der Rechten Seite nichts;)

    • Offizieller Beitrag

    andi112

    Mach bei den Ausgabe-Einstellungen den Haken bei "Marker setzen" rein, dann wird an das Ende der übersetzten .txt Datei "---ENDE---" eingefügt. Das kannst du dann im AutoParser als "Lesen bis" angeben, dann liest er auch mehere Zeilen ein.

    Du kannst auch einfach bei "Suchbegriff" den ganzen Text z.B. "Bemerkung-----------------" angeben, dann liest er auch erst ab dem letzten "-" Zeichen. Dann sparst du dir die Suchen und Ersetzen Funktion. Sollte aber grundsätzlich beides funktionieren.

    • Offizieller Beitrag

    Zwibl

    Schau doch mal in die Druckeinstellungen. Dort sollte bei dir dann unter Identifier ein Text drin stehen, der nur im Alarmfax vorkommt. Alle anderen Faxe werden dann verworfen, oder über Drucker 2 (ohne Identifier) ausgedruckt...

  • Zwibl

    Schau doch mal in die Druckeinstellungen. Dort sollte bei dir dann unter Identifier ein Text drin stehen, der nur im Alarmfax vorkommt. Alle anderen Faxe werden dann verworfen, oder über Drucker 2 (ohne Identifier) ausgedruckt...

    Dankeschön für die schnelle Antwort, aber dann habe ich das gleiche Problem wie vor ein paar Monaten. Ich bräuchte einen Ausschluss. Abschluss und Alarmfax sind gleich, bis auf den Unterschied, dass beim ersten Abschlussfax im Header steht. Könntest du das vielleicht nochmals mit einbinden? Gruß Thomas