Welche Version nutzt Ihr?
*********UPDATE********* V1.0.16
-> Funktion "Original behalten" hinzugefügt.
Ab der 16er sollte es eigentlich gehen. Siehe Post 125 und 126.
Gruß
Welche Version nutzt Ihr?
*********UPDATE********* V1.0.16
-> Funktion "Original behalten" hinzugefügt.
Ab der 16er sollte es eigentlich gehen. Siehe Post 125 und 126.
Gruß
Wir nutzen die V1.017.
Ok, "Original behalten" belässt die Datei auf dem Stick, das hatte ich gesehen und getestet. Dann nimmt EM-OCR automatisch die aktuelleste Datei zur Auswertung? Das wäre dann ja einfach
Wir nutzen diese Einstellung noch nicht weil wir die noch nicht per Mail weiterleiten. Daher kann ich zu dem Verhalten nix sagen. Sorry
Hallo Martin,
Ja, EM-OCR wertet immer die neueste Datei aus.
Einwandfrei! Und ich dachte es geht bei "Original behalten" nur um die originale Datei an sich....
Danke!
oder man lässt erstmal den EM_OCR auswerten und greift sich dann mit LogMon das Fax aus dem Archivordner ab.
Dann wäre sichergestellt das nicht zwei Programme zur gleichen Zeit auf das Fax zugreifen wollen.
Servus Stefan,
Besteht denn die Möglichkeit, dass man die Textersetzung um einen CSV-Import oder eine Begriffssuche aus einem CSV-File erweitert?
Mir reichen leider die 10 Felder lange nicht aus (Habe ~250 Strings in der CSV-Datei).
Habe mir zwar ein kleines Ersetzungstool geschrieben, das mit der CSV läuft, aber ich hätte das ganze lieber in einer Anwendung.
Danke!
MkG,
Stefan
Hallo Stefan,
die Textersetzung im Einsatzmonitor reicht dir nicht aus? Da gibt es nämlich bereits eine fertige Funktion. Die Ersetzung in EM-OCR ist eigentlich nur dafür gedacht, von Tesseract falsch erkannte Zeichen zu berichtigen...
Die Stichwortübersetzung hilft mir da nicht, da es sich bei der Ersetzung ums Schlagwort (bzw. eine Kurzinfo) handelt.
Mit der Textersetzung im Alarmablauf komme ich genauso wenig weiter, daher dachte ich, dass es am meisten Sinn machen würde, wenn die Übersetzung schon vor dem Alarmablauf stattfindet
Hallo Stefan,
sieh dir mal folgenden Thread an. Dies dürfte genau die Lösung deiner Frage sein.
Das habe ich gestern auch selbst ausprobiert und funktioniert wunderbar.
Grüße
Markus
hi,
folgendes Problem bei uns:
Die ausgegebende Datei wird immer wieder als .pdf abgespeichert und ohne Inhalt.
bzw es werden keine Daten in die .Txt Datei an EM weitergegeben.
04.03.2018 12:02:18 - Programmstart
04.03.2018 12:03:31 - Service gestartet
04.03.2018 12:03:50 - Service gestoppt
04.03.2018 12:03:50 - Autoparser aktiviert
04.03.2018 12:03:52 - Service gestartet
04.03.2018 12:04:15 - Datei erkannt
04.03.2018 12:04:17 - GhostScript:
GPL Ghostscript 9.22 (2017-10-04)
Copyright (C) 2017 Artifex Software, Inc. All rights reserved.
This software comes with NO WARRANTY: see the file PUBLIC for details.
Processing pages 1 through 2.
Page 1
Page 2
04.03.2018 12:04:17 - PDF verarbeitet
04.03.2018 12:04:38 - Tesseract:
Tesseract Open Source OCR Engine v3.02 with Leptonica
Page 1 of 2
Page 2 of 2
04.03.2018 12:04:38 - TIF verarbeitet
04.03.2018 12:04:38 - AutoParser gestartet ******************************************************
04.03.2018 12:04:38 - AutoParser beendet ********************************************************
04.03.2018 12:04:38 - Vorgang 20180404120416 beendet
Alles anzeigen
Also wir bekommen eine Mail mit PDF als Anhang, diese PDF besteht aus 2 Seiten, einmal die Depesche und einmal ein Kartenauschnitt.
EM-OCR ist an und wertet auch die Datei aus, allerdings wird im Archiv Ordner wieder eine PDF Datei abgespeichert und in dem .txt File, was dann an EM weiter gegeben wird, steht keine Information, sprich es hat keine Auswertung stattgefunden durch EM-OCR.
Die Eingangs-Datei wird nach Ablauf in den Archivordner verschoben, das soll so sein.
Du hast den AutoParser aktiviert, aber keine Suchbegriffe eingetragen, deshalb bekommst du ein "fast" leere Textdatei. Wenn du den AutoParser nicht benutzt, musst du ihn deaktivieren. Ansonsten trage bitte die entsprechenden Suchbegriffe ein. Vielleicht hilft dir auch mein Erklärungsvideo oben am TA?
Also ich hab das ganze jetzt am laufen, aber die PDF von uns wird extrem schlecht entschlüsselt. Also fast kein Zeichen wird richtig erkannt.
Ist das normal?
Benutz doch mal die deu traineddata für tesseract. Schau dir mal den Post von @Elchbier an, hier im Thread auf Seite 2.
Die Datei legst du im tesseract Ordner zu der „alarm“ Datei ab und änderst dann im EM-OCR die tesseract Einstellungen von „-alarm“ in „-deu“.
Sieht schon besser aus, aber mit den Daten im TXT kann dann EM trotzdem nichts anfangen, weil viele Buchstaben vertauscht sind
Dann versuch doch mal die deu vom letzten post auf der ersten Seite... Wenn das auch nicht besser wird, musst du wohl ne eigene traineddata erzeugen...
Servus zusammen,
ich möchte gerne EM-OCR nutzen.
Komme aber trotz der Super Youtube Anleitung nicht weiter.
Habe schon mehrere Installationen hinter mir.
Ich habe folgende Fehlermeldungen:
die Traindata Alarm und deu sind vorhanden
Was mir komisch vorkommt ist auch, das bei jeder Neuinstallation die Pfade schon vorgefüllt sind.
Vieleicht kann jemand helfen - Vielen Dank!
Hallo Flori,
das Problem hatten wir bereits, schau mal hier:
EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung
Hallo zusammen,
Idee/Wunsch: Originaldateiname des eingehenden PDFs beibehalten + angehängten aktuellen Timestamp.
Die EM-OCR Software funktioniert echt super und auch einfach zu bedienen.
Für Regressionstests beim EM-OCR und dem Einsatzmonitor verwende ich ein Set von ca. 50 Alarmfaxen.
Auf Grund dessen, dass der Bezug zum Original-PDF verloren geht macht es die Analyse etwas aufwendiger.
Nice to have
Grüße
Markus
Hallo Markus,
das ist leider aus programmtechnischen Gründen nicht möglich. Im Originaldateinamen könnten Sonderzeichen enthalten sein, die im späteren Programmverlauf zum Absturz führen könnten. Durch die Entfernung dessen wird daher ein möglicher Absturz verhindert.