EM-OCR EinsatzMonitor PDF-TIFF-TXT Fax Konverter mit Ordnerüberwachung

  • Gibt es eine Möglichkeit beim EM-ORC bei einer 2 seitigen PDF nur die 1. Seite auszulesen? Auf der 2. Seite befindet sich ein Übersichtskarte die jedoch bei der Auswertung sowieso nur Hieroglyphen ausgibt und das ganze sehr verlangsamt.

    EDIT: Habe die Lösung selbst gefunden: -sPageList= 1

    Nachteil wenn das Einsatzfax mal 2 Seiten mit Text-Daten haben sollte und die 3 Seite erst die Übersichtskarte ist dann wird trotzdem nur die 1. Seite ausgegeben. Da wäre es besser zeige alle Seiten außer die letzte.

    Dazu habe ich aber nichts gefunden.

  • Nachteil wenn das Einsatzfax mal 2 Seiten mit Text-Daten haben sollte und die 3 Seite erst die Übersichtskarte ist dann wird trotzdem nur die 1. Seite ausgegeben. Da wäre es besser zeige alle Seiten außer die letzte.

    Dazu habe ich aber nichts gefunden.

    Du kannst hier das Tool pdftk (PDFtk - The PDF Toolkit (pdflabs.com)) verwenden und die pdf dann vor der Verarbeitung damit anpassen.

    Um jeweils immer die letzte Seite zu entfernen benutzt du dann folgendes Kommando

    Code
    pdftk.exe "C:\dein\pdf\dokument.pdf" cat 1-r2 output "C:\dein\neues\pdf\dokument.pdf"
  • Hallo Zusammen,

    das mit dem EM-OCR läuft soweit durch erstellt auch die Dateien aber in der TIF Datei ist lediglich **Ende der Datei** drin.

    Hat jemand eine Idee an was das liegen kann?
    Hier habe ich mal das Logfile angehängt.


    Vielen Dank schon mal für eure Hilfe. :)

    11.08.2024 11:30:35 - Service starten...
    11.08.2024 11:30:35 - Service gestartet
    11.08.2024 11:30:39 - Datei C:\Alarm\20240811111725.pdf wurde erstellt
    11.08.2024 11:30:40 - Vorgang 20240811113040 gestartet
    11.08.2024 11:30:40 - PDF-Datei wird in TEMP-Verzeichnis kopiert
    11.08.2024 11:30:41 - Vergleiche Quell- und Zieldatei...
    11.08.2024 11:30:41 - Dateiprüfung abgeschlossen, alles OK!
    11.08.2024 11:30:41 - GhostScript starten...
    11.08.2024 11:30:41 - GhostScript Ausgabe:
    GPL Ghostscript 9.25 (2018-09-13)
    Copyright (C) 2018 Artifex Software, Inc. All rights reserved.
    This software comes with NO WARRANTY: see the file PUBLIC for details.
    Processing pages 1 through 1.
    Page 1

    11.08.2024 11:30:41 - GhostScript beendet
    11.08.2024 11:30:42 - Tesseract starten...
    11.08.2024 11:30:48 - Tesseract Meldungen:
    Tesseract Open Source OCR Engine v3.05.02 with Leptonica
    Page 1

    11.08.2024 11:30:48 - Tesseract beendet
    11.08.2024 11:30:48 - AutoParser gestartet ******************************************************
    11.08.2024 11:30:48 - AutoParser beendet ********************************************************
    11.08.2024 11:30:48 - TIF Datei archivieren
    11.08.2024 11:30:48 - PDF Datei archivieren
    11.08.2024 11:30:50 - Vorgang 20240811113040 beendet in
    10,9 s

    11.08.2024 11:31:25 - Service gestoppt


  • unter Systemeinstellungen ist der AutoParser aktiv oder? Wurden hierfür unter Einstellungen - AutoParser zuorgdnungen (Suchbegriff - lesen bis und EM-Datentyp) gemacht?


    alternativ würde ich mal den AutoParser ausschalten und schauen was rauskommt