- Offizieller Beitrag
Die Ghostscript und Tesseract- Einstellungen sind dich als Standardwerte hinterlegt? Ebenso kann man sie mit einem Klick wieder herstellen? Was möchtest du denn beschrieben haben? Das Programm meckert doch wenn was fehlt.
Die Ghostscript und Tesseract- Einstellungen sind dich als Standardwerte hinterlegt? Ebenso kann man sie mit einem Klick wieder herstellen? Was möchtest du denn beschrieben haben? Das Programm meckert doch wenn was fehlt.
Ja aber selbst auf Standard Einstellungen kommen diese Meldungen.
Tesseract Meldungen:
Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/-psm.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Keine Ahnung was ich da machen muss
Failed loading language '-psm'
Tesseract couldn't load any languages!
Could not initialize tesserac
Habe alles normal installiert und dann nur die Ordner wie für pdf, archiv etc. zugeordnet.
Das ist doch nicht der Dateipfad zur tesseract.exe? Kontrollier deinen Pfad. Oder mach Screenshots von deinen Einstellungen und schick sie.
Ich habe im EM-OCR/ GostScript Tesseract Einstellung das bei Tesseract Einstellung eingegeben: -l deu --psm 6 --oem 0 -c page_separator=
habe aber auch die deu.trainedatta heruntergeladen.
Gruß
Jürgen
Er sagt ja das die -psm.traineddata fehlt.
Eingabe ist nicht bei den Ordnereinstellungen sondern bei den Einstellungen von GhostScript und Tesseract etwas weiter unten bei dem Menue Einstellungen.
Hoffe das hilft
Nur noch eine Sache, hast du die alarm.traineddata auch in den tessdata Ordner kopiert?
Ansonsten hab ich jetzt auch keine Idee mehr.
Welche Version von Tesseract hast du denn installiert? Die Standardwerte sind nämlich nicht für V4.x geeignet.
Ich habe generell das Gefühl das mir irgendwelche Dateien fehlen. Entweder meckert er wegen der alarm... Datei oder wegen der psm... Datei.
Habe die V4 installiert, gibt es irgendwo ein Tip Archiv wo alle benötigten Dateien drin sind?
Danke!
Wenn du auf Standardwerte gehst funktioniert psm nicht da müssen zwei "-" davor sein
Versuchs doch mal mit " -l alarm --psm 6 --oem 0 -c page_separator= " wenn du alarm hineinkopiert hast. Funktioniert so bei mir. Kannst aber auch das nach der 6 weg lassen geht auch bei mir.
Hab den ersten Post geändert und eine Installationsanleitung mit dazu geschrieben.
Alles anzeigenHallo,
Kann mir jemand sagen was hier falsch ist ?
Tesseract Meldungen:
Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/-psm.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language '-psm'
Tesseract couldn't load any languages!
Could not initialize tesserac
Failed loading language '-psm'
Da ist definitiv was bei dir falsch eingestellt im EM-OCR
so ein ähnliches Problem hatte ich auch beim Installieren von Tesseract V4.
Hast du bei der Installation irgendwelche Pakete mit installiert? Also etwas zusätzlich mit angehakt?
Wenn ja, installiere V4 ohne zusätzliche Optionen und lade dir die richtige "deu" einzeln herunter und schieb sie in den tessdata Ordner.
Die Standarparameter für 4.0 sollten wie folgt noch erweitert werden.
--oem 0 aktiviert die Legacy Engine analog wie 3.05
-c page_seperator stellt das korrekte Verhalten bei mehrseitigen Einsatzfaxen analog 3.05 sicher
Die Standarparameter für 4.0 sollten wie folgt noch erweitert werden.
--oem 0 aktiviert die Legacy Engine analog wie 3.05
-c page_seperator stellt das korrekte Verhalten bei mehrseitigen Einsatzfaxen analog 3.05 sicher
Wozu der Legacy-Mode wenn die "deu" von der V4 verwendet wird?
Ich konnte mit der Legacy Engine die besten Ergebnisse erzielen (~5sekunden). Die neue neuronale LSTM Engine war noch dazu sehr langsam.(~90sekunden)
Per Default —oem 3 wird anhand der vorhanden Traindata entschieden ob sie für die Legacy oder LSTM Engine sind.
*********UPDATE********* V2.0.08
-> Durch Code-Optimierung 1 FileSystemWatcher eingespart
-> Erweitertes Fehler-Logging
-> Input-Datei wird nach dem Kopiervorgang ins TEMP-Verzeichnis mit der Quelldatei gegengeprüft und bei Bedarf erneut kopiert.
@Markus82
Servus ihr beiden,
was ist dann jetzt eurer Meinung nach die idealste/beste/sinnvollste Einstellung?