Hi,
meinst du die englische Datei? Eine andere finde ich in dem Ordner nicht.
Gegenüber dieser Version bekomme ich bei der von mir aktuell Eingesetzten Version leider schon deutlich bessere Ergebnisse.
Das ganze liegt vermute ich aber auch wirklich an der miserablen Qualität der Faxe. Die fettgedruckten Wörter haben teilweise keinen Abstand mehr zwischen den einzelnen Buchstaben, so dass Tesseract ganze Wörter als einen Buchstaben deutet.
Die von mir aktuell eingesetzte Version ist übrigens diese: https://github.com/UB-Mannheim/tesseract/wiki
Die könnte die Genauigkeit bei dir eventuell noch verbessern.