Benutzerdefinierte Sprachdateien verwenden
Iron Tesseract OCR unterstützt benutzerdefinierte oder heruntergeladene Sprachen und Schriftarten gemäß dem Tesseract .traineddata-Dateiformat(version 4 oder höher). Solche Dateien finden Sie in der Regel auf[Github.com]().
Wenn Sie Ihre eigene benutzerdefinierte Schriftartunterstützung oder Ihr eigenes Sprachpaket trainieren möchten, empfehlen wir Ihnen unseretutorial zur Erstellung eigener Tesseract-Sprachpakete.
Wie man Tesseract Languages für OCR verwendet
- Installieren Sie eine OCR-Bibliothek, um die Tesseract-Sprachoptionen auszuwählen.
- Geben Sie die benutzerdefinierte Sprachdatei bei der Verwendung von
UseCustomTesseractLanguageFile
. - Erstellen einer
OcrInput
objekt mit dem Bildpfad als Parameter. - Pass die
OcrInput
objekt zumLesen Sie
methode, um den Text in Sprache zu lesen.