Benutzerdefinierte Sprachdateien verwenden
Iron Tesseract OCR unterstützt vollständig benutzerdefinierte oder heruntergeladene Sprachen und Schriftarten entsprechend dem Tesseract .traineddata-Dateiformatstandard (Version 4 oder höher). Solche Dateien finden Sie häufig auf [Github.com]().
Wenn Sie Ihre eigene benutzerdefinierte Schriftartunterstützung oder Sprachpaket trainieren möchten, empfehlen wir Ihnen, unser Tutorial zum Erstellen benutzerdefinierter Tesseract-Sprachpakete zu lesen.
Wie man Tesseract Languages für OCR verwendet
- Installieren Sie eine OCR-Bibliothek, um Tesseract-Sprachoptionen auszuwählen.
- Stellen Sie die benutzerdefinierte Sprachdatei bereit, während Sie
UseCustomTesseractLanguageFile
verwenden. - Erstellen Sie ein
OcrInput
-Objekt unter Verwendung des Bildpfads als Parameter. - Übergeben Sie das
OcrInput
-Objekt an dieRead
-Methode, um den Text in der Sprache zu lesen.