Utilisation de fichiers de langues personnalisés
Iron Tesseract OCR prend entièrement en charge les langues et polices personnalisées ou téléchargées conformément à la norme de format de fichier Tesseract .traineddata (version 4 ou supérieure). Vous pouvez trouver couramment de tels fichiers sur [Github.com]().
Si vous souhaitez entraîner votre propre prise en charge de police personnalisée ou pack linguistique, nous vous recommandons de lire notre tutoriel sur la création de packs linguistiques personnalisés pour Tesseract.
Comment utiliser les langues de Tesseract pour l'OCR ?
- Installez une bibliothèque OCR pour choisir les options de langue Tesseract.
- Fournissez le fichier de langue personnalisé en utilisant
UseCustomTesseractLanguageFile
. - Créez un objet
OcrInput
en utilisant le chemin de l'image comme paramètre. - Transmettez l'objet
OcrInput
à la méthodeRead
pour lire le texte en langue.