Uso de archivos de idioma personalizados
Iron Tesseract OCR es totalmente compatible con idiomas y fuentes personalizados o descargados siguiendo el estándar de formato de archivo .traineddata de Tesseract.(versión 4 o superior). Estos archivos suelen encontrarse en[Github.com]().
Si desea formar su propio soporte de fuentes personalizado o paquete de idiomas, le recomendamos que lea nuestrotutorial sobre la creación de paquetes de idiomas tesseract personalizados.
Cómo utilizar los lenguajes de Tesseract para el OCR
- Instale una biblioteca OCR para elegir las opciones de Tesseract Language.
- Proporcione el archivo de idioma personalizado al utilizar
UseCustomTesseractLanguageFile
. - Crear un
OcrInput
utilizando la ruta de la imagen como parámetro. - Pase el
OcrInput
al objetoLeer
para leer el texto en el idioma.