Uso de archivos de idioma personalizados
Iron Tesseract OCR admite completamente idiomas y fuentes personalizados o descargados siguiendo el estándar de formato de archivo Tesseract .traineddata (versión 4 o superior). Puede encontrar tales archivos comúnmente en [Github.com]().
Si deseas entrenar tu propio soporte de fuentes personalizadas o paquete de idiomas, te recomendamos leer nuestro tutorial sobre cómo crear paquetes de idiomas personalizados de tesseract.
Cómo utilizar los lenguajes de Tesseract para el OCR
- Instale una biblioteca de OCR para elegir opciones de idioma de Tesseract.
- Proporcione el archivo de idioma personalizado mientras usa
UseCustomTesseractLanguageFile
. - Cree un objeto
OcrInput
usando la ruta de la imagen como parámetro. - Pase el objeto
OcrInput
al métodoRead
para leer el texto en el idioma.