VíDEOS

Cómo utilizar los paquetes de idiomas OCR en IronOCR

Kannaopat Udonpant
Kannapat Udonpant
10 de diciembre, 2023
Compartir:


En este tutorial, aprenderás a extraer texto de documentos PDF multilingües utilizando IronOCR en C#. El video guía el proceso de configuración de IronOCR e instalación de paquetes de idiomas adicionales, específicamente inglés y japonés. Verás cómo configurar el motor de OCR para soportar múltiples idiomas y aplicarlo a un PDF de muestra que incluye texto en inglés y japonés. El tutorial demuestra cómo inicializar el motor OCR, definir el archivo de entrada y extraer texto utilizando el método Read. El contenido extraído se guarda luego en un archivo .txt, con manejo de errores en caso de operaciones fallidas. Este es un gran ejemplo de cómo IronOCR admite el procesamiento global de documentos al reconocer múltiples idiomas en un solo escaneo. Ya sea que esté procesando formularios multilingües, documentos internacionales o PDFs de fuentes globales, esta guía muestra lo fácil que es obtener resultados de OCR precisos y conscientes del idioma en C#.

Lectura Adicional: Paquetes de Idiomas OCR Adicionales

Comience con IronOCR ahora.
green arrow pointer

Kannaopat Udonpant
Ingeniero de software
Antes de convertirse en ingeniero de software, Kannapat realizó un doctorado en Recursos Medioambientales en la Universidad de Hokkaido (Japón). Mientras cursaba su licenciatura, Kannapat también se convirtió en miembro del Laboratorio de Robótica Vehicular, que forma parte del Departamento de Ingeniería de Bioproducción. En 2022, aprovechó sus conocimientos de C# para unirse al equipo de ingeniería de Iron Software, donde se centra en IronPDF. Kannapat valora su trabajo porque aprende directamente del desarrollador que escribe la mayor parte del código utilizado en IronPDF. Además del aprendizaje entre iguales, Kannapat disfruta del aspecto social de trabajar en Iron Software. Cuando no está escribiendo código o documentación, Kannapat suele jugar con su PS5 o volver a ver The Last of Us.
< ANTERIOR
Por qué IronOCR es mejor que el paquete NuGet de Tesseract 4
SIGUIENTE >
Cómo utilizar varios idiomas con Tesseract