Tesseract 5 para .NET
Con los documentos digitales siendo el estándar en las empresas modernas y los negocios internacionales, contar con un motor OCR que represente y extraiga idiomas internacionales es un componente clave para el éxito en la manipulación de documentos.
Tesseract 5 es la biblioteca más avanzada conocida en cualquier idioma en la actualidad. Sin embargo, tiene algunas desventajas: no se implementa fácilmente y se puede considerar difícil de usar debido a la mayor barrera de entrada.
Sin embargo, IronOCR cierra esa brecha, permitiendo a los desarrolladores, tanto principiantes como veteranos, utilizar Tesseract 5 en una biblioteca sencilla. Además, IronOCR es la única biblioteca .NET conocida para Tesseract 5 OCR, con compatibilidad cruzada para .NET Framework, Standard, Core, Xamarin y Mono.
Puede descargar un proyecto de archivo desde aquíenlace.
Código de 5 pasos para usar Tesseract 5
var ocrTesseract = new IronTesseract();
usando var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\image.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
Esta línea inicializa una instancia de IronTesseract, una clase proporcionada por la biblioteca IronOCR. El nuevo objeto, ocrTesseract, realizará el reconocimiento óptico de caracteres(OCR)en imágenes.
A continuación, se crea un objeto OcrInput, ocrInput, para contener la imagen o las imágenes para el procesamiento OCR. La palabra clave using garantiza que ocrInput se elimine automáticamente cuando ya no se necesite, conservando los recursos.
Esta línea carga un archivo de imagen en "images\image.png" en ocrInput. Esta imagen será el objetivo para el procesamiento OCR.
Aquí se realiza la operación de OCR. El método Read
de ocrTesseract procesa la imagen cargada en ocrInput y devuelve un objeto OcrResult, ocrResult, que contiene el texto reconocido.
Finalmente, esta línea imprime el texto extraído en la consola accediendo a la propiedad Text de ocrResult. Haga clic aquí para ver la Guía de Cómo Hacer, que incluye ejemplos, código de muestra y archivos.