Pruebas en un entorno real
Pruebe en producción sin marcas de agua.
Funciona donde lo necesites.
Si busca información sobre OCR, está en el lugar adecuado. Este blog tratará sobre el OCR y el software relacionado, y examinará su rendimiento cuando se aplican a tareas relacionadas con el OCR. Empecemos por la pregunta: ¿qué es el OCR?
Reconocimiento óptico de caracteres (OCR) utiliza un escáner óptico y software especializado para identificar y codificar digitalmente texto escrito o impreso. Un ordenador puede leer fotografías estáticas de texto y convertirlas en datos editables y buscables mediante un programa de OCR.
El OCR suele constar de tres pasos: abrir y escanear un documento en el software de OCR, reconocer el documento en el software de OCR y almacenar el documento producido por el OCR en el formato que elija.
Hoy hablaremos de dos paquetes de software OCR y compararemos sus pros y sus contras, además de cómo integrar y exportar su SDK en C#. Los paquetes de software objeto de debate son:
LEADTOOLS OCR procede de la galardonada línea de kits de herramientas de desarrollo desarrollados y publicados por LEAD Technologies Inc. LEADTOOLS es una colección de completos kits de herramientas para integrar imágenes ráster, documentales, médicas, multimedia y vectoriales en aplicaciones de escritorio, servidor, tableta y móvil. Formatos de archivo (150+)LEADTOOLS soporta compresión de imágenes, procesamiento de imágenes, conversión de color, procesamiento de color, visualización de imágenes, efectos especiales, escaneado/captura, diálogos comunes, impresión, DICOM, PACS, OCR, códigos de barras, reconocimiento de formularios, PDF, limpieza de documentos, anotaciones y mucho más. Millones de líneas de código están prácticamente al alcance de los desarrolladores de aplicaciones que utilizan un conjunto de herramientas LEADTOOLS. LEADTOOLS es un conjunto de herramientas creadas para proporcionarle la tecnología de imagen más potente disponible, independientemente de sus necesidades de programación.
LEADTOOLS es un completo conjunto de herramientas para integrar tecnologías de reconocimiento, documentación, médicas, de imagen y multimedia en sistemas de sobremesa, servidores, tabletas y móviles, impulsadas por algoritmos únicos de inteligencia artificial y aprendizaje automático. Para mejorar sus aplicaciones, aproveche los más de 30 años de conocimientos sobre desarrollo de imágenes y la compatibilidad con más de 150 tipos de archivos.
La biblioteca de clases OCR de LEADTOOLS proporciona software de programación para la incorporación rápida y eficaz del reconocimiento óptico de caracteres de documentos. (OCR) tecnología en programas informáticos. Los programadores pueden realizar el reconocimiento de caracteres en imágenes de documentos y enviar el texto reconocido a más de 20 formatos de archivo utilizando la biblioteca de clases OCR de LEADTOOLS.
El conjunto de herramientas Lead ofrece una galardonada línea de tecnologías multimedia para usuarios finales y desarrolladores, y es capaz de realizar todo tipo de funciones de OCR para satisfacer a su amplia gama de clientes.
El motor tecnológico Lead ofrece al usuario final compatibilidad con operaciones de OCR multihilo y basadas en servidor.
El SDK de documentos de LeadTools permite a los usuarios crear múltiples documentos OCR en su aplicación. Cada documento contiene su propia lista de páginas.
La galardonada línea de tecnologías LeadTools ofrece servicios en más de 40 idiomas diferentes, y le permite elegir qué idioma desea emplear al reconocer las páginas OCR.
LeadTools OCR es una impresionante aplicación de escáner de documentos que permite a su usuario final acceder a los diccionarios de todos los idiomas soportados. Además, los usuarios pueden acceder a más de un diccionario en un mismo documento.
Reconocer una variedad de documentos, incluidos facsímiles, fotocopias y documentos con diseños complejos.
Con mayor precisión y velocidad, la aplicación LEADTOOLS OCR puede llevar a cabo el reconocimiento óptico de caracteres (OCR) en imágenes, extraer texto de fotos y convertir imágenes a múltiples formatos de documento. Para modificar y compartir el texto de una imagen, utiliza el OCR para extraerlo y luego cópialo.
Lead Technologies utiliza la IA para mejorar el reconocimiento de documentos del mismo tipo, lo que supone una magnífica noticia para el usuario final.
El SDK de documentos de Leadtools, de la galardonada línea de kits de herramientas de OCR, utiliza un potente software de reconocimiento de zonas que lo lleva a un nivel completamente nuevo de reconocimiento de zonas.
Se trata de una API Web escalable y de gran capacidad. Su interfaz de fácil manejo le permite incorporar fácilmente potentes funciones de OCR, códigos de barras, MICR y conversión de documentos en cualquier programa.
Nota:
El sitio oficial de NuGet muestra hasta qué punto los desarrolladores de .NET prefieren IronOCR a LeadTools. LeadTools tiene 77,8 K descargas, pero por otro lado, IronOCR tiene más de 320 K descargas.
IronOCR es una biblioteca de software C# que permite a los programadores de la plataforma .NET detectar y leer texto de imágenes y documentos PDF. Es un paquete OCR .NET puro que utiliza el motor Tesseract más potente del mundo. IronOCR prospera cuando se trabaja con gráficos del mundo real y documentos defectuosos como fotos o procesamientos de baja resolución con ruido digital o defectos. Con poca o ninguna configuración, Tesseract 5 (así como 4 y 3) se ejecuta directamente en Windows, macOS, Linux, Azure, AWS, Lambda, Mono y Xamarin Mac. No hay binarios nativos con los que lidiar. Framework y Core son compatibles.
IronOCR es compatible con más idiomas que cualquier otro motor OCR del mercado, lo que ayuda a los programadores a crear imágenes con sentido y permite extraer de ellas datos multimedia. IronOCR admite 125 idiomas internacionales, pero sólo el inglés está instalado de serie en IronOCR .
El servicio proporcionado por el conjunto de herramientas IronOCR es fácil de integrar, fácil de procesar y más interactivo que cualquier otro motor de OCR. Ofrece soluciones a los desarrolladores .NET y les permite controlar y conectar con sus documentos digitalmente, así como manipularlos como mejor les parezca.
IronOCR ofrece un conjunto único de características y funciones para integrar, firmar, exportar, leer gráficos y extraer detalles de las imágenes, independientemente de la formación técnica de los usuarios o del nivel de sofisticación del hardware utilizado.
El SDK IronOCR lleva la precisión del trabajo a un nivel completamente nuevo para las bibliotecas de OCR, gracias a su tasa de precisión del 99,8% que supera significativamente a otras bibliotecas de OCR.
La clase IronOCR ofrece a los desarrolladores de C# un control granular. Proporcionan OCR (imágenes y PDF a texto) capacidad a sus desarrolladores y un rendimiento afinado en cada caso particular.
Trabajando con casos del mundo real, se puede alcanzar un equilibrio perfecto entre velocidad y precisión estableciendo variables. Limpiar ruido de fondo, Mejorar contraste, Mejorar resolución, Idioma, Estrategia, Girar y enderezar, Espacio de color, Detectar texto blanco en fondos oscuros y Tipo de imagen de entrada son sólo algunas de las opciones disponibles.
A continuación se muestran ejemplos del antes y el después de la reparación de escaneados de baja calidad:
Antes de
En
IronOCR ofrece soluciones en más de 125 idiomas internacionales para ayudar a los desarrolladores de todo el mundo.
Iron Tesseract puede leer diversos tipos de imágenes y archivos PDF. Con los motores Tesseract gratuitos tradicionales, esta función no es posible. Si los escaneados son de mala calidad, la entrada OCR permite reparar automáticamente las propiedades relevantes.
La clase OCRInput ofrece a los programadores de C# un control granular sobre la entrada. A continuación, los desarrolladores preprocesan la entrada de imágenes para aumentar la velocidad y la precisión. Esto elimina el método estándar de preparar las fotos para el OCR mediante secuencias de comandos por lotes de Photoshop o ImageMagick.
En términos de realizar OCR en una imagen con velocidad y precisión, IronOCR lo lleva a un nivel completamente nuevo. IronOCR permite a sus usuarios finales seleccionar un área o región específica de la imagen y realizar el OCR en esa región. La región se conoce como ContentAreas o CropAreas.
IronOCR devuelve un objeto de resultado avanzado por cada página que escanea utilizando Tesseract 3,4 ó 5. Contiene datos de ubicación, imágenes, texto, confianza estadística, opciones de símbolos alternativos, nombres de fuentes, decoración de tamaños de fuentes, pesos de fuentes y una posición para cada uno de los siguientes elementos:
IronOCR permite a los desarrolladores utilizar más de un lenguaje para un mismo documento. Esta función es de gran ayuda para los proveedores de servicios .NET.
Nota:
IronOCR forma parte de una línea de productos galardonada. Al ganar este premio, Iron Software demuestra que, efectivamente, ofrece una aplicación de escáner de documentos impresionante que proporciona un reconocimiento excelente, así como una excelente conversión y manipulación de documentos.
Abra el software Visual Studio, vaya al menú Archivo y seleccione Nuevo proyecto. A continuación, seleccione la aplicación de consola.
Introduzca el nombre del proyecto y seleccione la ruta en el cuadro de texto correspondiente. A continuación, haga clic en el botón Crear y seleccione el .NET Framework necesario, como se muestra en la siguiente captura de pantalla:
El proyecto de Visual Studio generará ahora la estructura para la aplicación seleccionada y, si ha seleccionado la aplicación de consola, Windows y web, abrirá ahora el archivo program.cs donde podrá introducir el código y compilar/ejecutar la aplicación.
A continuación, podemos añadir la biblioteca para probar el programa.
La biblioteca IronOCR puede descargarse e instalarse de cuatro maneras. Estos son:
Uso del gestor de paquetes NuGet de Visual Studio
Descarga directa desde la página web de NuGet.
Descarga directa desde la página web de IronOCR.
Puede integrar IronOCR en un proyecto C# utilizando el gestor de paquetes NuGet de Visual Studio.
Ampliar herramientas.
Ampliar el gestor de paquetes NuGet.
A continuación, aparecerá una nueva ventana en la barra de búsqueda: escriba IronOCR.
Utilizando este método, los desarrolladores pueden instalar la biblioteca IronOCR y cualquier paquete de idioma de su elección.
IronOCR puede descargarse directamente del sitio web de NuGet siguiendo estas instrucciones:
Navegue hasta el enlace "https://www.nuget.org/packages/IronOCR/"
Seleccione la opción de descarga de paquetes en el menú de la derecha.
Haga doble clic en el paquete descargado. Se instalará automáticamente.
Los desarrolladores pueden descargar la biblioteca IronOCR directamente del sitio web de IronOCR utilizando este enlace.
Haga clic con el botón derecho del ratón en el proyecto de la ventana de la solución.
A continuación, seleccione la opción Referencia y busque la ubicación de la referencia descargada.
En Visual Studio, vaya a Herramientas-> Gestor de paquetes NuGet -> Consola del gestor de paquetes
Introduzca la siguiente línea en la pestaña de la consola del gestor de paquetes:
Instalar el paquete IronOCR
El paquete se descargará/instalará en el proyecto actual y estará listo para su uso.
Los desarrolladores pueden descargar el SDK de LeadTools OCR de tres formas diferentes, como se muestra a continuación. Hablaremos de todos ellos.
Uso del gestor de paquetes NuGet de Visual Studio.
Uso del sitio web de NuGet.
Puede instalar LeadTools OCR en un proyecto C# utilizando el gestor de paquetes NuGet de Visual Studio:
Ampliar herramientas.
Ampliar el gestor de paquetes NuGet.
A continuación, aparecerá una nueva ventana; en la barra de búsqueda escriba LeadTools OCR.
Siguiendo estos pasos, los desarrolladores pueden instalar la biblioteca LeadTools OCR y cualquier paquete de idioma que elijan.
LeadTools OCR puede descargarse directamente del sitio web de NuGet siguiendo estas instrucciones:
Navegue hasta el enlace "https://www.nuget.org/packages/Leadtools.Ocr/"
Seleccione la opción de descarga de paquetes en el menú de la derecha.
Haga doble clic en el paquete descargado. Se instalará automáticamente.
Los desarrolladores pueden descargar directamente el SDK de documentos de Leadtools desde su sitio web sin ninguna molestia. Sólo tienes que ir a su sitio web y descargar uno de los paquetes que contienen la biblioteca OCR.
Ambos conjuntos de software analizados ofrecen servicios para motores de OCR multihilo. En este apartado analizaremos su rendimiento y velocidad.
LeadTools permite ejecutar más de una instancia de OCR a la vez, dependiendo de los núcleos físicos de cada sistema. Esta característica de Lead Technologies ahorra mucho tiempo a los desarrolladores .NET.
// Create an instance of an OCR document from the engine
IOcrDocument ocrDocument= ocrEngineInstance.DocumentManager.CreateDocument();
// Add page, zone them, recognize them and save them
// to the final document:
ocrDocument.Pages.AddPages(imageFileName, null);
ocrDocument.Recognize(null);
ocrDocument.Save(documentFileName, DocumentFormat.Pdf, null);
// Create an instance of an OCR document from the engine
IOcrDocument ocrDocument= ocrEngineInstance.DocumentManager.CreateDocument();
// Add page, zone them, recognize them and save them
// to the final document:
ocrDocument.Pages.AddPages(imageFileName, null);
ocrDocument.Recognize(null);
ocrDocument.Save(documentFileName, DocumentFormat.Pdf, null);
' Create an instance of an OCR document from the engine
Dim ocrDocument As IOcrDocument= ocrEngineInstance.DocumentManager.CreateDocument()
' Add page, zone them, recognize them and save them
' to the final document:
ocrDocument.Pages.AddPages(imageFileName, Nothing)
ocrDocument.Recognize(Nothing)
ocrDocument.Save(documentFileName, DocumentFormat.Pdf, Nothing)
Utilizar la función multihilo de IronOCR es bastante fácil y ahorra tiempo a los desarrolladores. Iron Tesseract intentará utilizar automáticamente todos los subprocesos disponibles en todos los núcleos y tendrá en cuenta la capacidad de respuesta del subproceso principal/GUI.
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.AddPdf("scan.pdf")
// Image processing is automatically multithreaded
Input.Deskew();
// OCR reading is automatically multi threaded too
var Result = Ocr.Read(Input);
}
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.AddPdf("scan.pdf")
// Image processing is automatically multithreaded
Input.Deskew();
// OCR reading is automatically multi threaded too
var Result = Ocr.Read(Input);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.AddPdf("scan.pdf") Input.Deskew()
' OCR reading is automatically multi threaded too
Dim Result = Ocr.Read(Input)
End Using
Crear fácilmente archivos PDF con capacidad de búsqueda es el sueño de todo desarrollador de C#. En esta sección analizaremos este proceso utilizando tanto el SDK IronOCR como el SDK OCR de Lead technologies.
La impresionante aplicación de escáner de documentos de IronOCR permite a los desarrolladores llevar la creación de PDF con capacidad de búsqueda a un nivel completamente nuevo, ya que ofrece soporte para detectar caracteres de texto en imágenes y convertirlos en texto PDF significativo. A continuación se muestra un ejemplo de código para usuarios:
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.Add(@"images\page1.png")
Input.Add(@"images\page2.bmp")
Input.Add(@"images\page3.tiff")
Input.Deskew();
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.Add(@"images\page1.png")
Input.Add(@"images\page2.bmp")
Input.Add(@"images\page3.tiff")
Input.Deskew();
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.Add("images\page1.png") Input.Add("images\page2.bmp") Input.Add("images\page3.tiff") Input.Deskew()
Dim Result = Ocr.Read(Input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
Lead Technologies ofrece una impresionante aplicación de escáner de documentos de su galardonada línea de software. Sin embargo, para el usuario final, el código es un poco más complicado que el utilizado para IronOCR.
private void saveAsSearchablePDFToolStripMenuItem_Click(object sender, EventArgs e)
{
try
{
// Create a document
using (IOcrDocument ocrDocument = _ocrEngine.DocumentManager.CreateDocument(null, OcrCreateDocumentOptions.AutoDeleteFile))
{
// Create IOcrPage from loaded image
_ocrPage = _ocrEngine.CreatePage(_viewer.Image, OcrImageSharingMode.AutoDispose);
// Recognize Text
_ocrPage.Recognize(null);
// Add the page
ocrDocument.Pages.Add(_ocrPage);
// Save page as documentation
SaveFileDialog saveDlg = new SaveFileDialog();
saveDlg.InitialDirectory = @"C:\LEADTOOLS22\Resources\Images";
saveDlg.Filter = "Adobe Portable Document Format
*.pdf";
if (saveDlg.ShowDialog(this) != DialogResult.OK)
return;
ocrDocument.Save(saveDlg.FileName, DocumentFormat.Pdf, null);
MessageBox.Show($"OCR output saved to {saveDlg.FileName}");
}
}
catch (Exception ex)
{
MessageBox.Show(ex.ToString());
}
}
private void saveAsSearchablePDFToolStripMenuItem_Click(object sender, EventArgs e)
{
try
{
// Create a document
using (IOcrDocument ocrDocument = _ocrEngine.DocumentManager.CreateDocument(null, OcrCreateDocumentOptions.AutoDeleteFile))
{
// Create IOcrPage from loaded image
_ocrPage = _ocrEngine.CreatePage(_viewer.Image, OcrImageSharingMode.AutoDispose);
// Recognize Text
_ocrPage.Recognize(null);
// Add the page
ocrDocument.Pages.Add(_ocrPage);
// Save page as documentation
SaveFileDialog saveDlg = new SaveFileDialog();
saveDlg.InitialDirectory = @"C:\LEADTOOLS22\Resources\Images";
saveDlg.Filter = "Adobe Portable Document Format
*.pdf";
if (saveDlg.ShowDialog(this) != DialogResult.OK)
return;
ocrDocument.Save(saveDlg.FileName, DocumentFormat.Pdf, null);
MessageBox.Show($"OCR output saved to {saveDlg.FileName}");
}
}
catch (Exception ex)
{
MessageBox.Show(ex.ToString());
}
}
IRON VB CONVERTER ERROR developers@ironsoftware.com
Esta sección trata de los servicios que ofrecen estos paquetes de software para dar soporte a diferentes plataformas. Ambos paquetes de software son compatibles con numerosas plataformas y sistemas operativos.
El SDK .NET de IronOCR es el mejor SDK de OCR compatible con casi todas las plataformas .NET y sistemas operativos que admiten el lenguaje de programación C#. IronOCR también es compatible con distintos formatos de imagen, como JPEG, JPG, tiff y muchos más.
VB.NET
Docker (Windows, Linux, Azure)
Lead Technologies también ofrece asistencia para la integración de sus diversos productos y aplicaciones en distintas plataformas. Lead Technologies también ofrece un excelente soporte SDK para sus usuarios y desarrolladores.
.NET
* C#, VB, C++/CLI, XAML
Android
Se necesitan licencias para utilizar cualquiera de los programas informáticos mencionados. Ambos conjuntos de software requieren la posesión de licencias antes de iniciar sesión en el entorno. Una vez que hayas iniciado sesión, sólo entonces podrás empezar a acceder a todo su nuevo nivel de tecnologías de software.
LeadTools proporciona dos (2) componentes clave de la licencia del SDK:
Para desarrollar con LEADTOOLS, necesitará una Licencia de Desarrollo. La licencia de desarrollo puede adquirirse directamente a LEAD o a través de un revendedor o distribuidor autorizado por LEAD.
La licencia de desarrollo permite a un cliente instalar el SDK en un equipo de desarrollo y utilizarlo para crear una aplicación de usuario final mediante la inclusión de bibliotecas y archivos redistribuibles específicos en la aplicación utilizando el código de muestra y la documentación del SDK.
El uso por parte del cliente de la aplicación de usuario final desarrollada mediante el SDK. ("Software de usuario final") se rige por la Licencia de Despliegue.
A diferencia de un acuerdo de licencia de aplicación de usuario final estándar, que prohíbe cualquier copia de la aplicación, una licencia SDK permite al usuario copiar y redistribuir una parte del SDK. Para reproducir la propiedad intelectual de LEAD y desplegarla con software de usuario final producido utilizando el SDK de LEAD, los clientes de LEAD deben obtener la licencia de despliegue necesaria.
LeadTools no proporciona licencias gratuitas a sus desarrolladores. En su lugar, ofrece licencias completas basadas en el desarrollador. Para ver la estructura de precios de Lead Technologies OCR SDK, visite aquí.
IronOCR es una biblioteca que ofrece gratuitamente una licencia para desarrolladores. IronPDF también tiene una estructura de precios distinta; el paquete Lite cuesta a partir de $599 sin cargos ocultos. También es posible la redistribución de productos SaaS y OEM. Todas las licencias incluyen una garantía de devolución del dinero de 30 días, un año de soporte y actualizaciones del software, validez para desarrollo/establecimiento/producción y una licencia perpetua. (compra única). Para ver toda la estructura de precios de IronOCR y los detalles de las licencias, vaya aquí.
Puede obtener el servicio de redistribución de productos SaaS y OEM sin derechos de autor por sólo 1599 $ en una única compra.
IronOCR es una biblioteca SDK .NET que utiliza el motor Tesseract más potente del mundo, llamado Iron Tesseract. Admite más de 125 idiomas internacionales. IronOCR es una aplicación de escáner de documentos impresionante con un montón de características de imagen como OCR región de una imagen, la extracción de texto de imágenes, la fijación de una imagen de baja resolución y la realización de OCR en una región específica de una imagen , y muchas otras características relacionadas. IronOCR se centra en proporcionar velocidad con precisión, y su tasa de precisión del 99,8% es superior a cualquier otro OCR Tesseract por ahí. IronOCR funciona nada más sacarlo de la caja, sin necesidad de ajustar el rendimiento ni modificar en profundidad las imágenes de entrada. Además, siempre puedes conseguir los cinco productos de Iron Software por el precio de sólo dos. Haga clic aquí para ver la página web.
IronPDF
IronOCR
IronXL
Código de barras de hierro
IronWebscraper
LeadTools OCR es un conjunto de herramientas de LeadTools que proporciona la mayoría de las funciones de reconocimiento de forma rápida y eficaz. Los programadores pueden realizar el reconocimiento de caracteres en imágenes de documentos y enviar el texto reconocido a más de 20 formatos de archivo utilizando la biblioteca de clases OCR de LEADTOOLS. Su biblioteca puede integrarse con la mayoría de los lenguajes de programación y casi todas las plataformas disponibles en el mercado. Entre sus características se incluyen:
IronOCR y LeadTools OCR son herramientas de primera línea y ofrecen todas las funciones que un desarrollador de C# o .NET podría desear. IronOCR es más fácil de usar y codificar que su competidor. Ambos conjuntos de software no incurren en costes continuos, pero IronOCR es mucho más económico que LeadTools OCR Library. IronOCR proporciona más precisión que cualquiera de sus competidores. IronOCR ofrece compatibilidad internacional con más de 125 idiomas. Por otro lado, LeadTools sólo ofrece soporte para más de 40 idiomas. Teniendo en cuenta los diversos aspectos del rendimiento, la única conclusión que podemos extraer es que IronOCR presenta ventajas significativas sobre LeadTools OCR.
9 productos API .NET para sus documentos de oficina