Una comparación entre el software de OCR de Iris e IronOCR
OCR - El reconocimiento óptico de caracteres permite la detección de texto dentro de archivos digitales. Los documentos en papel escaneados siempre se guardan como archivos de imagen por la computadora. Los datos en estos archivos de imagen no se pueden buscar, editar o guardar en formato de texto usando un editor de texto normal o incluso una aplicación de procesamiento de textos. El procesamiento de OCR ayuda a convertir estas imágenes en texto legible por máquina para su posterior procesamiento por parte de sus usuarios.
En esta era moderna, los documentos compartidos a través de Internet están en formato digital y generalmente en forma de PDFs o imágenes. Hay un montón de recursos en línea disponibles que convierten la imagen en texto. Sin embargo, la mayoría de las empresas requieren esta funcionalidad en sus aplicaciones de software. Teniendo esto en cuenta, hay muchas bibliotecas que proporcionan soluciones OCR para ser integradas en aplicaciones de software.
En este artículo, vamos a comparar dos de las tecnologías OCR más populares para C#:
- IronOCR
- Software Iris OCR
IronOCR
IronOCR para .NET es una biblioteca de C# para escanear, buscar y leer imágenes y PDFs. Toma un archivo de imagen o PDF como entrada y utiliza la última versión personalizada del motor de OCR Tesseract 5 .NET para producir texto, datos estructurados o documentos PDF buscables. Su Tesseract está disponible en más de 125 idiomas junto con soporte multiplataforma en .NET Core, Standard, desde la 2.0 hasta la 7.
IronOCR es una API fácil de usar que permite a los desarrolladores de C# convertir imágenes a texto automáticamente, simplemente utilizando la clase IronTesseract. Prioriza la velocidad, precisión y facilidad de uso. También ayuda a la API de visión por computadora a encontrar texto con un conjunto de modelos entrenados.
Otra función poderosa de IronOCR es que puede escanear códigos de barras y códigos QR de todos los archivos de imagen y leer su texto. Otras características importantes de IronOCR se enumeran a continuación.
Características
- Idiomas Internacionales: Soporte para más de 125 idiomas y personalizados con rendimiento de alta calidad y rapidez.
- Lectura de Texto y Código de Barras: Leer texto y números de varios idiomas a la vez.
- Documentos Especialistas: Leer texto específicamente de recibos, cheques, facturas.
- Leer de muchos formatos: Imágenes (PNG, JPG, GIF, TIFF, BMP), objetos
System.Drawing, flujos y documentos PDF (objetivo optimizado para DPI). - Filtros: Asistente de filtros, corrección de imágenes, corregir la orientación de la imagen, corregir los colores de la imagen.
- Salida de Datos Sencilla: Cadenas de texto de .NET, datos de código de barras y QR, imágenes.
Software de reconocimiento óptico de caracteres (OCR) Iris
Iris OCR SDK es un conjunto de herramientas modulares de software que permite que tus aplicaciones conviertan texto de imágenes en archivos editables y brinden otros servicios de reconocimiento de texto. Es el OCR profesional más rápido con alto rendimiento y precisión. Con la tecnología de reconocimiento Iris, obtienes las técnicas más avanzadas para el reconocimiento óptico de caracteres que incluyen escaneo de vanguardia, clasificación de documentos basada en IA, integridad de datos y extracción de datos.
Iris OCR es un SDK rico en funciones que también proporciona herramientas potentes de limpieza de imágenes para mejorar las imágenes. Puede integrarse fácilmente con aplicaciones de software C++, C#, J# y VB.NET. IrisOCR ofrece soporte a largo plazo y está diseñado para ser utilizado multiplataforma. También admite aplicaciones OEM y SaaS. Iris OCR ayuda a las empresas con una solución global con precios flexibles.
Características
- Formatos de Entrada: Imagen (JPG, PNG, BMP, TIFF), PDF (imagen, texto).
- Preprocesamiento: Mejora de imágenes, limpieza de formularios, corrección de la perspectiva, evaluación de calidad.
- Reconocimiento de Texto: Reconocer texto en más de 137 idiomas diferentes (Europeo, Asiático, Medio Oriente, Formato específico).
- Reconocimiento de Código de Barras: Reconocimiento de códigos de barras 1D y 2D (PDF417, código QR, Código 39, UPC, etc.).
- Formato de Salida: Office (DOCX, XLSX, PPT, RTF), PDF (imagen o PDF legible), formatos de imagen (JPG, PNG, BMP, TIFF), HTML, XML, TXT.
Instalación
Creación de un proyecto de Visual Studio
En este tutorial, vamos a usar la última versión de Visual Studio 2022. Entonces, asumo que ya lo has descargado e instalado para C#. Si no es así, puedes descargarlo desde el sitio web de Visual Studio.
Ahora, necesitamos crear un proyecto de consola para comenzar con ambas bibliotecas. Sigue los pasos para crear un proyecto:
- Abre tu Visual Studio 2022.
- Haz clic en Crear un Nuevo Proyecto.

- Selecciona Aplicación de Consola C# de las opciones dadas y haz clic en Siguiente.

- Configura tu nuevo proyecto con un nombre y ubicación. Por ejemplo, "OCRProject".

- Para información adicional, selecciona el Marco .NET 6.0 ya que es la versión más estable.

- Ahora, haz clic en Crear y el proyecto se creará en tu ubicación especificada.
Instalación de IronOCR
Hay múltiples formas de instalar la biblioteca IronOCR.
1. Uso del Administrador de paquetes NuGet de Visual Studio
NuGet es el gestor de paquetes para descargar e instalar dependencias en tu proyecto. Sus paquetes contienen código compilado (DLL) y el archivo de manifiesto. Accede a él usando el siguiente método:
- Haz clic en la pestaña Herramientas.
- Extiende la opción del Administrador de Paquetes NuGet.
- Haz clic en Administrar Paquetes NuGet para Soluciones.

- o, haz clic derecho en el Explorador de Soluciones.
- Haz clic en Administrar paquetes NuGet.

Ahora se abrirá la ventana del Gestor de Paquetes NuGet. Busca IronOCR y haz clic en Instalar.

2. Descargar desde el sitio web de NuGet
Se puede descargar directamente desde el sitio web oficial de NuGet.
- Visita el sitio web de NuGet.
- Haz clic en la opción de descargar paquete en el lado derecho de la página.
- Abre el paquete descargado y comenzará a instalarse.
- Finalmente, recarga la solución y ya está.
3. Descargar usando la página web de IronOCR
Simplemente visita el sitio web de Iron Software y navega a la página web de IronOCR para .NET. Desplázate hasta el final y haz clic en Descargar DLL o Descarga el instalador de Windows.

Se descarga un archivo zip. Extrae tu archivo de proyecto o ejecuta el instalador de Windows. Sigue los pasos a continuación para agregarlo a tu proyecto.
- Haz clic derecho en las dependencias del proyecto en Visual Studio desde el explorador de soluciones.
- Luego, selecciona la opción Agregar Referencia al Proyecto.
- Navega hasta la ubicación del archivo DLL descargado.
- Finalmente, haz clic en OK para agregar una referencia al proyecto.
4. Uso del símbolo del sistema en Visual Studio
- Navega a la pestaña Herramientas en Visual Studio.
- Extiende la opción Gestor de Paquetes NuGet.
Selecciona Consola del Gestor de Paquetes y escribe el siguiente comando:
Install-Package IronOcr
Esto descargará e instalará automáticamente IronOCR en tu proyecto.
5. Agregar espacios de nombres IronOCR necesarios
Solo hay un espacio de nombres necesario, que debe agregarse en la parte superior del archivo de código fuente donde necesitamos acceder a sus funciones.
using IronOcr;using IronOcr;Imports IronOcrAhora estamos listos para usar IronOCR en nuestro proyecto.
Instalación de Iris OCR
Hay muchas maneras de usar Iris OCR. Si buscas una solución para una pequeña empresa u oficina, puedes usar la aplicación OCR. El software puede descargarse desde este enlace.
Si estás buscando soluciones para medianas y grandes empresas, entonces debes contactar al equipo de Iris para obtener una cotización de acuerdo a tus necesidades. Los SDKs y otra documentación solo están disponibles para los clientes registrados. Para usar el SDK en un entorno de desarrollo, necesitas solicitar acceso usando este formulario.
Aquí vamos a usar el Software Iris 17 OCR para propósitos de comparación. Proporciona todas las funcionalidades a nivel base y puede ser utilizado en comparación a IronOCR. Los siguientes pasos te ayudarán a descargar e instalar el software Iris OCR:
- Una vez descargado el software, haz doble clic para abrir el asistente de instalación.

- Haz clic en Siguiente y elige el modo de instalación.
- Luego, selecciona los idiomas de los cuales deseas leer texto.

- Haz clic en siguiente e instala Iris OCR.

- Ahora el software comenzará a instalarse. Después de la instalación, haz clic en finalizar y abre el Software Iris OCR.

¡Todo listo! Ahora sigamos con la comparación en sí.
Comparación
1. Imágenes a texto
Leer datos de imágenes es una tarea bastante tediosa. La resolución y calidad de las imágenes desempeñan un papel importante al extraer contenido. Ambas bibliotecas proporcionan funcionalidad de reconocimiento óptico de caracteres para extraer texto de imágenes.
1.1. Uso de IronOCR
IronOCR hace que sea muy fácil para los desarrolladores leer el contenido de un archivo de imagen con su poderosa clase IronTessaract. Aquí usaremos una imagen PNG para leer texto de un archivo de imagen y el código es el siguiente:
var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
// Add the image from which you want to extract text
Input.AddImage("test-files/employmentapp.png");
// Perform OCR to read the text
var Result = OCR.Read(Input);
// Output the extracted text to the console
Console.WriteLine(Result.Text);
}var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
// Add the image from which you want to extract text
Input.AddImage("test-files/employmentapp.png");
// Perform OCR to read the text
var Result = OCR.Read(Input);
// Output the extracted text to the console
Console.WriteLine(Result.Text);
}Dim OCR = New IronTesseract()
' We use a using statement to ensure resources are freed after use
Using Input = New OcrInput()
' Add the image from which you want to extract text
Input.AddImage("test-files/employmentapp.png")
' Perform OCR to read the text
Dim Result = OCR.Read(Input)
' Output the extracted text to the console
Console.WriteLine(Result.Text)
End UsingIMAGEN DE ENTRADA

PRODUCCIÓN

La salida de IronOCR coincide con la imagen original proporcionada. El código es limpio y fácil de entender sin complicaciones técnicas.
1.2. Uso del OCR Iris
El software Iris OCR permite que todos tus documentos en papel sean escaneados y utilizados para el reconocimiento de texto. La extracción de texto es muy simple usando la tecnología de Iris OCR. Selecciona un archivo de imagen desde el "Desde Archivo" en la pestaña del menú Inicio. La misma imagen se usa para probar y comparar los resultados de los dos software.

Puedes aplicar corrección de imagen a la imagen cargada. En la pestaña de archivo de salida, puedes elegir cualquier formato como tu salida. Proporciona múltiples formatos de salida como Word, Excel, PDF, archivos de texto, etc. Simplemente guarda el archivo en cualquier formato y ábrelo para ver el texto extraído.
PRODUCCIÓN

Puedes ver que hay una clara diferencia en los resultados de los dos software. IronOCR extrajo el texto exacto de la imagen junto con el formato. Mientras que, Iris OCR preservó el formato pero el nombre completo y el número de teléfono están desordenados.
2. Código de barras y código QR a texto
2.1. Uso de IronOCR
IronOCR proporciona una característica única y útil al leer imágenes, es decir, puede leer códigos de barras y códigos QR. Puede detectar códigos de barras y mostrar su valor con facilidad.
Para hacerlo, establece la configuración de lectura de código de barras en verdadero y luego itera a través de cada uno de los códigos de barras en los resultados OCR. El código para leer códigos de barras se da a continuación:
var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
// Add the image to be processed
input.AddImage("test-files/Barcode.png");
// Read the OCR result
var Result = OCR.Read(input);
// Iterate through the barcodes detected and display their values
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
}
}var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
// Add the image to be processed
input.AddImage("test-files/Barcode.png");
// Read the OCR result
var Result = OCR.Read(input);
// Iterate through the barcodes detected and display their values
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
}
}Dim OCR = New IronTesseract()
OCR.Configuration.ReadBarCodes = True
' Using statement to automatically dispose of resources
Using input = New OcrInput()
' Add the image to be processed
input.AddImage("test-files/Barcode.png")
' Read the OCR result
Dim Result = OCR.Read(input)
' Iterate through the barcodes detected and display their values
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
Next Barcode
End UsingIMAGEN DE ENTRADA

PRODUCCIÓN

Los tres códigos de barras de la imagen de entrada se leen con éxito, y su texto oculto se muestra.
2.2. Uso del OCR Iris
Iris OCR también proporciona la facilidad de extraer los datos de códigos de barras de imágenes o archivos PDF. Para los códigos de barras, debemos seleccionar manualmente el área a detectar. Muévete a la pestaña de zonas y selecciona el código de barras para ser reconocido.
Haz clic derecho en la región seleccionada y cópiala como datos, luego guárdala en un archivo de procesamiento de texto para ver los datos.

En este caso, el software Iris OCR no puede detectar el texto oculto detrás de los códigos de barras dados en la imagen.
3. PDF a texto
3.1. Uso de IronOCR
Leer archivos PDF es tan fácil como leer imágenes en IronOCR. Solo necesitas cambiar el método AddImage a AddPdf en el código de lectura de imagen. El código es el siguiente:
var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
// Add the PDF file to be processed
Input.AddPdf("test-files/example.pdf");
// Get the OCR results
var Result = OCR.Read(Input);
// Output the extracted text
Console.WriteLine(Result.Text);
}var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
// Add the PDF file to be processed
Input.AddPdf("test-files/example.pdf");
// Get the OCR results
var Result = OCR.Read(Input);
// Output the extracted text
Console.WriteLine(Result.Text);
}Dim OCR = New IronTesseract()
' Using statement for resource management
Using Input = New OcrInput()
' Add the PDF file to be processed
Input.AddPdf("test-files/example.pdf")
' Get the OCR results
Dim Result = OCR.Read(Input)
' Output the extracted text
Console.WriteLine(Result.Text)
End UsingPRODUCCIÓN
El texto extraído tiene el mismo formato que el archivo PDF.

3.2. Uso del OCR Iris
Leer archivos PDF es también muy fácil usando el software Iris. Admite todos los formatos digitales y PDF es uno de ellos. También puedes crear formatos legibles usando el software Iris OCR. PDF es un documento en papel y cada página se trata como un archivo de imagen separado. Abre documentos en papel usando la opción Desde Archivo. Selecciona el rango de páginas del que deseas extraer texto y guárdalo en cualquier formato editable de tu elección de las opciones dadas.

PRODUCCIÓN

Licencias
IronOCR es gratuito para fines de desarrollo, pero necesita licenciarse para uso comercial. También ofrece una prueba gratuita para probar todo su potencial para tus necesidades. El paquete lite comienza a partir de $799 con una garantía de devolución de dinero de 30 días. IronOCR proporciona 1 año de soporte del producto y actualizaciones de forma gratuita y luego $399 al año después. Todas las licencias son perpetuas, lo que significa que solo son compras únicas y sin cargos ocultos. También puedes elegir cobertura de redistribución libre de regalías para productos SaaS y OEM por solo una compra única de $1999. Para obtener más información sobre paquetes de licencias y planes de precios, visite aquí.

Iris es una solución OCR con una versión gratuita de 10 días disponible como prueba. Su versión pro comienza a partir de $99 y la versión corporativa comienza a partir de $199. Para usar su SDK en modo de producción, necesitamos obtener una cotización de su representante de ventas. Si deseas licenciarlo para desarrollo en C# o en cualquier otro lenguaje, obtén una cotización desde aquí. Más información y comparación entre las versiones pro y corporativas puede consultarse aquí.

Conclusión

IronOCR proporciona a los desarrolladores de C# la API de Tesseract más avanzada que conocemos, en cualquier plataforma. IronOCR puede ser implementado en Windows, Linux, Mac, Azure, AWS y Lambda, y admite proyectos de .NET Framework así como .NET Standard y .NET Core. También podemos leer códigos de barras en escanear OCR e incluso exportar nuestro OCR como HTML y PDFs buscables.
El software Iris OCR se construye con capacidades de IA y es compatible con Windows y Mac. Su SDK está disponible para múltiples lenguajes de programación. Iris Pro viene con las capacidades del SDK de Iris OCR para Windows y Mac como una aplicación GUI. Puedes leer texto de imágenes y PDFs y exportarlos en otros formatos. También puedes personalizar todos tus documentos en papel usando el software Iris con solo unos clics.
Las licencias de AWS Textract se basan en el número de páginas del documento para extraer información y analizar los datos. Las licencias de desarrollo de Iris OCR no se publican en el sitio web de Iris. Debes solicitar una cotización para obtener información sobre licencias. Además, la licencia de IronOCR es una compra única y puede usarse de por vida.
En general, ambos software proporcionan casi toda la funcionalidad OCR con tecnología de IA, pero IronOCR tiene una ligera ventaja sobre el Iris OCR. En términos de velocidad, precisión y rendimiento general, IronOCR es mejor en un entorno de producción. Solo se usan unas pocas líneas de código para crear una aplicación de reconocimiento de texto de alto nivel. La documentación API también está disponible 24/7, lo que hace que los desarrolladores amen esta biblioteca y la conviertan en la primera opción en soluciones OCR. Puedes probar toda su funcionalidad con una prueba gratuita.
Ahora, puedes comprar 5 productos de iron al precio de 2. Para más información visita este enlace.
Descarga IronOCR desde aquí y pruébalo.
Preguntas Frecuentes
¿Cómo convierto imágenes en texto usando OCR en C#?
Puede usar el método Read de IronOCR en archivos de imagen para convertirlos en texto legible por máquina. Admite una amplia gama de formatos de imagen y más de 125 idiomas.
¿Qué idiomas son compatibles con la biblioteca IronOCR?
IronOCR admite más de 125 idiomas, ofreciendo una extensa compatibilidad internacional de idiomas para el reconocimiento de texto y códigos de barras.
¿Cómo mejorar la calidad de imagen para mejores resultados OCR?
IronOCR incluye herramientas de mejora de imagen integradas que ajustan automáticamente el contraste, el brillo y la resolución de las imágenes para mejorar la precisión de OCR.
¿Qué formatos de salida soporta IronOCR?
IronOCR puede generar texto en varios formatos, incluidos texto plano, PDFs y formatos de datos estructurados como XML y JSON.
¿Puedo probar IronOCR antes de comprar?
Sí, IronOCR ofrece una versión de prueba gratuita que permite a los desarrolladores evaluar sus características y rendimiento antes de comprar una licencia comercial.
¿Cómo funciona el licenciamiento de IronOCR?
IronOCR ofrece un modelo de licenciamiento sencillo con licencias perpetuas basadas en desarrolladores disponibles para compra única, incluidas opciones para uso empresarial.
¿Es IronOCR adecuado para entornos de producción?
IronOCR es altamente recomendado para entornos de producción debido a su velocidad, alta precisión, facilidad de integración y soporte robusto para desarrolladores.
¿Cómo maneja IronOCR el escaneo de códigos de barras y códigos QR?
IronOCR puede escanear códigos de barras y códigos QR de imágenes utilizando su funcionalidad ReadBarCodes incorporada, que se puede habilitar en la configuración.
¿Cuáles son las principales diferencias entre IronOCR y el Software Iris OCR?
Aunque ambos ofrecen capacidades OCR robustas, se reconoce a IronOCR por su facilidad de uso, extensa documentación y licenciamiento sencillo. En contraste, Iris OCR es conocido por su velocidad, precisión y diseño modular, pero requiere contactar a representantes de ventas para detalles de licenciamiento.
¿Se puede integrar IronOCR con .NET Core y .NET Standard?
Sí, IronOCR es totalmente compatible con .NET Core y .NET Standard, lo que permite una integración sin problemas en entornos de desarrollo modernos.






