Saltar al pie de página
COMPARAR CON OTROS COMPONENTES

Una comparación entre el software de OCR de Iris e IronOCR

OCR - El reconocimiento óptico de caracteres permite la detección de texto dentro de archivos digitales. Los documentos en papel escaneados siempre se guardan como archivos de imagen por la computadora. Los datos en estos archivos de imagen no se pueden buscar, editar o guardar en formato de texto usando un editor de texto normal o incluso una aplicación de procesamiento de textos. El procesamiento de OCR ayuda a convertir estas imágenes en texto legible por máquina para su posterior procesamiento por parte de sus usuarios.

En esta era moderna, los documentos compartidos a través de Internet están en formato digital y generalmente en forma de PDFs o imágenes. Hay un montón de recursos en línea disponibles que convierten la imagen en texto. Sin embargo, la mayoría de las empresas requieren esta funcionalidad en sus aplicaciones de software. Teniendo esto en cuenta, hay muchas bibliotecas que proporcionan soluciones OCR para ser integradas en aplicaciones de software.

En este artículo, vamos a comparar dos de las tecnologías OCR más populares para C#:

  • IronOCR
  • Software Iris OCR

IronOCR

IronOCR para .NET es una biblioteca de C# para escanear, buscar y leer imágenes y PDFs. Toma un archivo de imagen o PDF como entrada y utiliza la última versión personalizada del motor de OCR Tesseract 5 .NET para producir texto, datos estructurados o documentos PDF buscables. Su Tesseract está disponible en más de 125 idiomas junto con soporte multiplataforma en .NET Core, Standard, desde la 2.0 hasta la 7.

IronOCR es una API fácil de usar que permite a los desarrolladores de C# convertir imágenes a texto automáticamente, simplemente utilizando la clase IronTesseract. Prioriza la velocidad, precisión y facilidad de uso. También ayuda a la API de visión por computadora a encontrar texto con un conjunto de modelos entrenados.

Otra función poderosa de IronOCR es que puede escanear códigos de barras y códigos QR de todos los archivos de imagen y leer su texto. Otras características importantes de IronOCR se enumeran a continuación.

Características

  • Idiomas Internacionales: Soporte para más de 125 idiomas y personalizados con rendimiento de alta calidad y rapidez.
  • Lectura de Texto y Código de Barras: Leer texto y números de varios idiomas a la vez.
  • Documentos Especialistas: Leer texto específicamente de recibos, cheques, facturas.
  • Leer de muchos formatos: Imágenes (PNG, JPG, GIF, TIFF, BMP), objetos System.Drawing, flujos y documentos PDF (objetivo optimizado para DPI).
  • Filtros: Asistente de filtros, corrección de imágenes, corregir la orientación de la imagen, corregir los colores de la imagen.
  • Salida de Datos Sencilla: Cadenas de texto de .NET, datos de código de barras y QR, imágenes.

Software de reconocimiento óptico de caracteres (OCR) Iris

Iris OCR SDK es un conjunto de herramientas modulares de software que permite que tus aplicaciones conviertan texto de imágenes en archivos editables y brinden otros servicios de reconocimiento de texto. Es el OCR profesional más rápido con alto rendimiento y precisión. Con la tecnología de reconocimiento Iris, obtienes las técnicas más avanzadas para el reconocimiento óptico de caracteres que incluyen escaneo de vanguardia, clasificación de documentos basada en IA, integridad de datos y extracción de datos.

Iris OCR es un SDK rico en funciones que también proporciona herramientas potentes de limpieza de imágenes para mejorar las imágenes. Puede integrarse fácilmente con aplicaciones de software C++, C#, J# y VB.NET. IrisOCR ofrece soporte a largo plazo y está diseñado para ser utilizado multiplataforma. También admite aplicaciones OEM y SaaS. Iris OCR ayuda a las empresas con una solución global con precios flexibles.

Características

  • Formatos de Entrada: Imagen (JPG, PNG, BMP, TIFF), PDF (imagen, texto).
  • Preprocesamiento: Mejora de imágenes, limpieza de formularios, corrección de la perspectiva, evaluación de calidad.
  • Reconocimiento de Texto: Reconocer texto en más de 137 idiomas diferentes (Europeo, Asiático, Medio Oriente, Formato específico).
  • Reconocimiento de Código de Barras: Reconocimiento de códigos de barras 1D y 2D (PDF417, código QR, Código 39, UPC, etc.).
  • Formato de Salida: Office (DOCX, XLSX, PPT, RTF), PDF (imagen o PDF legible), formatos de imagen (JPG, PNG, BMP, TIFF), HTML, XML, TXT.

Instalación

Creación de un proyecto de Visual Studio

En este tutorial, vamos a usar la última versión de Visual Studio 2022. Entonces, asumo que ya lo has descargado e instalado para C#. Si no es así, puedes descargarlo desde el sitio web de Visual Studio.

Ahora, necesitamos crear un proyecto de consola para comenzar con ambas bibliotecas. Sigue los pasos para crear un proyecto:

  • Abre tu Visual Studio 2022.
  • Haz clic en Crear un Nuevo Proyecto.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 1

  • Selecciona Aplicación de Consola C# de las opciones dadas y haz clic en Siguiente.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 2

  • Configura tu nuevo proyecto con un nombre y ubicación. Por ejemplo, "OCRProject".

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 3

  • Para información adicional, selecciona el Marco .NET 6.0 ya que es la versión más estable.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 4

  • Ahora, haz clic en Crear y el proyecto se creará en tu ubicación especificada.

Instalación de IronOCR

Hay múltiples formas de instalar la biblioteca IronOCR.

1. Uso del Administrador de paquetes NuGet de Visual Studio

NuGet es el gestor de paquetes para descargar e instalar dependencias en tu proyecto. Sus paquetes contienen código compilado (DLL) y el archivo de manifiesto. Accede a él usando el siguiente método:

  • Haz clic en la pestaña Herramientas.
  • Extiende la opción del Administrador de Paquetes NuGet.
  • Haz clic en Administrar Paquetes NuGet para Soluciones.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 5

  • o, haz clic derecho en el Explorador de Soluciones.
  • Haz clic en Administrar paquetes NuGet.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 6

Ahora se abrirá la ventana del Gestor de Paquetes NuGet. Busca IronOCR y haz clic en Instalar.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 7

2. Descargar desde el sitio web de NuGet

Se puede descargar directamente desde el sitio web oficial de NuGet.

  1. Visita el sitio web de NuGet.
  2. Haz clic en la opción de descargar paquete en el lado derecho de la página.
  3. Abre el paquete descargado y comenzará a instalarse.
  4. Finalmente, recarga la solución y ya está.

3. Descargar usando la página web de IronOCR

Simplemente visita el sitio web de Iron Software y navega a la página web de IronOCR para .NET. Desplázate hasta el final y haz clic en Descargar DLL o Descarga el instalador de Windows.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 8

Se descarga un archivo zip. Extrae tu archivo de proyecto o ejecuta el instalador de Windows. Sigue los pasos a continuación para agregarlo a tu proyecto.

  1. Haz clic derecho en las dependencias del proyecto en Visual Studio desde el explorador de soluciones.
  2. Luego, selecciona la opción Agregar Referencia al Proyecto.
  3. Navega hasta la ubicación del archivo DLL descargado.
  4. Finalmente, haz clic en OK para agregar una referencia al proyecto.

4. Uso del símbolo del sistema en Visual Studio

  1. Navega a la pestaña Herramientas en Visual Studio.
  2. Extiende la opción Gestor de Paquetes NuGet.
  3. Selecciona Consola del Gestor de Paquetes y escribe el siguiente comando:

    Install-Package IronOcr

Esto descargará e instalará automáticamente IronOCR en tu proyecto.

5. Agregar espacios de nombres IronOCR necesarios

Solo hay un espacio de nombres necesario, que debe agregarse en la parte superior del archivo de código fuente donde necesitamos acceder a sus funciones.

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

Ahora estamos listos para usar IronOCR en nuestro proyecto.

Instalación de Iris OCR

Hay muchas maneras de usar Iris OCR. Si buscas una solución para una pequeña empresa u oficina, puedes usar la aplicación OCR. El software puede descargarse desde este enlace.

Si estás buscando soluciones para medianas y grandes empresas, entonces debes contactar al equipo de Iris para obtener una cotización de acuerdo a tus necesidades. Los SDKs y otra documentación solo están disponibles para los clientes registrados. Para usar el SDK en un entorno de desarrollo, necesitas solicitar acceso usando este formulario.

Aquí vamos a usar el Software Iris 17 OCR para propósitos de comparación. Proporciona todas las funcionalidades a nivel base y puede ser utilizado en comparación a IronOCR. Los siguientes pasos te ayudarán a descargar e instalar el software Iris OCR:

  1. Una vez descargado el software, haz doble clic para abrir el asistente de instalación.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 9

  1. Haz clic en Siguiente y elige el modo de instalación.
  2. Luego, selecciona los idiomas de los cuales deseas leer texto.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 10

  1. Haz clic en siguiente e instala Iris OCR.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 11

  1. Ahora el software comenzará a instalarse. Después de la instalación, haz clic en finalizar y abre el Software Iris OCR.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 12

¡Todo listo! Ahora sigamos con la comparación en sí.

Comparación

1. Imágenes a texto

Leer datos de imágenes es una tarea bastante tediosa. La resolución y calidad de las imágenes desempeñan un papel importante al extraer contenido. Ambas bibliotecas proporcionan funcionalidad de reconocimiento óptico de caracteres para extraer texto de imágenes.

1.1. Uso de IronOCR

IronOCR hace que sea muy fácil para los desarrolladores leer el contenido de un archivo de imagen con su poderosa clase IronTessaract. Aquí usaremos una imagen PNG para leer texto de un archivo de imagen y el código es el siguiente:

var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
' We use a using statement to ensure resources are freed after use
Using Input = New OcrInput()
	' Add the image from which you want to extract text
	Input.AddImage("test-files/employmentapp.png")
	' Perform OCR to read the text
	Dim Result = OCR.Read(Input)
	' Output the extracted text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel
IMAGEN DE ENTRADA

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 13

PRODUCCIÓN

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 14 - Salida de Imagen

La salida de IronOCR coincide con la imagen original proporcionada. El código es limpio y fácil de entender sin complicaciones técnicas.

1.2. Uso del OCR Iris

El software Iris OCR permite que todos tus documentos en papel sean escaneados y utilizados para el reconocimiento de texto. La extracción de texto es muy simple usando la tecnología de Iris OCR. Selecciona un archivo de imagen desde el "Desde Archivo" en la pestaña del menú Inicio. La misma imagen se usa para probar y comparar los resultados de los dos software.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 15

Puedes aplicar corrección de imagen a la imagen cargada. En la pestaña de archivo de salida, puedes elegir cualquier formato como tu salida. Proporciona múltiples formatos de salida como Word, Excel, PDF, archivos de texto, etc. Simplemente guarda el archivo en cualquier formato y ábrelo para ver el texto extraído.

PRODUCCIÓN

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 16

Puedes ver que hay una clara diferencia en los resultados de los dos software. IronOCR extrajo el texto exacto de la imagen junto con el formato. Mientras que, Iris OCR preservó el formato pero el nombre completo y el número de teléfono están desordenados.

2. Código de barras y código QR a texto

2.1. Uso de IronOCR

IronOCR proporciona una característica única y útil al leer imágenes, es decir, puede leer códigos de barras y códigos QR. Puede detectar códigos de barras y mostrar su valor con facilidad.

Para hacerlo, establece la configuración de lectura de código de barras en verdadero y luego itera a través de cada uno de los códigos de barras en los resultados OCR. El código para leer códigos de barras se da a continuación:

var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Dim OCR = New IronTesseract()
OCR.Configuration.ReadBarCodes = True
' Using statement to automatically dispose of resources
Using input = New OcrInput()
	' Add the image to be processed
	input.AddImage("test-files/Barcode.png")
	' Read the OCR result
	Dim Result = OCR.Read(input)
	' Iterate through the barcodes detected and display their values
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
$vbLabelText   $csharpLabel
IMAGEN DE ENTRADA

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 17

PRODUCCIÓN

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 18

Los tres códigos de barras de la imagen de entrada se leen con éxito, y su texto oculto se muestra.

2.2. Uso del OCR Iris

Iris OCR también proporciona la facilidad de extraer los datos de códigos de barras de imágenes o archivos PDF. Para los códigos de barras, debemos seleccionar manualmente el área a detectar. Muévete a la pestaña de zonas y selecciona el código de barras para ser reconocido.

Haz clic derecho en la región seleccionada y cópiala como datos, luego guárdala en un archivo de procesamiento de texto para ver los datos.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 19

En este caso, el software Iris OCR no puede detectar el texto oculto detrás de los códigos de barras dados en la imagen.

3. PDF a texto

3.1. Uso de IronOCR

Leer archivos PDF es tan fácil como leer imágenes en IronOCR. Solo necesitas cambiar el método AddImage a AddPdf en el código de lectura de imagen. El código es el siguiente:

var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
' Using statement for resource management
Using Input = New OcrInput()
	' Add the PDF file to be processed
	Input.AddPdf("test-files/example.pdf")
	' Get the OCR results
	Dim Result = OCR.Read(Input)
	' Output the extracted text
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel
PRODUCCIÓN

El texto extraído tiene el mismo formato que el archivo PDF.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 20

3.2. Uso del OCR Iris

Leer archivos PDF es también muy fácil usando el software Iris. Admite todos los formatos digitales y PDF es uno de ellos. También puedes crear formatos legibles usando el software Iris OCR. PDF es un documento en papel y cada página se trata como un archivo de imagen separado. Abre documentos en papel usando la opción Desde Archivo. Selecciona el rango de páginas del que deseas extraer texto y guárdalo en cualquier formato editable de tu elección de las opciones dadas.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 21

PRODUCCIÓN

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 22

Licencias

IronOCR es gratuito para fines de desarrollo, pero necesita licenciarse para uso comercial. También ofrece una prueba gratuita para probar todo su potencial para tus necesidades. El paquete lite comienza a partir de $799 con una garantía de devolución de dinero de 30 días. IronOCR proporciona 1 año de soporte del producto y actualizaciones de forma gratuita y luego $399 al año después. Todas las licencias son perpetuas, lo que significa que solo son compras únicas y sin cargos ocultos. También puedes elegir cobertura de redistribución libre de regalías para productos SaaS y OEM por solo una compra única de $1999. Para obtener más información sobre paquetes de licencias y planes de precios, visite aquí.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 23

Iris es una solución OCR con una versión gratuita de 10 días disponible como prueba. Su versión pro comienza a partir de $99 y la versión corporativa comienza a partir de $199. Para usar su SDK en modo de producción, necesitamos obtener una cotización de su representante de ventas. Si deseas licenciarlo para desarrollo en C# o en cualquier otro lenguaje, obtén una cotización desde aquí. Más información y comparación entre las versiones pro y corporativas puede consultarse aquí.

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 24

Conclusión

Una Comparación Entre el Software OCR De Iris & IronOCR: Figura 25

IronOCR proporciona a los desarrolladores de C# la API de Tesseract más avanzada que conocemos, en cualquier plataforma. IronOCR puede ser implementado en Windows, Linux, Mac, Azure, AWS y Lambda, y admite proyectos de .NET Framework así como .NET Standard y .NET Core. También podemos leer códigos de barras en escanear OCR e incluso exportar nuestro OCR como HTML y PDFs buscables.

El software Iris OCR se construye con capacidades de IA y es compatible con Windows y Mac. Su SDK está disponible para múltiples lenguajes de programación. Iris Pro viene con las capacidades del SDK de Iris OCR para Windows y Mac como una aplicación GUI. Puedes leer texto de imágenes y PDFs y exportarlos en otros formatos. También puedes personalizar todos tus documentos en papel usando el software Iris con solo unos clics.

Las licencias de AWS Textract se basan en el número de páginas del documento para extraer información y analizar los datos. Las licencias de desarrollo de Iris OCR no se publican en el sitio web de Iris. Debes solicitar una cotización para obtener información sobre licencias. Además, la licencia de IronOCR es una compra única y puede usarse de por vida.

En general, ambos software proporcionan casi toda la funcionalidad OCR con tecnología de IA, pero IronOCR tiene una ligera ventaja sobre el Iris OCR. En términos de velocidad, precisión y rendimiento general, IronOCR es mejor en un entorno de producción. Solo se usan unas pocas líneas de código para crear una aplicación de reconocimiento de texto de alto nivel. La documentación API también está disponible 24/7, lo que hace que los desarrolladores amen esta biblioteca y la conviertan en la primera opción en soluciones OCR. Puedes probar toda su funcionalidad con una prueba gratuita.

Ahora, puedes comprar 5 productos de iron al precio de 2. Para más información visita este enlace.

Descarga IronOCR desde aquí y pruébalo.

Por favor notaIris OCR Software es una marca registrada de su respectivo propietario. Este sitio no está afiliado, respaldado ni patrocinado por Iris OCR Software. Todos los nombres de producto, logotipos y marcas son propiedad de sus respectivos dueños. Las comparaciones son sólo para fines informativos y reflejan información disponible públicamente al momento de escribir.

Preguntas Frecuentes

¿Cómo convierto imágenes en texto usando OCR en C#?

Puede usar el método Read de IronOCR en archivos de imagen para convertirlos en texto legible por máquina. Admite una amplia gama de formatos de imagen y más de 125 idiomas.

¿Qué idiomas son compatibles con la biblioteca IronOCR?

IronOCR admite más de 125 idiomas, ofreciendo una extensa compatibilidad internacional de idiomas para el reconocimiento de texto y códigos de barras.

¿Cómo mejorar la calidad de imagen para mejores resultados OCR?

IronOCR incluye herramientas de mejora de imagen integradas que ajustan automáticamente el contraste, el brillo y la resolución de las imágenes para mejorar la precisión de OCR.

¿Qué formatos de salida soporta IronOCR?

IronOCR puede generar texto en varios formatos, incluidos texto plano, PDFs y formatos de datos estructurados como XML y JSON.

¿Puedo probar IronOCR antes de comprar?

Sí, IronOCR ofrece una versión de prueba gratuita que permite a los desarrolladores evaluar sus características y rendimiento antes de comprar una licencia comercial.

¿Cómo funciona el licenciamiento de IronOCR?

IronOCR ofrece un modelo de licenciamiento sencillo con licencias perpetuas basadas en desarrolladores disponibles para compra única, incluidas opciones para uso empresarial.

¿Es IronOCR adecuado para entornos de producción?

IronOCR es altamente recomendado para entornos de producción debido a su velocidad, alta precisión, facilidad de integración y soporte robusto para desarrolladores.

¿Cómo maneja IronOCR el escaneo de códigos de barras y códigos QR?

IronOCR puede escanear códigos de barras y códigos QR de imágenes utilizando su funcionalidad ReadBarCodes incorporada, que se puede habilitar en la configuración.

¿Cuáles son las principales diferencias entre IronOCR y el Software Iris OCR?

Aunque ambos ofrecen capacidades OCR robustas, se reconoce a IronOCR por su facilidad de uso, extensa documentación y licenciamiento sencillo. En contraste, Iris OCR es conocido por su velocidad, precisión y diseño modular, pero requiere contactar a representantes de ventas para detalles de licenciamiento.

¿Se puede integrar IronOCR con .NET Core y .NET Standard?

Sí, IronOCR es totalmente compatible con .NET Core y .NET Standard, lo que permite una integración sin problemas en entornos de desarrollo modernos.

Kannaopat Udonpant
Ingeniero de Software
Antes de convertirse en Ingeniero de Software, Kannapat completó un doctorado en Recursos Ambientales de la Universidad de Hokkaido en Japón. Mientras perseguía su grado, Kannapat también se convirtió en miembro del Laboratorio de Robótica de Vehículos, que es parte del Departamento de Ingeniería ...
Leer más