COMPARACIóN CON OTROS COMPONENTES

Comparación entre IronOCR y Asprise OCR

Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

Kannapat Udonpant

8 de junio, 2022

Cuando hablamos de OCR, nos referimos al reconocimiento óptico de caracteres. El término se utiliza a menudo en el mundo empresarial para referirse al proceso de convertir una imagen o representación gráfica de cualquier documento basado en texto (por ejemplo, una página escaneada o enviada por fax) en un formato de texto editable o en un formato de documento que permita buscar texto mediante software informático.

Las siglas OCR corresponden a Optical Character Recognition (reconocimiento óptico de caracteres), una tarea realizada por un programa informático diseñado específicamente para ello. Este tipo de software escanea la página y reconoce cualquier información textual que contenga, convirtiéndola en formato digital para que pueda editarse y reproducirse digitalmente sin pérdida de calidad.

Hay muchas aplicaciones para el OCR, pero el caso de uso más popular es la conversión de documentos escaneados en archivos digitales que pueden formatearse e indexarse en bases de datos y analizarse.

En este artículo, vamos a comparar dos de las bibliotecas y aplicaciones más comunes para OCR e imágenes de documentos PDF. Estos son:

Asprise OCR
IronOCR

1.0 Introducción

1.1 Introducción y características de Asprise OCR

El SDK de reconocimiento óptico de caracteres (OCR) y reconocimiento de códigos de barras Asprise C# .NET ofrece una biblioteca API de alto rendimiento para equipar tus aplicaciones C# .NET (aplicaciones de Windows, Silverlight, aplicaciones web ASP.NET, controles ActiveX, etc.) con la funcionalidad de extraer texto e información de códigos de barras de documentos escaneados.

Puedes convertir imágenes (en varios formatos como JPEG, PNG, TIFF, PDF, etc.) en formatos de documentos editables (Word, XML, PDF con capacidad de búsqueda, etc.). Junto a otras ofertas, como el Asprise Image Scanning SDK (que captura documentos desde escáneres), puede implementar fácilmente soluciones completas de gestión documental.

Características de Asprise OCR

Reconocimiento de Texto Preciso

Gracias a los algoritmos mejorados de procesamiento de imágenes y detección de texto, Asprise OCR puede reconocer fácilmente documentos difíciles con imágenes de baja calidad. Los parámetros pueden utilizarse para favorecer ligeramente la precisión frente a la velocidad.

Motor de OCR de alta velocidad

Asprise OCR utiliza un motor de OCR optimizado para realizar un reconocimiento excelente en poco tiempo. La velocidad puede mejorarse aún más mediante el multihilo y la aceleración opcional de la GPU.

Más de 20 idiomas compatibles

Asprise OCR reconoce más de 20 idiomas, como inglés, español, francés, alemán, italiano, húngaro, finlandés, sueco, rumano, polaco, malayo, árabe, indonesio y ruso.

Todos los formatos de código de barras populares

Se admiten todos los formatos de código de barras habituales: EAN-8, EAN-13, UPC-A, UPC-E, ISBN-10, ISBN-13, Intercalado 2 de 5, Código 39, Código 128, PDF417 y Código QR.

Imágenes a PDF buscable

Con unas pocas líneas de código, puede convertir varios formatos de imágenes, como JPEG, PNG, TIFF y PDF, en archivos PDF con capacidad de búsqueda.

Fácil Implementación

No necesita dongle de protección de software ni servidor de licencias. La implementación de Asprise OCR SDK es tan fácil como desarrollar con él.

Económico, Libre de Regalías

Libre de derechos significa que pagas cuando pides una licencia de desarrollo, pero no tienes que volver a pagar cuando despliegas tu software en miles de servidores o a miles de usuarios finales.

Soporte galardonado

Su equipo no sólo es amable, sino que también es capaz de ofrecerle asistencia técnica de primera clase.

1.2 IronOCR - Introducción y características

IronOCR proporciona software para ingenieros que utilizan IronOCR for .NET para leer contenido de texto de fotos y PDF en aplicaciones y sitios web .NET. Escanea fotos en busca de texto y códigos de barras, y es compatible con numerosos idiomas de todo el mundo; puede proporcionar la salida como texto sin formato o como datos estructurados. La biblioteca OCR de Iron Software puede utilizarse en aplicaciones .NET MVC, Web, de consola y de escritorio. Para las implantaciones comerciales, la concesión de licencias cuenta con la asistencia directa del equipo de desarrollo.

Utilizando el último motor Tesseract 5, IronOCR lee texto, códigos de barras y códigos QR de cualquier imagen o formato PDF. Esta biblioteca añade rápidamente OCR a aplicaciones de escritorio, consola y web.
IronOCR admite 127 idiomas internacionales. También admite listas personalizadas de idiomas y palabras.
IronOCR es capaz de leer más de 20 formatos de códigos de barras y códigos QR.
IronOCR admite los formatos de imagen gif y tiff multipágina.
IronOCR corrige las imágenes escaneadas de baja calidad.
IronOCR soporta multithreading - ejecuta uno o más procesos a la vez.
IronOCR puede proporcionar salida de datos estructurados para páginas, párrafos, líneas, palabras, caracteres, etc.
IronOCR es compatible con diversos sistemas operativos, como Windows, Linux, macOS, etc.

2.0 Creación de un nuevo proyecto en Visual Studio

Abra el software Visual Studio y vaya al "menú archivo". Seleccione "nuevo proyecto" y, a continuación, "Aplicación de consola".

Introduzca el nombre del proyecto y seleccione la ruta del archivo en el cuadro de texto correspondiente. A continuación, haga clic en el botón Crear y seleccione el marco de trabajo Dot net necesario, como se muestra en la siguiente captura de pantalla.

El proyecto de Visual Studio generará ahora la estructura para la aplicación seleccionada y, si ha seleccionado la aplicación de consola, Windows y web, abrirá ahora el archivo program.cs donde podrá introducir el código y compilar/ejecutar la aplicación.

A continuación, podemos añadir la biblioteca para probar el código.

3.0 Instalación

3.1 Instalar Asprise OCR

Podemos descargar Asprise OCR [aquí](https://asprise.com/royalty-free-library/c%23-sharp.net-ocr-for-windows-mac-linux-download.html" target="_blank" rel="nofollow noopener noreferrer).

Hay dos opciones: instalar usando NuGet o descargar manualmente el SDK desde [asprise.com](http://asprise.com/" target="_blank" rel="nofollow noopener noreferrer).

Opción 1: NuGet PM> Install-Package asprise-ocr-api

En primer lugar, cree una nueva aplicación Visual C#/Visual Basic Windows Form utilizando un proyecto existente. Con esta solución abierta, abre la [Consola del Administrador de Paquetes NuGet](https://docs.nuget.org/consume/package-manager-console" target="_blank" rel="nofollow noopener noreferrer) y escribe el siguiente comando:

:InstallCmd Install-Package asprise-ocr-api

:InstallCmd Install-Package asprise-ocr-api

SHELL

Una vez hecho esto, puede invocar el Formulario de demostración de OCR copiando el siguiente código en Program.cs (para C#):

static class Program 
{ 
    [STAThread]
    static void Main() {
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}

static class Program 
{ 
    [STAThread]
    static void Main() {
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}

Friend Module Program
	<STAThread>
	Sub Main()
		Application.EnableVisualStyles()
		Application.SetCompatibleTextRenderingDefault(False)
		Application.Run(New asprise_ocr_api.OcrSampleForm())
	End Sub
End Module

$vbLabelText $csharpLabel

Opción 2: Descargue el SDK de OCR de Asprise.com

Descargue una copia del Asprise OCR SDK desde [www.asprise.com/product/ocr](http://www.asprise.com/product/ocr" target="_blank" rel="nofollow noopener noreferrer). Sólo tienes que descomprimirlo en una carpeta vacía.

La organización de archivos de la distribución de Asprise OCR SDK es la siguiente:


SDK DE OCR

aocr.dll, aocr_x64.dll [DLL requerida]

--- proyectos de ejemplo        [.NET API y proyecto de ejemplo]

+--- imágenes                 [Imágenes de muestra]

Navegue hasta la carpeta sample-projects y abra la solución: ocr-samples-vs.sln. Hay dos proyectos:

asprise-ocr-api: la API de OCR para .NET
asprise-ocr-api-sample: programa de demostración
Haz clic con el botón derecho en el proyecto asprise-ocr-api-sample y "Set as StartUp Project", luego pulsa el botón 'Start' o presiona F5 y verás la misma interfaz de usuario que se muestra.

3.2 Instalación de IronOCR

La biblioteca IronOCR puede descargarse e instalarse de cuatro formas.

Estos son:

Uso de Visual Studio
Uso de la línea de comandos de Visual Studio.
Descarga directa desde el sitio web de NuGet.
Descarga directa desde el sitio web de IronPDF.

3.2.1 Utilización de Visual Studio

El software Visual Studio ofrece la opción del gestor de paquetes NuGet para instalar el paquete directamente en la solución. La siguiente captura de pantalla muestra cómo abrir el Gestor de paquetes NuGet.

Proporciona un cuadro de búsqueda para mostrar la lista de paquetes del sitio web de NuGet. En el administrador de paquetes, necesitamos buscar la palabra clave IronOCR, como se muestra en la captura de pantalla a continuación:

De la imagen anterior, obtendremos la lista de elementos de búsqueda relacionados. Debemos seleccionar la opción necesaria para instalar el paquete en la solución.

3.2.2 Uso de la línea de comandos de Visual Studio

En Visual Studio, vaya a Herramientas-> Gestor de paquetes NuGet -> Consola del gestor de paquetes

Introduzca la siguiente línea en la pestaña Consola del gestor de paquetes:

Install-Package IronOcr

A continuación, el paquete se descargará/instalará en el proyecto actual y estará listo para su uso.

3.2.3 Descarga directa desde el sitio web de NuGet

La tercera forma es descargar el paquete NuGet directamente del sitio web.

Navegue al [enlace](https://www.nuget.org/packages/Ironocr" target="_blank" rel="nofollow).
Seleccione la opción de descarga de paquetes en el menú de la derecha.
Haga doble clic en el paquete descargado. Se instalará automáticamente.
A continuación, vuelva a cargar la solución y empiece a utilizarla en el proyecto.

3.2.4 Descarga directa desde el sitio web de IronOCR

Haga clic en el [enlace](/csharp/ocr/" target="_blank) aquí para descargar el último paquete directamente desde el sitio web. Una vez descargado, siga los pasos a continuación para agregar el paquete al proyecto.

Haga clic con el botón derecho del ratón en el proyecto de la ventana de la solución.
A continuación, seleccione la opción Referencia y busque la ubicación de la referencia descargada.
A continuación, haga clic en Aceptar para añadir la referencia.

4.0 Imagen OCR

Tanto IronOCR como Asprise OCR disponen de una tecnología OCR que convertirá las imágenes en texto para su búsqueda.

4.1 Utilización de Asprise

El siguiente código demuestra el uso básico de Asprise OCR.

using asprise_ocr_api;
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
Console.WriteLine("OCR Result: " + s);
// process more images here ...
ocr.StopEngine();

using asprise_ocr_api;
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
Console.WriteLine("OCR Result: " + s);
// process more images here ...
ocr.StopEngine();

Imports asprise_ocr_api
AspriseOCR.SetUp()
Dim ocr As New AspriseOCR()
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST)
Dim s As String = ocr.Recognize("C:\path\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT)
Console.WriteLine("OCR Result: " & s)
' process more images here ...
ocr.StopEngine()

$vbLabelText $csharpLabel

Asprise OCR es compatible con los siguientes formatos de imagen: GIF, PNG, JPEG, TIFF y PDF. Para el ejemplo de código OCR de la sección anterior, la entrada tiene el siguiente aspecto:

La salida del OCR será en formato de texto sin formato:


Asprise OCR y reconocimiento de códigos de barras

OCR y reconocimiento de códigos de barras de alto rendimiento y sin derechos de autor en Windows,

...

ISBN-l3, Intercalado 2 de 5, Código 39, Código 128, PDF417 y Código QR.

[[Código-QR: www.asprise.com]]

[[CODE-128: Asprise]].

Las dos últimas líneas representan el extracto de información del código de barras. Nota: tanto el formato como el contenido del código de barras están encerrados entre pares de ‘[[ ]]’.

4.2 Utilización de IronOCR

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}

Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("3.png")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Console.ReadKey()
End Using

$vbLabelText $csharpLabel

Más arriba se muestra la API de Tesseract 5, que nos permite convertir archivos de imagen en texto. Estamos creando un objeto para Iron Tesseract en la línea de código anterior. También estamos creando un objeto OcrInput que nos permitirá añadir uno o más archivos de imagen. Puede que necesitemos dar la ruta de la imagen disponible dentro del código cuando utilicemos el método add del objeto OcrInput. Se puede añadir cualquier número de imágenes. La función "Leer" en el Objeto Irontesseract que construimos antes puede ser utilizada para obtener las imágenes parseando el archivo de imagen y extrayendo el resultado en el resultado OCR. Es capaz de extraer texto de las fotos y convertirlo en una cadena.

También podemos utilizar Tesseract para añadir imágenes de varios fotogramas. "AddMultiFrameTiff" es un método diferente para esta operación. La biblioteca Tesseract lee cada fotograma de la imagen, y cada fotograma se trata como una página distinta. El proceso leerá el primer fotograma de la imagen y pasará al siguiente, y así sucesivamente hasta que se hayan escaneado todos los fotogramas de la imagen. Este método sólo admite el formato de imagen Tiff.

La imagen anterior es la salida del resultado de IronOCR, que ha convertido con precisión los datos en texto editable.

5.0 OCR de archivos PDF

IronOCR y Asprise OCR convierten archivos PDF en texto editable. Asprise OCR proporciona una lista de opciones al usuario como guardar la página, editar la imagen, reconocer la página, etc. También proporciona opciones de guardado como texto, documento, formato HTML, etc. IronOCR también nos permite guardar el archivo OCR convertido en HTML, texto, PDF, etc.

5.1 Utilización de Asprise OCR

Si establece el formato de salida como OUTPUT_FORMAT_PDF, deberá especificar el archivo PDF de salida de destino como:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf
PROP_PDF_OUTPUT_TEXT_VISIBLE=true");

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf
PROP_PDF_OUTPUT_TEXT_VISIBLE=true");

ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, "PROP_PDF_OUTPUT_FILE=ocr-result.pdf PROP_PDF_OUTPUT_TEXT_VISIBLE=true")

$vbLabelText $csharpLabel

En el código anterior, las propiedades se especifican en una única cadena separada por (con clave y valor separados por =). Alternativamente, puede especificar propiedades por separado en pares:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);

ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf", AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, True)

$vbLabelText $csharpLabel

Para que el texto sea invisible o transparente, basta con establecer PROP_PDF_OUTPUT_TEXT_VISIBLE en "false". Admite tanto PDF normal como PDF/A. Consulte el resumen de propiedades de Asprise OCR. Establezca el formato de salida como OUTPUT_FORMAT_RTF. Luego puede exportar archivos .rtf que se pueden editar en la mayoría de los procesadores de texto (Microsoft Word, Libre Office, TextEdit, etc.).

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");

ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF, "PROP_RTF_OUTPUT_FILE=ocr-result.rtf")

$vbLabelText $csharpLabel

Una vez realizado el OCR, puede ver o editar el archivo RTF con un procesador de textos:

Utilice el siguiente método para realizar el OCR en un archivo de entrada PDF:

5.2 Utilización de IronOCR

También podemos utilizar OCRInput para gestionar archivos PDF. Cada página de los documentos será leída por la clase de Iron Tesseract. A continuación, se extraerá el texto de las páginas. También podemos abrir documentos protegidos utilizando una segunda función llamada "AddPDF", que nos permite agregar PDFs a nuestra lista de documentos (contraseña si está protegido). El siguiente código muestra cómo abrir un documento PDF protegido por contraseña:

var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

Dim Ocr = New IronTesseract() ' nothing to configure
Using Input = New OcrInput()
	Input.AddPdf("example.pdf", "password")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using

$vbLabelText $csharpLabel

Podemos leer y extraer contenido de una sola página de un documento PDF utilizando "Addpdfpage". Sólo es necesario especificar el número de página de la que queremos extraer texto. "AddPdfPage" nos permite extraer texto de numerosas páginas que especifiquemos. En IEnumerable, podemos especificar fácilmente múltiples páginas. También debemos incluir la ubicación del archivo, así como su extensión. Esto se demuestra en el siguiente ejemplo de código:

IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}

IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}

Dim numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
 Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	'single page
	Input.AddPdfPage("example.pdf",10)
	'Multiple page
	Input.AddPdfPages("example.pdf", numbers)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Result.SaveAsTextFile("ocrtext.txt")
End Using

$vbLabelText $csharpLabel

Utilizando la función SaveAsTextFile, podemos almacenar el resultado como un archivo de texto, lo que nos permite descargar el archivo a la ruta del directorio de salida. Además, podemos guardar el archivo en un archivo HTML utilizando SaveAsHocrFile.

6.0 Otras características

6.1 Utilización de Asprise OCR

Asprise OCR tiene algunas opciones adicionales como Dibujar área de texto, Dibujar área de imagen, Dibujar área de tabla, Dibujar área de reconocimiento, etc. Todas ellas ayudan al usuario a mejorar el rendimiento del OCR. La aplicación no sólo realiza OCR, sino que también podemos hacer operaciones como combinar PDFs, dividir PDFs, editar PDFs, etc.

6.2 Utilización de IronOCR

IronOCR tiene características únicas que nos permiten leer códigos de barras y códigos QR de documentos escaneados. Los siguientes códigos muestran cómo podemos leer un código de barras de una imagen o documento dado.

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}

Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("barcode.gif")
	Dim Result = Ocr.Read(Input)

	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using

$vbLabelText $csharpLabel

Lo anterior es el código que ayuda a leer un código de barras de una imagen dada o documento PDF. Puede leer más de un código de barras de una página/imagen. Para leer un código de barras, IronOCR tiene una configuración única, Ocr.Configuration.ReadBarCodes, que ayuda a leer un código de barras. El valor por defecto es falso.

Después de leer la entrada, los datos se guardarán en el objeto llamado OCRResult. Este tiene una propiedad llamada Barcodes, y tendrá todos los datos de código de barras disponibles en una lista. Usando el bucle for-each, podemos obtener todos los detalles del código de barras uno a uno. Además, escaneará el código de barras y leerá su valor: dos operaciones completadas en un solo proceso.

También admitirá opciones de roscado. Podemos realizar múltiples procesos de OCR a la vez. IronOCR también es capaz de reconocer un área específica de una región especificada.

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	Input.Add("document.png", ContentArea)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using

$vbLabelText $csharpLabel

Este es el código de ejemplo para realizar el OCR en una región específica. Sólo tenemos que especificar la región del rectángulo en la imagen o PDF. El motor Tesseract de IronOCR nos ayuda a reconocer el texto.

7.0 Modelos de licencia y precios de IronOCR y Asprise OCR

Modelos y precios de licencia de IronOCR

Una garantía de devolución de dinero de 30 días: cuando se compra la licencia, obtendrá 30 días de devolución de dinero si la licencia no funciona.

Fácil integración: la integración de IronOCR con un proyecto y entorno es tan sencilla que podemos hacerlo escribiendo solo una línea de código y añadiéndolo desde NuGet Package. O podemos descargarlo de la web e integrarlo así en nuestro entorno.

Licencia Perpetua: cada licencia se compra una vez y no requiere renovación.

Asistencia gratuita y actualizaciones del producto: cada licencia incluye un año de actualizaciones gratuitas del producto y la asistencia del equipo que lo desarrolla. Es posible adquirir extensiones en cualquier momento. Se pueden ver las extensiones.

Licencias Inmediatas: las claves de licencia registradas se envían tan pronto como se recibe el pago.

Todas las licencias son perpetuas y se aplican al desarrollo, la puesta en marcha y la producción.

La Licencia Lite:

1 desarrollador
1 ubicación
1 proyecto
Licencia perpetua
Este paquete permite a un único desarrollador de software de una organización utilizar Iron Software en un único lugar. Iron Software puede utilizarse en una aplicación web, una aplicación de intranet o un programa de software de escritorio. Las licencias son intransferibles y no pueden compartirse fuera de una organización o de una relación agencia/cliente. Este tipo de licencia, al igual que todos los demás tipos de licencia, excluye expresamente todos los derechos no concedidos expresamente en virtud del Acuerdo, sin la redistribución OEM y la utilización del Software Iron como SaaS sin adquirir cobertura adicional.
Precios: Comienza desde $749 por año.
La Licencia Profesional:
10 desarrolladores
10 ubicaciones
10 proyectos
Licencia perpetua
Este paquete permite a un número predeterminado de desarrolladores de software de una organización utilizar Iron Software en ubicaciones individuales, hasta un máximo de diez. El software Iron puede utilizarse en tantos sitios web, aplicaciones de intranet o aplicaciones de software de escritorio como se desee. Las licencias son intransferibles y no pueden compartirse fuera de una organización o de una relación agencia/cliente. Este tipo de licencia, al igual que todos los demás tipos de licencia, excluye expresamente todos los derechos no otorgados expresamente bajo el Acuerdo, incluyendo la redistribución OEM y la utilización del Software Iron como SaaS sin adquirir cobertura adicional. Esta licencia puede integrarse en un solo proyecto hasta un máximo de 10.
Precios: A partir de $999 por año.
La Licencia Ilimitada:
Desarrolladores ilimitados
Ubicaciones ilimitadas
Proyectos ilimitados
Licencia perpetua
Esto permite que un número ilimitado de desarrolladores de software de una organización utilicen Iron Software en un número ilimitado de ubicaciones. El software Iron puede utilizarse en tantos sitios web, aplicaciones de intranet o aplicaciones de software de escritorio como se desee. Las licencias son intransferibles y no pueden compartirse fuera de una organización o de una relación agencia/cliente. Este tipo de licencia, al igual que todos los demás tipos de licencia, excluye expresamente todos los derechos no otorgados expresamente bajo el Acuerdo, incluyendo la redistribución OEM y la utilización del Software Iron como SaaS sin adquirir cobertura adicional.
Precios: A partir de $2999 por año.
Redistribución libre de regalías: Esto le permite distribuir el software de Iron Software como parte de varios productos comerciales empaquetados de manera diferente (sin tener que pagar regalías) según el número de proyectos cubiertos por la licencia base. Permite el despliegue de Iron Software dentro de los servicios de software SaaS, en función del número de proyectos cubiertos por la licencia base.
Precio: Desde $1599 por año.

Modelos de licencia y precios de Asprise OCR

La Licencia Lite:

Usuarios finales ilimitados
Reconocer texto
Lee códigos de barras 1D: UPC, EAN, Code39, Code128
Salida de texto, XML y PDF
Fácil despliegue
Sólo admite 2 sistemas operativos
Asientos 1
Soporte: No
Precios: A partir de $7498 por año.
La Licencia Estándar:
Usuarios finales ilimitados
Entrada BMP, GIF, PNG, JPEG, TIFF y PDF.
Reconocer texto
Lee códigos de barras 1D: UPC, EAN, Code39, Code128
Leer algunas 2D: sólo QR y Data Matrix
Salida de texto, XML y PDF
Fácil despliegue
Soporte: No
Precios: A partir de $7998 al año.
La Licencia Enterprise:
Usuarios finales ilimitados
Entrada BMP, GIF, PNG, JPEG, TIFF y PDF.
Reconocer texto
Lee códigos de barras 1D: UPC, EAN, Code39, Code128
2D: QR, PDF 417, Data Matrix y Aztec
Salida de texto, XML y PDF
Fácil despliegue
Multihilo, multiprocesamiento
Precios: Desde $12,998.
El IronOCR Lite, que incluye un paquete para un desarrollador con un año de soporte, cuesta alrededor de $749, mientras que Asprise Lite, que incluye un paquete para un desarrollador, cuesta $7498 sin soporte técnico, y $6296 con soporte técnico de pago. La licencia Professional de IronOCR, que incluye un paquete para 10 desarrolladores con un año de soporte técnico, cuesta $999, mientras que la licencia equivalente de Asprise, que incluye un paquete para 10 desarrolladores, cuesta $37,998 por año sin soporte técnico, pero con lanzamientos y actualizaciones técnicas pagadas, más un año de soporte, cuesta $46,999.00.

Los paquetes de IronOCR Lite y Professional tienen servicio SaaS u OEM y una opción de soporte de 5 años. La versión Lite, que incluye un paquete de desarrollador con 5 años de soporte y servicio Saas y OEM, cuesta 2897USD, mientras que Asprise tiene un servicio SaaS u OEM y una opción de soporte personalizado. La versión Professional de IronOCR incluye un paquete para 10 desarrolladores con un año de soporte pagado y el servicio SaaS y OEM cuesta $3397, mientras que la versión Asprise con un paquete para 10 desarrolladores sin un año de soporte y con servicio SaaS y OEM cuesta $59,996.00.

8.0 Conclusión

IronOCR en el contexto de .NET Framework proporciona Tesseract que es sencillo y fácil de usar. Admite fotos y documentos PDF de diversas formas. También proporciona una serie de ajustes para mejorar el rendimiento de la biblioteca Tesseract OCR. Se admiten varios idiomas, así como numerosos idiomas en una sola operación. Para obtener más información sobre Tesseract OCR, visite su sitio web.

Asprise es una aplicación informática que utiliza un motor de inteligencia artificial para reconocer imágenes y documentos PDF. También proporciona varios ajustes para mejorar el rendimiento del proceso de OCR. Además, ofrece la opción de seleccionar varios idiomas. Asprise tiene algunas limitaciones en el uso de las conversiones de página. También tiene un precio diferente para los distintos sistemas operativos.

Los paquetes de IronOCR ofrecen mejor licenciamiento y soporte en comparación con Asprise. Asprise OCR tiene paquetes personalizados y fijos que son más caros. IronOCR comienza desde $749, mientras que Asprise OCR comienza desde $7494 por año, por lo que nuestro producto es más rentable y además ofrece más funciones que Asprise. También admite múltiples plataformas a un solo precio.

¿A qué espera? La prueba gratuita está abierta a todos. Puedes obtener la [licencia](/csharp/ocr/licensing/" target="_blank) aquí y comenzar de inmediato.

Kannapat Udonpant

Chatea con el equipo de ingeniería ahora

Ingeniero de software

Antes de convertirse en ingeniero de software, Kannapat realizó un doctorado en Recursos Medioambientales en la Universidad de Hokkaido (Japón). Mientras cursaba su licenciatura, Kannapat también se convirtió en miembro del Laboratorio de Robótica Vehicular, que forma parte del Departamento de Ingeniería de Bioproducción. En 2022, aprovechó sus conocimientos de C# para unirse al equipo de ingeniería de Iron Software, donde se centra en IronPDF. Kannapat valora su trabajo porque aprende directamente del desarrollador que escribe la mayor parte del código utilizado en IronPDF. Además del aprendizaje entre iguales, Kannapat disfruta del aspecto social de trabajar en Iron Software. Cuando no está escribiendo código o documentación, Kannapat suele jugar con su PS5 o volver a ver The Last of Us.

< ANTERIOR
Comparación entre IronOCR y Leadtools OCR