COMPARACIóN CON OTROS COMPONENTES

Comparación entre IronOCR y Asprise OCR

Actualizado 8 de junio, 2022
Compartir:

Cuando hablamos de OCR, nos referimos al reconocimiento óptico de caracteres. El término se utiliza a menudo en el mundo empresarial para referirse al proceso de convertir una imagen o representación gráfica de cualquier documento basado en texto (por ejemplo, una página escaneada o enviada por fax) en un formato de texto editable o en un formato de documento que permita realizar búsquedas de texto mediante programas informáticos.

Las siglas OCR corresponden a Optical Character Recognition (reconocimiento óptico de caracteres), una tarea realizada por un programa informático diseñado específicamente para ello. Este tipo de software escanea la página y reconoce cualquier información textual que contenga, convirtiéndola en formato digital para que pueda editarse y reproducirse digitalmente sin pérdida de calidad.

Hay muchas aplicaciones para el OCR, pero el caso de uso más popular es la conversión de documentos escaneados en archivos digitales que pueden formatearse e indexarse en bases de datos y analizarse. Otros ejemplos son la conversión de notas manuscritas en notas mecanografiadas y la conversión del texto de las tarjetas de visita en su correspondiente información de contacto.

En este artículo, vamos a comparar dos de las bibliotecas y aplicaciones más comunes para OCR e imágenes de documentos PDF. Estos son:

  • Asprise OCR
  • IronOCR

1.0 Introducción

1.1 Introducción y características de Asprise OCR

El OCR de Asprise C# .NET (reconocimiento óptico de caracteres) y el SDK de reconocimiento de códigos de barras ofrece una biblioteca API de alto rendimiento para que pueda equipar sus aplicaciones C# .NET (Aplicaciones Windows, Silverlight, aplicaciones de servicios web ASP.NET, controles ActiveX, etc.) con la funcionalidad de extraer información de texto y códigos de barras de documentos escaneados.

Puedes convertir imágenes (en varios formatos como JPEG, PNG, TIFF, PDF, etc.) en formatos de documentos editables (Word, XML, PDF con función de búsqueda, etc.). Junto con otras ofertas como el SDK de escaneado de imágenes de Asprise (que captura documentos de escáneres)puede implantar fácilmente soluciones completas de gestión de documentos.

Características de Asprise OCR

**Reconocimiento de texto preciso

Gracias a los algoritmos mejorados de procesamiento de imágenes y detección de texto, Asprise OCR puede reconocer fácilmente documentos difíciles con imágenes de baja calidad. Los parámetros pueden utilizarse para favorecer ligeramente la precisión frente a la velocidad.

Motor OCR de alta velocidad

Asprise OCR utiliza un motor de OCR optimizado para realizar un reconocimiento excelente en poco tiempo. La velocidad puede mejorarse aún más mediante el multihilo y la aceleración opcional de la GPU.

**Más de 20 idiomas compatibles

Asprise OCR reconoce más de 20 idiomas, como inglés, español, francés, alemán, italiano, húngaro, finlandés, sueco, rumano, polaco, malayo, árabe, indonesio y ruso.

**Todos los formatos populares de códigos de barras

Se admiten todos los formatos de código de barras habituales: EAN-8, EAN-13, UPC-A, UPC-E, ISBN-10, ISBN-13, Intercalado 2 de 5, Código 39, Código 128, PDF417 y Código QR.

**Imágenes a PDF con función de búsqueda

Con unas pocas líneas de código, puede convertir varios formatos de imágenes, como JPEG, PNG, TIFF y PDF, en archivos PDF con capacidad de búsqueda.

**Fácil despliegue

No necesita dongle de protección de software ni servidor de licencias. La implementación de Asprise OCR SDK es tan fácil como desarrollar con él.

Presupuesto asequible, sin derechos de autor.

Libre de derechos significa que pagas cuando pides una licencia de desarrollo, pero no tienes que volver a pagar cuando despliegas tu software en miles de servidores o a miles de usuarios finales.

Asistencia galardonada

Su equipo no sólo es amable, sino que también es capaz de ofrecerle asistencia técnica de primera clase.

1.2 IronOCR - Introducción y características

IronOCR proporciona software para ingenieros que utilizan IronOCR for .NET para leer contenido de texto de fotos y PDF en aplicaciones y sitios web .NET. Escanea fotos en busca de texto y códigos de barras, y es compatible con numerosos idiomas de todo el mundo; puede proporcionar la salida como texto sin formato o como datos estructurados. La biblioteca OCR de Iron Software puede utilizarse en aplicaciones .NET MVC, Web, de consola y de escritorio. Para las implantaciones comerciales, la concesión de licencias cuenta con la asistencia directa del equipo de desarrollo.

  • Utilizando el último motor Tesseract 5, IronOCR lee texto, códigos de barras y códigos QR de cualquier imagen o formato PDF. Esta biblioteca añade rápidamente OCR a aplicaciones de escritorio, consola y web.
  • IronOCR admite 127 idiomas internacionales. También admite listas personalizadas de idiomas y palabras.
  • IronOCR es capaz de leer más de 20 formatos de códigos de barras y códigos QR.
  • IronOCR admite los formatos de imagen gif y tiff multipágina.
  • IronOCR corrige las imágenes escaneadas de baja calidad.
  • IronOCR soporta multithreading - ejecuta uno o más procesos a la vez.
  • IronOCR puede proporcionar salida de datos estructurados para páginas, párrafos, líneas, palabras, caracteres, etc.
  • IronOCR es compatible con diversos sistemas operativos, como Windows, Linux, macOS, etc.

2.0 Creación de un nuevo proyecto en Visual Studio

Abra el software Visual Studio y vaya al "menú archivo". Seleccione "nuevo proyecto" y, a continuación, "Aplicación de consola".

Introduzca el nombre del proyecto y seleccione la ruta del archivo en el cuadro de texto correspondiente. A continuación, haga clic en el botón Crear y seleccione el marco de trabajo Dot net necesario, como se muestra en la siguiente captura de pantalla.

El proyecto de Visual Studio generará ahora la estructura para la aplicación seleccionada y, si ha seleccionado la aplicación de consola, Windows y web, abrirá ahora el archivo program.cs donde podrá introducir el código y compilar/ejecutar la aplicación.

A continuación, podemos añadir la biblioteca para probar el código.

3.0 Instalación

3.1 Instalar Asprise OCR

Podemos descargar el Asprise OCR aquí.

Hay dos opciones: instalar utilizando NuGet o descargar manualmente el SDK desde asprise.com.

Opción 1: NuGet PM> Install-Package asprise-ocr-api

En primer lugar, cree una nueva aplicación Visual C#/Visual Basic Windows Form utilizando un proyecto existente. Con esta solución abierta, abra el Consola del Gestor de paquetes NuGety escriba el siguiente comando:

Install-Package asprise-ocr-api

Una vez hecho esto, puede invocar el formulario de demostración de OCR copiando el siguiente código en Program.cs (para C#):

static class Program 
{ 
    [STAThread]
    static void Main() {
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
static class Program 
{ 
    [STAThread]
    static void Main() {
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
Friend Module Program
	<STAThread>
	Sub Main()
		Application.EnableVisualStyles()
		Application.SetCompatibleTextRenderingDefault(False)
		Application.Run(New asprise_ocr_api.OcrSampleForm())
	End Sub
End Module
VB   C#

Opción 2: Descargue el SDK de OCR de Asprise.com

Descargue una copia del SDK de Asprise OCR desde www.asprise.com/product/ocr. Sólo tienes que descomprimirlo en una carpeta vacía.

La organización de archivos de la distribución de Asprise OCR SDK es la siguiente:


SDK DE OCR

--- aocr.dll, aocr_x64.dll [DLL necesario]

--- proyectos-muestra [API .NET y proyecto de ejemplo]

+--- imágenes [Imágenes de muestra]

Navegue hasta la carpeta sample-projects y abra la solución: ocr-samples-vs.sln. Hay dos proyectos:

  • asprise-ocr-api: la API de OCR de .NET
  • asprise-ocr-api-sample: programa de demostración

    Haz clic con el botón derecho en el proyecto asprise-ocr-api-sample y "Set as StartUp Project", luego pulsa el botón 'Start' o presiona F5 y verás la misma interfaz de usuario que se muestra.

3.2 Instalación de IronOCR

La biblioteca IronOCR puede descargarse e instalarse de cuatro formas.

Estos son:

  • Uso de Visual Studio
  • Uso de la línea de comandos de Visual Studio.
  • Descarga directa desde el sitio web de NuGet.
  • Descarga directa desde el sitio web de IronPDF.

3.2.1 Utilización de Visual Studio

El software Visual Studio ofrece la opción del gestor de paquetes NuGet para instalar el paquete directamente en la solución. La siguiente captura de pantalla muestra cómo abrir el Gestor de paquetes NuGet.

Proporciona un cuadro de búsqueda para mostrar la lista de paquetes del sitio web de NuGet. En el gestor de paquetes, tenemos que buscar la palabra clave IronOCR, como en la siguiente captura de pantalla:

De la imagen anterior, obtendremos la lista de elementos de búsqueda relacionados. Debemos seleccionar la opción necesaria para instalar el paquete en la solución.

3.2.2 Uso de la línea de comandos de Visual Studio

En Visual Studio, vaya a Herramientas-> Gestor de paquetes NuGet -> Consola del gestor de paquetes

Introduzca la siguiente línea en la pestaña Consola del gestor de paquetes:

Install-Package IronOcr

A continuación, el paquete se descargará/instalará en el proyecto actual y estará listo para su uso.

3.2.3 Descarga directa desde el sitio web de NuGet

La tercera forma es descargar el paquete NuGet directamente del sitio web.

  • Navegue hasta el Enlace.
  • Seleccione la opción de descarga de paquetes en el menú de la derecha.
  • Haga doble clic en el paquete descargado. Se instalará automáticamente.
  • A continuación, vuelva a cargar la solución y empiece a utilizarla en el proyecto.

3.2.4 Descarga directa desde el sitio web de IronOCR

Haga clic en el botón enlace aquí para descargar el último paquete directamente del sitio web. Una vez descargado, siga los pasos que se indican a continuación para añadir el paquete al proyecto.

  • Haga clic con el botón derecho del ratón en el proyecto de la ventana de la solución.
  • A continuación, seleccione la opción Referencia y busque la ubicación de la referencia descargada.
  • A continuación, haga clic en Aceptar para añadir la referencia.

4.0 Imagen OCR

Tanto IronOCR como Asprise OCR disponen de una tecnología OCR que convertirá las imágenes en texto para su búsqueda.

4.1 Utilización de Asprise

El siguiente código demuestra el uso básico de Asprise OCR.

using asprise_ocr_api;
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
Console.WriteLine("OCR Result: " + s);
//  procesar más imágenes aquí ...
ocr.StopEngine();
using asprise_ocr_api;
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
Console.WriteLine("OCR Result: " + s);
//  procesar más imágenes aquí ...
ocr.StopEngine();
Imports asprise_ocr_api
AspriseOCR.SetUp()
Dim ocr As New AspriseOCR()
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST)
Dim s As String = ocr.Recognize("C:\path\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT)
Console.WriteLine("OCR Result: " & s)
'  procesar más imágenes aquí ...
ocr.StopEngine()
VB   C#

Asprise OCR es compatible con los siguientes formatos de imagen: GIF, PNG, JPEG, TIFF y PDF. Para el ejemplo de código OCR de la sección anterior, la entrada tiene el siguiente aspecto:

La salida del OCR será en formato de texto sin formato:


Asprise OCR y reconocimiento de códigos de barras

OCR y reconocimiento de códigos de barras de alto rendimiento y sin derechos de autor en Windows,

...

ISBN-l3, Intercalado 2 de 5, Código 39, Código 128, PDF417 y Código QR.

[[Código QR: www.asprise.com]]

[[Cod.artículo-128: Asprise]].

Las dos últimas líneas representan el extracto de información del código de barras. Nota: tanto el formato como el contenido del código de barras están encerrados en '[[ ]]' pares.

4.2 Utilización de IronOCR

var Ocr = new IronTesseract(); //  nada que configurar
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
var Ocr = new IronTesseract(); //  nada que configurar
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
Dim Ocr = New IronTesseract() '  nada que configurar
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("3.png")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Console.ReadKey()
End Using
VB   C#

Más arriba se muestra la API de Tesseract 5, que nos permite convertir archivos de imagen en texto. Estamos creando un objeto para Iron Tesseract en la línea de código anterior. También estamos creando un objeto OcrInput que nos permitirá añadir uno o más archivos de imagen. Puede que necesitemos dar la ruta de la imagen disponible dentro del código cuando utilicemos el método add del objeto OcrInput. Se puede añadir cualquier número de imágenes. La función "Leer" en el Objeto Irontesseract que construimos antes puede ser utilizada para obtener las imágenes parseando el archivo de imagen y extrayendo el resultado en el resultado OCR. Es capaz de extraer texto de las fotos y convertirlo en una cadena.

También podemos utilizar Tesseract para añadir imágenes de varios fotogramas. "AddMultiFrameTiff" es un método diferente para esta operación. La biblioteca Tesseract lee cada fotograma de la imagen, y cada fotograma se trata como una página distinta. El proceso leerá el primer fotograma de la imagen y pasará al siguiente, y así sucesivamente hasta que se hayan escaneado todos los fotogramas de la imagen. Este método sólo admite el formato de imagen Tiff.

La imagen anterior es la salida del resultado de IronOCR, que ha convertido con precisión los datos en texto editable.

5.0 OCR de archivos PDF

IronOCR y Asprise OCR convierten archivos PDF en texto editable. Asprise OCR proporciona una lista de opciones al usuario como guardar la página, editar la imagen, reconocer la página, etc. También proporciona opciones de guardado como texto, documento, formato HTML, etc. IronOCR también nos permite guardar el archivo OCR convertido en HTML, texto, PDF, etc.

5.1 Utilización de Asprise OCR

Si establece el formato de salida como OUTPUT_FORMAT_PDF, deberá especificar el archivo PDF de salida de destino como:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf
PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf
PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, "PROP_PDF_OUTPUT_FILE=ocr-result.pdf PROP_PDF_OUTPUT_TEXT_VISIBLE=true")
VB   C#

En el código anterior, las propiedades se especifican en una única cadena separada por (con clave y valor separados por =). Alternativamente, puede especificar propiedades por separado en pares:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf", AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, True)
VB   C#

Para que el texto sea invisible o transparente, basta con establecer PROP_PDF_OUTPUT_TEXT_VISIBLE en "false". Admite tanto PDF normal como PDF/A. Consulte el resumen de propiedades de Asprise OCR. Establezca el formato de salida como OUTPUT_FORMAT_RTF. A continuación, puede generar archivos .rtf que pueden editarse en la mayoría de los procesadores de texto. (Microsoft Word, Libre Office, TextEdit, etc.).

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF, "PROP_RTF_OUTPUT_FILE=ocr-result.rtf")
VB   C#

Una vez realizado el OCR, puede ver o editar el archivo RTF con un procesador de textos:

Utilice el siguiente método para realizar el OCR en un archivo de entrada PDF:

5.2 Utilización de IronOCR

También podemos utilizar OCRInput para gestionar archivos PDF. Cada página de los documentos será leída por la clase de Teseracto de Hierro. A continuación, se extraerá el texto de las páginas. También podemos abrir documentos protegidos utilizando una segunda función llamada "AddPDF", que nos permite añadir PDF a nuestra lista de documentos (contraseña si está protegido). El siguiente código muestra cómo abrir un documento PDF protegido por contraseña:

var Ocr = new IronTesseract(); //  nada que configurar
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract(); //  nada que configurar
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract() '  nada que configurar
Using Input = New OcrInput()
	Input.AddPdf("example.pdf", "password")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

Podemos leer y extraer contenido de una sola página de un documento PDF utilizando "Addpdfpage". Sólo es necesario especificar el número de página de la que queremos extraer texto. "AddPdfPage" nos permite extraer texto de numerosas páginas que especifiquemos. En IEnumerablepodemos especificar fácilmente varias páginas. También debemos incluir la ubicación del archivo, así como su extensión. Esto se demuestra en el siguiente ejemplo de código:

IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //una sola página
    Input.AddPdfPage("example.pdf",10);
    //Varias páginas
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //una sola página
    Input.AddPdfPage("example.pdf",10);
    //Varias páginas
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
Dim numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
 Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	'una sola página
	Input.AddPdfPage("example.pdf",10)
	'Varias páginas
	Input.AddPdfPages("example.pdf", numbers)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Result.SaveAsTextFile("ocrtext.txt")
End Using
VB   C#

Utilizando la función SaveAsTextFile, podemos almacenar el resultado como un archivo de texto, lo que nos permite descargar el archivo a la ruta del directorio de salida. Además, podemos guardar el archivo en un archivo HTML utilizando SaveAsHocrFile.

6.0 Otras características

6.1 Utilización de Asprise OCR

Asprise OCR tiene algunas opciones adicionales como Dibujar área de texto, Dibujar área de imagen, Dibujar área de tabla, Dibujar área de reconocimiento, etc. Todas ellas ayudan al usuario a mejorar el rendimiento del OCR. La aplicación no sólo realiza OCR, sino que también podemos hacer operaciones como combinar PDFs, dividir PDFs, editar PDFs, etc.

6.2 Utilización de IronOCR

IronOCR tiene características únicas que nos permiten leer códigos de barras y códigos QR de documentos escaneados. Los siguientes códigos muestran cómo podemos leer un código de barras de una imagen o documento dado.

var Ocr = new IronTesseract(); //  nada que configurar
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
var Ocr = new IronTesseract(); //  nada que configurar
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Dim Ocr = New IronTesseract() '  nada que configurar
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("barcode.gif")
	Dim Result = Ocr.Read(Input)

	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
VB   C#

Lo anterior es el código que ayuda a leer un código de barras de una imagen dada o documento PDF. Puede leer más de un código de barras de una página/imagen. Para leer un código de barras, IronOCR tiene una configuración única, Ocr.Configuration.ReadBarCodes, que ayuda a leer un código de barras. El valor por defecto es falso.

Después de leer la entrada, los datos se guardarán en el objeto llamado OCRResult. Este tiene una propiedad llamada Barcodes, y tendrá todos los datos de código de barras disponibles en una lista. Usando el bucle for-each, podemos obtener todos los detalles del código de barras uno a uno. Además, escaneará el código de barras y leerá su valor: dos operaciones completadas en un solo proceso.

También admitirá opciones de roscado. Podemos realizar múltiples procesos de OCR a la vez. IronOCR también es capaz de reconocer un área específica de una región especificada.

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
} 
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
} 
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	Input.Add("document.png", ContentArea)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

Este es el código de ejemplo para realizar el OCR en una región específica. Sólo tenemos que especificar la región del rectángulo en la imagen o PDF. El motor Tesseract de IronOCR nos ayuda a reconocer el texto.

7.0 Modelos de licencia y precios de IronOCR y Asprise OCR

Modelos y precios de licencia de IronOCR

Una garantía de devolución del dinero de 30 días: al comprar la licencia, obtendrá 30 días de devolución del dinero si la licencia no funciona.

Fácil integración: la integración de IronOCR con un proyecto y entorno es tan sencilla que podemos hacerlo escribiendo una sola línea de código y añadiéndola desde NuGet Package. O podemos descargarlo de la web e integrarlo así en nuestro entorno.

Licencia perpetua: cada licencia se adquiere una vez y no requiere renovación.

Asistencia gratuita y actualizaciones del producto: cada licencia incluye un año de actualizaciones gratuitas del producto y la asistencia del equipo que lo desarrolla. Es posible adquirir extensiones en cualquier momento. Se pueden ver las extensiones.

Licencias inmediatas: las claves de licencia registradas se envían en cuanto se recibe el pago.

Todas las licencias son perpetuas y se aplican al desarrollo, la puesta en marcha y la producción.

**La licencia Lite

  • 1 promotor
  • 1 ubicación
  • 1 proyecto
  • Licencia perpetua

    Este paquete permite a un único desarrollador de software de una organización utilizar Iron Software en un único lugar. Iron Software puede utilizarse en una aplicación web, una aplicación de intranet o un programa de software de escritorio. Las licencias son intransferibles y no pueden compartirse fuera de una organización o de una relación agencia/cliente. Este tipo de licencia, al igual que todos los demás tipos de licencia, excluye expresamente todos los derechos no concedidos expresamente en virtud del Acuerdo, sin la redistribución OEM y la utilización del Software Iron como SaaS sin adquirir cobertura adicional.

    Precios: Desde $599 al año.

    **La licencia profesional

  • 10 promotores
  • 10 emplazamientos
  • 10 proyectos
  • Licencia perpetua

    Este paquete permite a un número predeterminado de desarrolladores de software de una organización utilizar Iron Software en ubicaciones individuales, hasta un máximo de diez. El software Iron puede utilizarse en tantos sitios web, aplicaciones de intranet o aplicaciones de software de escritorio como se desee. Las licencias son intransferibles y no pueden compartirse fuera de una organización o de una relación agencia/cliente. Este tipo de licencia, al igual que todos los demás tipos de licencia, excluye expresamente todos los derechos no otorgados expresamente bajo el Acuerdo, incluyendo la redistribución OEM y la utilización del Software Iron como SaaS sin adquirir cobertura adicional. Esta licencia puede integrarse en un solo proyecto hasta un máximo de 10.

    **Precios: A partir de 999 $ al año.

    **La licencia ilimitada

  • Desarrolladores ilimitados
  • Ubicaciones ilimitadas
  • Proyectos ilimitados
  • Licencia perpetua

    Esto permite que un número ilimitado de desarrolladores de software de una organización utilicen Iron Software en un número ilimitado de ubicaciones. El software Iron puede utilizarse en tantos sitios web, aplicaciones de intranet o aplicaciones de software de escritorio como se desee. Las licencias son intransferibles y no pueden compartirse fuera de una organización o de una relación agencia/cliente. Este tipo de licencia, al igual que todos los demás tipos de licencia, excluye expresamente todos los derechos no otorgados expresamente bajo el Acuerdo, incluyendo la redistribución OEM y la utilización del Software Iron como SaaS sin adquirir cobertura adicional.

    **Precios: A partir de 2999 dólares al año.

    Redistribución libre de regalías: Esto le permite distribuir el Software Iron como parte de una serie de productos comerciales empaquetados de forma diferente (sin tener que pagar derechos de autor) en función del número de proyectos cubiertos por la licencia base. Permite el despliegue de Iron Software dentro de los servicios de software SaaS, en función del número de proyectos cubiertos por la licencia base.

    **Precios: A partir de 1599 $ al año.

Modelos de licencia y precios de Asprise OCR

**La licencia Lite

  • Usuarios finales ilimitados
  • Reconocer texto
  • Lee códigos de barras 1D: UPC, EAN, Code39, Code128
  • Salida de texto, XML y PDF
  • Fácil despliegue
  • Sólo admite 2 sistemas operativos
  • Asientos 1
  • Soporte: No

    Precios: Desde $5998 al año.

    **Licencia estándar

  • Usuarios finales ilimitados
  • Entrada BMP, GIF, PNG, JPEG, TIFF y PDF.
  • Reconocer texto
  • Lee códigos de barras 1D: UPC, EAN, Code39, Code128
  • Leer algunas 2D: sólo QR y Data Matrix
  • Salida de texto, XML y PDF
  • Fácil despliegue
  • Soporte: No

    Precios: A partir de $ 7998 por año.

    **La licencia de empresa

  • Usuarios finales ilimitados
  • Entrada BMP, GIF, PNG, JPEG, TIFF y PDF.
  • Reconocer texto
  • Lee códigos de barras 1D: UPC, EAN, Code39, Code128
  • 2D: QR, PDF 417, Data Matrix y Aztec
  • Salida de texto, XML y PDF
  • Fácil despliegue
  • Multihilo, multiprocesamiento

    Precios: Comienza a partir de $ 12,998.

    IronOCR Lite, que incluye un paquete para un desarrollador con un año de soporte, cuesta alrededor de $599, mientras que Asprise Lite, que incluye un paquete para un desarrollador, cuesta $5998 sin soporte técnico, y $6296 con soporte técnico de pago. La licencia profesional de IronOCR, que incluye un paquete de 10 desarrolladores con un año de soporte técnico, cuesta 999 dólares, mientras que la licencia equivalente de Asprise, que incluye un paquete de 10 desarrolladores, cuesta 37.998 dólares al año sin soporte técnico, pero con versiones y actualizaciones técnicas de pago, además de soporte durante un año, cuesta 46.999 dólares.

Los paquetes IronOCR Lite y Professional disponen de servicio SaaS u OEM y una opción de soporte de 5 años. La versión Lite, que incluye un paquete para desarrolladores con 5 años de soporte y servicio Saas y OEM, cuesta 2897 USD, mientras que Asprise tiene un servicio SaaS u OEM y una opción de soporte personalizado. La versión IronOCR Professional incluye un paquete de 10 desarrolladores con un año de soporte de pago y servicio Saas y OEM cuesta 3.397 dólares, mientras que la versión Asprise con un paquete de 10 desarrolladores sin 1 año de soporte y con servicio SaaS y OEM cuesta 59.996 dólares.

8.0 Conclusión

IronOCR en el contexto de .NET Framework proporciona Tesseract que es sencillo y fácil de usar. Admite fotos y documentos PDF de diversas formas. También proporciona una serie de ajustes para mejorar el rendimiento de la biblioteca Tesseract OCR. Se admiten varios idiomas, así como numerosos idiomas en una sola operación. Para obtener más información sobre Tesseract OCR, visite su sitio web.

Asprise es una aplicación informática que utiliza un motor de inteligencia artificial para reconocer imágenes y documentos PDF. También proporciona varios ajustes para mejorar el rendimiento del proceso de OCR. Además, ofrece la opción de seleccionar varios idiomas. Asprise tiene algunas limitaciones en el uso de las conversiones de página. También tiene un precio diferente para los distintos sistemas operativos.

Los paquetes de IronOCR ofrecen mejores licencias y soporte en comparación con Asprise. Asprise OCR tiene paquetes personalizados y fijos que son más caros. IronOCR comienza desde $599, mientras que Asprise OCR comienza desde $5994 al año, por lo que nuestro producto es más rentable a la vez que proporciona más funciones que Aspire. También es compatible con múltiples plataformas a un precio único.

¿A qué espera? La prueba gratuita está abierta a todos. Puede obtener el Licencia aquí y empezar de inmediato.

< ANTERIOR
Comparación entre IronOCR y Leadtools OCR

¿Listo para empezar? Versión: 2024.6 recién publicada

Comenzar prueba gratuita Descargas totales: 1,834,537
Ver licencias >