COMPARACIóN CON OTROS COMPONENTES

Comparación entre IronOCR y Aspose.OCR

Actualizado 26 de enero, 2023
Compartir:

OCR significa reconocimiento óptico de caracteres. Es la tecnología que utiliza una máquina para convertir imágenes de texto en texto digital que puede buscarse y editarse.

Esta tecnología existe desde hace tiempo, pero se está popularizando con el avance del aprendizaje automático. Recientemente, en los últimos dos años, los informáticos han desarrollado un algoritmo capaz de leer la escritura cursiva, que mucha gente sigue utilizando hoy en día, incluidos médicos y abogados. Los usos de esta herramienta incluyen escanear un libro entero, extraer el texto de una sola letra, convertir un archivo PDF entero en un formato editable, reconocimiento de documentos, independencia de la plataforma TIFF, etc. El motor de reconocimiento óptico de caracteres puede utilizarse en muchos sectores distintos, como medios de comunicación y editoriales, bufetes de abogados, bibliotecas, organismos públicos de registro, etc. Muchas empresas utilizan programas de OCR para digitalizar cheques y extractos en papel, corregir automáticamente la ortografía o para la consola de texto reconocido, con lo que ahorran tiempo y esfuerzo al escanear documentos a mano.

A veces, el texto de las imágenes no está en español. En ese caso, lo que hay que hacer es utilizar una herramienta de OCR que ejecute la traducción en la imagen PNG antes de extraer y convertir el texto en caracteres ingleses.

En este artículo, vamos a comparar dos de las bibliotecas y aplicaciones más comunes para formatos raster OCR e imágenes de documentos PDF. Estos son:

  • Aspose.OCR
  • IronOCR

1.0 Introducción

1.1 Introducción y características de Aspose.OCR

Aspose.OCR para .NET es un paquete potente y robusto para el reconocimiento óptico de caracteres. Es un complemento excelente para cualquier aplicación y puede automatizar el proceso. La API de OCR independiente es ampliable, fácil de usar y compacta. Viene con un sencillo conjunto de clases que proporcionan toda la funcionalidad que necesita para empezar a reconocer texto sin ninguna molestia adicional y mantener el orden correcto del texto. Aspose.OCR puede leer más de 100 formatos diferentes y ofrece un sinfín de funciones útiles, que van desde la capacidad de leer fuentes, aplicar efectos de estilo (negrita/cursiva)e incluso eliminar el ruido de la imagen. La API puede utilizar la GPU para realizar el reconocimiento óptico de caracteres y ahorrar energía a la CPU.

Características de Aspose.OCR

  • Detecte, identifique y lea caracteres de imágenes mediante programación.
  • Escanee toda la imagen o sólo una parte específica de la misma.
  • Corrección de la inclinación para el funcionamiento del OCR. Escanear imágenes giradas.
  • Admite JPEG, PNG, GIF, etc. Para obtener la lista completa de formatos de archivo compatibles, visite la página Formatos de archivo compatibles y suscríbase al producto Aspose.
  • Compatible con muchos caracteres, incluidos números y alfabetos. Para consultar la lista completa de caracteres compatibles, visite la página Caracteres compatibles.
  • Actualmente admite 20 lenguas europeas y el chino.
  • Detecta y lee fuentes populares como Arial, Times New Roman, Courier New, Tahoma, Calibri y Verdana.
  • Admite estilos de fuente normal, negrita y cursiva.
  • Aplicación de varios filtros de eliminación de ruido para ayudar al reconocimiento de imágenes.
  • Calcular los cuadros delimitadores de líneas o párrafos.
  • Obtenga las opciones posibles para cada carácter reconocido.
  • Pasar URI y reconocer la imagen a partir de ella.
  • Reconoce múltiples imágenes en una carpeta o archivo zip.
  • Obtener resultados en formato JSON.
  • Guardar los resultados en formato de texto, DOCX o PDF

    Para la integración de la navegación de palanca, Aspose es una buena opción por ahí. La consola de texto reconocido y la API de reconocimiento de texto de documentos o de imagen a texto o imagen OCR son ejemplos de funcionalidades que pueden ser útiles.

    Además de la corrección ortográfica automática, el software de detección de imágenes también está diseñado para admitir diversos formatos de salida (como PNG) e ignorar los bloques no textuales sin necesidad de una API de OCR adicional. Se puede acceder a las funciones independientes de la API en el entorno de desarrollo para capturar texto de imágenes.

1.2 IronOCR - Introducción y características

IronOCR for .NET lee el contenido de texto de fotos y PDF en aplicaciones y sitios web .NET. El software ayuda a escanear fotos en busca de texto y códigos de barras. Da salida al contenido como texto sin formato o datos estructurados. IronOCR es compatible con numerosos idiomas de todo el mundo. La biblioteca OCR puede utilizarse en aplicaciones .NET MVC, Web, de consola y de escritorio. Para las implantaciones comerciales, la concesión de licencias cuenta con la asistencia directa del equipo de desarrollo.

  • Utilizando el último motor Tesseract 5, IronOCR lee texto, códigos de barras y códigos QR de cualquier imagen o formato PDF. Esta biblioteca añade rápidamente OCR a las aplicaciones de escritorio, consola y web.
  • IronOCR admite 127 idiomas internacionales. También admite idiomas personalizados y listas de palabras.
  • Puede leer más de 20 formatos de códigos de barras y códigos QR.
  • IronOCR admite los formatos de imagen GIF y TIFF multipágina.
  • Corrige las imágenes escaneadas de baja calidad.
  • IronOCR admite multihilo. Puede ejecutar uno o varios procesos a la vez.
  • IronOCR puede proporcionar salida de datos estructurados a páginas, párrafos, líneas, palabras, caracteres, etc.
  • IronOCR es compatible con sistemas operativos como Windows, Linux, macOS, etc.

2. Creación de un nuevo proyecto en Visual Studio

Abra Visual Studio y vaya al menú Archivo. Seleccione Nuevo proyecto y, a continuación, Aplicación de consola.

Comparación entre IronOCR y Aspose.OCR - Figura 1: Consola App

Consola App

Introduzca el nombre del proyecto y seleccione la ruta del archivo en el cuadro de texto correspondiente. A continuación, haga clic en el botón Crear y elija un .NET Framework:

A Comparison between IronOCR and Aspose.OCR - Figure 2: Configuración del nuevo proyecto

Configuración del nuevo proyecto

El proyecto generará ahora la estructura para la aplicación seleccionada.

Comparación entre IronOCR y Aspose.OCR - Figura 3: Archivo Program.cs

Archivo Program.cs

3.0 Instalación

3.1 Instalar Aspose.OCR

Instalación de Aspose.OCR para .NET a través de NuGet

Podemos instalar la API Aspose.OCR en nuestra aplicación utilizando NuGet. Basta con ir al menú Herramientas de Visual Studio y seleccionar el Gestor de paquetes NuGet. En el menú lateral, seleccione Gestionar paquete NuGet para una solución. Se abrirá una ventana del Gestor de paquetes NuGet. Vaya a la pestaña Examinar y busque Aspose.OCR. A continuación, seleccione Aspose API en los resultados de la búsqueda y haga clic en el botón "Instalar". La API de Aspose estará instalada y lista para su uso en el proyecto.

Comparación entre IronOCR y Aspose.OCR - Figura 4

Instalar o actualizar Aspose.OCR mediante la consola del gestor de paquetes

Del mismo modo, puede instalar Aspose.OCR mediante la consola. Abre la consola NuGet, que normalmente se encuentra en la parte inferior de un proyecto de Visual Studio, escribe el siguiente comando y pulsa intro.

“Install-Package Aspose.OCR -Version x.x.0”

3.2 Instalación de IronOCR

La biblioteca IronOCR puede descargarse e instalarse de cuatro maneras.

Estos son:

  • Utilización de Visual Studio.
  • Uso de la línea de comandos.
  • Descárguelo directamente del sitio web de NuGet.
  • Descárguelo del sitio web de IronPDF.

3.2.1 Utilización de Visual Studio

La siguiente captura de pantalla muestra cómo abrir el Gestor de paquetes NuGet.

Comparación entre IronOCR y Aspose.OCR - Figura 5: Gestor de paquetes NuGet

Gestor de paquetes NuGet

En la ventana del Gestor de Paquetes, haga clic en Browse y busque la palabra clave "IronOCR", como en la siguiente captura de pantalla:

A Comparison between IronOCR and Aspose.OCR - Figure 6: Instalación de IronOCR

Instalación de IronOCR

En la imagen anterior, podemos ver la lista de las búsquedas relacionadas. Debemos seleccionar la opción necesaria para instalar el paquete en la solución.

3.2.2 Utilizar la línea de comandos

  • En Visual Studio: Vaya a Herramientas -> Administrador de paquetes NuGet -> Consola del Administrador de paquetes
  • Introduzca la siguiente línea en la pestaña de la consola.
Install-Package IronOcr
  • Ahora el paquete se descargará/instalará en el proyecto actual y estará listo para su uso.

3.2.3 Descarga directa desde el sitio web de NuGet

La tercera forma es descargar el paquete NuGet directamente del sitio web.

  • Navegue hasta el enlace.
  • Seleccione la opción de descarga de paquetes en el menú de la derecha.
  • Haga doble clic en el paquete descargado. Se instalará automáticamente.
  • A continuación, vuelva a cargar la solución y empiece a utilizarla en el proyecto.

3.2.4 Descarga directa desde el sitio web de IronOCR

Haga clic en el botón enlace aquí para descargar el último paquete directamente del sitio web. Una vez descargado, siga los pasos que se indican a continuación para añadir el paquete al proyecto.

  • Haga clic con el botón derecho del ratón en el proyecto de la ventana Solución.
  • A continuación, seleccione la opción Referencia y busque la ubicación de la referencia descargada.
  • A continuación, haga clic en Aceptar para añadir la referencia.

4.0 Imagen OCR

Tanto IronOCR como Aspose.OCR disponen de una tecnología OCR que convierte imágenes en texto.

4.1 Utilización de Aspose.OCR

El siguiente fragmento de código demuestra el uso de la función ReconocerImagen para realizar una operación de OCR en la imagen de una página.

//  Para ver ejemplos completos y archivos de datos, visite https://github.com/aspose-ocr/Aspose.OCR-for-.NET.
//  La ruta al directorio de documentos.
string dataDir = RunExamples.GetDataDir_OCR();
//  Inicializar una instancia de AsposeOcr
AsposeOcr api = new AsposeOcr();
//  Reconocer imagen
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");
//  Mostrar el texto reconocido
Console.WriteLine(result);
//  Para ver ejemplos completos y archivos de datos, visite https://github.com/aspose-ocr/Aspose.OCR-for-.NET.
//  La ruta al directorio de documentos.
string dataDir = RunExamples.GetDataDir_OCR();
//  Inicializar una instancia de AsposeOcr
AsposeOcr api = new AsposeOcr();
//  Reconocer imagen
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");
//  Mostrar el texto reconocido
Console.WriteLine(result);
'  Para ver ejemplos completos y archivos de datos, visite https://github.com/aspose-ocr/Aspose.OCR-for-.NET.
'  La ruta al directorio de documentos.
Dim dataDir As String = RunExamples.GetDataDir_OCR()
'  Inicializar una instancia de AsposeOcr
Dim api As New AsposeOcr()
'  Reconocer imagen
Dim result As String = api.RecognizeImage(dataDir & "Sampleocr.bmp")
'  Mostrar el texto reconocido
Console.WriteLine(result)
VB   C#

El siguiente fragmento de código demuestra el uso de la función ReconocerLínea para realizar una operación de OCR en una imagen que contiene una sola línea.

//  Para ver ejemplos completos y archivos de datos, visite https://github.com/aspose-ocr/Aspose.OCR-for-.NET.
//  La ruta al directorio de documentos.
string dataDir = RunExamples.GetDataDir_OCR();

//  Inicializar una instancia de AsposeOcr
AsposeOcr api = new AsposeOcr();

//  Reconocer imagen
string result = api.RecognizeLine(dataDir + "sample_line.png");

//  Mostrar el texto reconocido
Console.WriteLine(result);
//  Para ver ejemplos completos y archivos de datos, visite https://github.com/aspose-ocr/Aspose.OCR-for-.NET.
//  La ruta al directorio de documentos.
string dataDir = RunExamples.GetDataDir_OCR();

//  Inicializar una instancia de AsposeOcr
AsposeOcr api = new AsposeOcr();

//  Reconocer imagen
string result = api.RecognizeLine(dataDir + "sample_line.png");

//  Mostrar el texto reconocido
Console.WriteLine(result);
'  Para ver ejemplos completos y archivos de datos, visite https://github.com/aspose-ocr/Aspose.OCR-for-.NET.
'  La ruta al directorio de documentos.
Dim dataDir As String = RunExamples.GetDataDir_OCR()

'  Inicializar una instancia de AsposeOcr
Dim api As New AsposeOcr()

'  Reconocer imagen
Dim result As String = api.RecognizeLine(dataDir & "sample_line.png")

'  Mostrar el texto reconocido
Console.WriteLine(result)
VB   C#

4.2 Utilización de IronOCR

var Ocr = new IronTesseract(); //  nada que configurar
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
var Ocr = new IronTesseract(); //  nada que configurar
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
Dim Ocr = New IronTesseract() '  nada que configurar
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("3.png")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Console.ReadKey()
End Using
VB   C#

Más arriba se muestra la API de Tesseract 5, que nos permite convertir archivos de imagen en texto. Estamos creando un objeto para IronTesseract en la línea de código anterior. También estamos creando un objeto OcrInput que nos permitirá añadir uno o más archivos de imagen. Puede que necesitemos dar la ruta de la imagen disponible dentro del código cuando utilicemos el método add del objeto OcrInput. Se puede añadir cualquier número de imágenes. La función "Read" en el objeto IronTesseract que construimos antes puede ser utilizada para obtener las imágenes parseando el fichero de imagen y extrayendo el resultado en el resultado OCR. Es capaz de extraer texto de las fotos y convertirlo en una cadena.

También podemos utilizar Tesseract para añadir imágenes de varios fotogramas. AddMultiFrameTiff es un método diferente para esta operación. La biblioteca Tesseract lee cada fotograma de la imagen, y cada fotograma se trata como una página distinta. El proceso leerá el primer fotograma de la imagen y pasará al siguiente, y así sucesivamente hasta que se hayan escaneado todos los fotogramas de la imagen. Este método sólo admite el formato de imagen TIFF.

A Comparison between IronOCR and Aspose.OCR - Figure 74: Instalación de IronOCR

Instalación de IronOCR

La imagen anterior es la salida del resultado IronOCR que ha convertido con precisión los datos en texto editable.

5.0 OCR de archivos PDF

IronOCR y Aspose.OCR convierten archivos PDF en texto editable. Aspose.OCR proporciona una lista de opciones al usuario, como guardar la página, editar la imagen, reconocer la página, etc. También proporciona opciones de guardado como texto, documento, formato HTML, etc. IronOCR también nos permite guardar un archivo OCR convertido en HTML, texto, PDF, etc.

5.1 Utilización de Aspose.OCR

Aspose.OCR proporciona el método RecognizePdf que puede reconocer texto en las imágenes extraídas de archivos PDF escaneados. El método RecognizePdf toma como parámetro la ruta del PDF y el objeto DocumentRecognitionSettings. El siguiente fragmento de código muestra el uso del método "RecognizePdf" para reconocer imágenes de un archivo PDF multipágina escaneado.

//  La ruta del archivo PDF
string dataDir = RunExamples.GetDataDir_OCR();
//  Ruta de archivo
string fullPath = dataDir + "OCR.pdf";
//  Reconocer imágenes de PDF           
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
            set.DetectAreas = false;
    List<RecognitionResult> result = api.RecognizePdf(imgPath, set);
//  Imprimir resultado
int pageNumber = 0;
    foreach (var page in result)
    {                
        System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
    }
//  La ruta del archivo PDF
string dataDir = RunExamples.GetDataDir_OCR();
//  Ruta de archivo
string fullPath = dataDir + "OCR.pdf";
//  Reconocer imágenes de PDF           
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
            set.DetectAreas = false;
    List<RecognitionResult> result = api.RecognizePdf(imgPath, set);
//  Imprimir resultado
int pageNumber = 0;
    foreach (var page in result)
    {                
        System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
    }
'  La ruta del archivo PDF
Dim dataDir As String = RunExamples.GetDataDir_OCR()
'  Ruta de archivo
Dim fullPath As String = dataDir & "OCR.pdf"
'  Reconocer imágenes de PDF           
Dim [set] As New DocumentRecognitionSettings()
			[set].DetectAreas = False
	Dim result As List(Of RecognitionResult) = api.RecognizePdf(imgPath, [set])
'  Imprimir resultado
Dim pageNumber As Integer = 0
	For Each page In result
'INSTANT VB WARNING: An assignment within expression was extracted from the following statement:
'ORIGINAL LINE: System.Console.WriteLine(string.Format("Page: {0} text: {1}", pageNumber++, page.RecognitionText));
		System.Console.WriteLine($"Page: {pageNumber} text: {page.RecognitionText}")
		pageNumber += 1
	Next page
VB   C#

5.2 Utilización de IronOCR

También podemos utilizar OCRInput para gestionar archivos PDF. Cada página de un documento será leída por la clase IronTesseract. A continuación, se extraerá el texto de las páginas. También podemos abrir documentos protegidos utilizando una segunda función llamada AddPDF, que nos permite añadir PDFs a nuestra lista de documentos (contraseña si está protegido). El siguiente código muestra cómo abrir un documento PDF protegido por contraseña:

var Ocr = new IronTesseract(); //  nada que configurar
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract(); //  nada que configurar
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract() '  nada que configurar
Using Input = New OcrInput()
	Input.AddPdf("example.pdf", "password")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

Podemos leer y extraer el contenido de una sola página de un documento PDF utilizando AddPdfPage. Sólo es necesario especificar el número de la página de la que queremos extraer el texto. AddPdfPage nos permite extraer texto de numerosas páginas que especifiquemos. En IEnumerable&lt;int&gt;, podemos especificar fácilmente múltiples páginas. También debemos incluir la ubicación del archivo, así como su extensión. Esto se demuestra en el siguiente ejemplo de código:

IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //una sola página
    Input.AddPdfPage("example.pdf",10);
    //Varias páginas
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //una sola página
    Input.AddPdfPage("example.pdf",10);
    //Varias páginas
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
Dim numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
 Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	'una sola página
	Input.AddPdfPage("example.pdf",10)
	'Varias páginas
	Input.AddPdfPages("example.pdf", numbers)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Result.SaveAsTextFile("ocrtext.txt")
End Using
VB   C#

Utilizando la función SaveAsTextFile, podemos almacenar el resultado como un archivo de texto, lo que nos permite descargar el archivo a la ruta del directorio de salida. Además, podemos guardar el archivo en un archivo HTML utilizando SaveAsHocrFile.

6.0 Otras características

6.1 Utilización de Aspose.OCR

Aspose.OCR tiene algunas opciones adicionales como Dibujar área de texto, Dibujar área de imagen, Dibujar área de tabla, Dibujar área de reconocimiento, etc. Todas ellas ayudan al usuario a mejorar el rendimiento del OCR. La aplicación no sólo realiza OCR, sino que también podemos realizar operaciones como combinar PDFs, dividir PDFs, editar PDFs, etc.

6.2 Utilización de IronOCR

IronOCR tiene características únicas que nos permiten leer códigos de barras y códigos QR de documentos escaneados. Los siguientes códigos muestran cómo podemos leer un código de barras de una imagen o documento dado.

var Ocr = new IronTesseract(); //  nada que configurar
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
var Ocr = new IronTesseract(); //  nada que configurar
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Dim Ocr = New IronTesseract() '  nada que configurar
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("barcode.gif")
	Dim Result = Ocr.Read(Input)

	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
VB   C#

Lo anterior es el código que ayuda a leer un código de barras de una imagen dada o documento PDF. Puede leer más de un código de barras de la página/imagen. Para leer el código de barras, IronOCR tiene una configuración única, Ocr.Configuration.ReadBarCodes. El valor por defecto es falso.

Después de leer la entrada, los datos se guardarán en el objeto llamado OCRResult. Este tiene una propiedad llamada Barcodes, y tendrá todos los datos de código de barras disponibles en una lista. Usando el bucle foreach, podemos obtener todos los detalles del código de barras uno a uno. Además, escaneará el código de barras y leerá su valor: dos operaciones completadas en un solo proceso.

También admitirá opciones de roscado. Podemos realizar múltiples procesos de OCR a la vez. IronOCR también es capaz de reconocer un área específica de una región especificada.

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
} 
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
} 
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	Input.Add("document.png", ContentArea)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

Este es el código de ejemplo para realizar el OCR en una región específica. Sólo tenemos que especificar la región rectangular en la imagen o PDF. El motor Tesseract de IronOCR nos ayuda a reconocer el texto.

Modelos de licencia y precios de IronOCR y Aspose.OCR

Modelos de licencia y precio de IronOCR

Garantía de devolución del dinero de 30 días: IronOCR tiene una política de devolución del dinero de 30 días. Por lo tanto, si cambia de opinión después de comprar el software, puede reclamar el reembolso de su dinero en un plazo de 30 días.

Fácil integración: La integración de IronOCR con un proyecto y entorno es tan sencilla que podemos hacerlo escribiendo una sola línea de código y añadiéndolo desde NuGet Package. O podemos descargarlo de la web e integrarlo así en nuestro entorno.

Licencia perpetua: Cada licencia se adquiere una vez y no requiere renovación.

Asistencia y actualizaciones del producto gratuitas: Cada licencia viene con un año de actualizaciones gratuitas del producto y el apoyo del equipo detrás del producto. Es posible adquirir extensiones en cualquier momento. Se pueden ver las extensiones.

Licencias inmediatas: Las claves de licencia registradas se envían en cuanto se recibe el pago.

Todas las licencias son perpetuas y se aplican al desarrollo, la puesta en marcha y la producción.

El paquete Lite

  • 1 promotor
  • 1 ubicación
  • 1 proyecto
  • Licencia perpetua

    Este paquete permite a un único desarrollador de software de una organización utilizar este software Iron en un único lugar. Puede utilizarse en una aplicación web, una aplicación de intranet o un programa de software de escritorio. Las licencias son intransferibles y no pueden compartirse fuera de una organización o de una relación agencia/cliente. Este tipo de licencia, al igual que todos los demás tipos de licencia, excluye expresamente todos los derechos no concedidos expresamente en virtud del Acuerdo, sin redistribución OEM y utilizando Iron Software como SaaS sin adquirir cobertura adicional.

    Precios: A partir de 499 $ al año.

La licencia profesional

  • 10 promotores
  • 10 emplazamientos
  • 10 proyectos
  • Licencia perpetua

    Esto permite a un número predeterminado de desarrolladores de software de una organización utilizar este software Iron en ubicaciones individuales, hasta un máximo de diez. IronOCR puede utilizarse en tantos sitios web, aplicaciones de intranet o aplicaciones de software de escritorio como se desee. Este tipo de licencia, al igual que todos los demás tipos de licencia, excluye expresamente todos los derechos no concedidos expresamente en virtud del Acuerdo, incluida la redistribución OEM y la utilización del Software Iron como SaaS sin adquirir cobertura adicional. Esta licencia puede integrarse en un solo proyecto hasta un máximo de 10.

    Precios: Desde 999 $ al año.

La licencia ilimitada

  • Desarrolladores ilimitados
  • Ubicaciones ilimitadas
  • Proyectos ilimitados
  • Licencia perpetua

    Esto permite que un número ilimitado de desarrolladores de software de una organización utilicen este software Iron en un número ilimitado de ubicaciones. Puede utilizarse en tantos sitios web, aplicaciones de intranet o aplicaciones de software de escritorio como se desee. Las licencias son intransferibles y no pueden compartirse fuera de una organización o de una relación agencia/cliente. Este tipo de licencia, al igual que todos los demás tipos de licencia, excluye expresamente todos los derechos no concedidos expresamente en virtud del Acuerdo, incluida la redistribución OEM y la utilización del Software Iron como SaaS sin adquirir cobertura adicional.

    Precios: A partir de 2999 $ al año.

    Redistribución libre de regalías - Esto le permite distribuir este software Iron como parte de una serie de productos comerciales empaquetados de forma diferente. (sin tener que pagar derechos de autor) en función del número de proyectos cubiertos por la licencia base. Permite el despliegue del software Iron dentro de los servicios de software SaaS, en función del número de proyectos cubiertos por la licencia base.

    Precios: Desde 1599 $ al año.

    Comparación entre IronOCR y Aspose.OCR - Figura 8: Precios

    Precios

Modelos de licencia y precios de Aspose

La licencia de desarrollador de pequeñas empresas

Una licencia de desarrollador para pequeñas empresas permite a un desarrollador crear software ilimitado para el usuario final utilizando el producto, e instalarlo en una única ubicación física dentro de su organización. Cuando implante software para usuarios finales, tendrá que adquirir una licencia para cada desarrollador de su equipo de desarrollo o para cada ubicación física en la que se vaya a utilizar. La licencia de desarrollador para pequeñas empresas no le permite distribuir su software de usuario final a terceros, sitios web públicos y aplicaciones, extranets, intranets multisitio o software como servicio. (SaaS) escenarios de uso del proyecto. Sólo puede implantar las aplicaciones que desarrolle con una licencia OEM en un único cliente. Si desea crear bibliotecas para uso de otras empresas o distribuir sus creaciones como software de código abierto, necesitará otro tipo de licencia.

Precios: Desde 799 $ al año.

La licencia OEM para desarrolladores

La licencia OEM para desarrolladores significa que un desarrollador puede utilizar el producto en cualquier número de ordenadores y en cualquier lugar en el que se encuentre. Así, si estás trabajando en una oficina pero necesitas hacer algo en otra durante una hora, es posible con este tipo de licencia. Una licencia de desarrollador OEM cubre a un productor de productos de software, es decir, alguien que no es distribuidor autorizado del producto pero que está creando software que utiliza sus funciones. Para distribuir software de usuario final a un usuario final, necesitará este tipo de licencia. Para permitir la distribución de software de usuario final a terceros, sitios web/aplicaciones de cara al público, extranets, intranets multisitio o escenarios de uso de proyectos SaaS, debe adquirirse una licencia de desarrollador para cada desarrollador del equipo de desarrollo. Esta licencia no permite crear software como API o SDK para usuarios finales.

Precios: A partir de 2397 $ al año.

El sitio Licencia para pequeñas empresas

Una licencia Site Small Business permite a un máximo de diez desarrolladores crear software ilimitado para el usuario final utilizando el producto, que se puede utilizar en cualquiera de sus diez ubicaciones físicas (Por ejemplo, edificios de oficinas independientes o, si no es una empresa con varias oficinas, cualquier ubicación física.). Si tiene más de diez desarrolladores o desea utilizar Aspose en más de diez ubicaciones, puede adquirir una licencia para pequeñas empresas con múltiples ubicaciones. Esta licencia no permite la distribución del software creado con esta licencia a otras organizaciones.

Precios: A partir de 3995 $ al año.

Licencia OEM con contador

Una licencia OEM con contador admite desarrolladores ilimitados, ubicaciones ilimitadas y software de usuario final ilimitado. Permite a los usuarios distribuir el software de usuario final a terceros. La licencia OEM con contador es para sitios web/aplicaciones de uso público y puede utilizarse para apoyar extranets o proyectos SaaS. Crea software de usuario final que se utiliza en una biblioteca de desarrollo que dispone de una API o SDK.

Precios: A partir de $1999 al año.

Comparación entre IronOCR y Aspose.OCR - Figura 9: Precios de Aspose

Precios de Aspose

La licencia IronOCR Lite que incluye un paquete para desarrolladores con un año de soporte cuesta unos 499 dólares, mientras que Aspose.OCR con un paquete para desarrolladores cuesta 799 dólares con soporte técnico gratuito y 1.198 dólares con soporte de pago. La licencia Professional de IronOCR, que incluye 10 paquetes para desarrolladores y un año de soporte, cuesta 999 dólares, mientras que Aspose Site OEM, que incluye 10 paquetes para desarrolladores, cuesta 11.186 dólares al año con soporte técnico gratuito, mientras que las versiones y actualizaciones técnicas de pago elevan esa cifra a 23.171 dólares.

Los paquetes IronOCR Lite y Professional disponen de servicio SaaS u OEM y una opción de soporte de 5 años. El paquete Lite, que incluye un paquete para un desarrollador con 5 años de soporte y servicio SaaS y OEM, cuesta 2.897 dólares, mientras que Aspose dispone de SaaS o servicio OEM y opciones de soporte personalizadas. La licencia IronOCR Professional incluye un paquete para 10 desarrolladores con un año de soporte de pago y servicio SaaS y OEM, todo ello por el precio de 23.171 dólares, mientras que Aspose ofrece un paquete para 10 desarrolladores sin soporte pero con servicio SaaS y OEM por el precio de 11.186 dólares.

7.0 Conclusión

IronOCR en el contexto del marco .NET proporciona Tesseract que es sencillo y fácil de usar. Admite fotos y documentos PDF de diversas formas. También proporciona una serie de ajustes para mejorar el rendimiento de la biblioteca Tesseract OCR. Se admiten varios idiomas en una sola operación. Para obtener más información sobre Tesseract OCR, visite su sitio web.

Aspose OCR es una aplicación de software que utiliza un motor de inteligencia artificial para reconocer imágenes y documentos PDF. También proporciona varios ajustes para mejorar el rendimiento del proceso de OCR. Además, ofrece la opción de seleccionar varios idiomas y, a continuación, realizar el OCR. Aspose tiene algunas limitaciones en el uso de conversiones de página. También tiene un precio diferente para los distintos sistemas operativos.

Los paquetes IronOCR ofrecen mejores licencias y soporte en comparación con Aspose. Además, Aspose es más caro. IronOCR cuesta a partir de 499 dólares, mientras que Aspose cuesta 999 dólares al año. Además, IronOCR ofrece más funciones que Aspose y es compatible con varias plataformas a un precio único.

¿A qué espera? La prueba gratuita está abierta a todos. Puede obtener el licencia aquí y empezar de inmediato.

< ANTERIOR
Comparación entre IronOCR y Nanonets OCR
SIGUIENTE >
Comparación entre IronOCR y Syncfusion OCR

¿Listo para empezar? Versión: 2024.7 recién publicada

Descarga gratuita de NuGet Descargas totales: 2,012,139 Ver licencias >
123