USO DE IRONOCR

Cómo crear una demostración de software OCR en C#

Publicado en 6 de junio, 2024
Compartir:

Reconocimiento óptico de caracteres(OCR) es una tecnología que transforma diversos formatos de documentos, incluidos documentos en papel escaneados, PDF, archivos digitales o imágenes de texto impreso tomadas con una cámara digital, en datos de texto codificados por máquina que se pueden editar y buscar.

IronOCR es una gran librería de motor OCR que ofrece potentes funcionalidades OCR a los desarrolladores. En este artículo, vamos a explorar cómo realizar OCR utilizando IronOCR con ejemplos de código con OCR Software Demo.

¿Qué es IronOCR?

IronOCR es una potente biblioteca .NET diseñada para facilitar el reconocimiento óptico de caracteres(OCR) en aplicaciones C# y VB.NET. Aprovechando algoritmos avanzados y técnicas de aprendizaje automático, IronOCR puede extraer con precisión texto y contenido de archivos PDF, imágenes y archivos PDF escaneados, lo que facilita el procesamiento, la búsqueda y el análisis de dichos archivos mediante programación.

Gracias a su sencilla API y sus amplias funciones, los desarrolladores pueden integrar sin problemas funciones de OCR en sus aplicaciones para automatizar la extracción de datos, el procesamiento de documentos, la introducción de datos y las tareas de gestión de contenidos. Tanto si trabaja en el ámbito empresarial, con facturas, informes, extracción automatizada de datos, un PDF con capacidad de búsqueda o cualquier otro documento rico en texto, IronOCR ofrece una solución fiable para gestionar los requisitos de OCR de forma eficaz.

Primeros pasos con IronOCR

Antes de sumergirse en los ejemplos de código, es necesario instalarIronOCR a través del gestor de paquetes NuGet. Puede instalar IronOCR ejecutando el siguiente comando en la consola del gestor de paquetes:

Install-Package IronOcr
Install-Package IronOcr
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr
VB   C#

Realización de OCR con IronOCR

Reconocimiento básico de textos

Para realizar un reconocimiento de texto básico utilizando IronOCR, puede utilizar el siguiente fragmento de código:

using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
    OcrResult ocrResult = ocrTesseract.Read(ocrInput);
    string RecognizedText = ocrResult.Text;
    Console.WriteLine(RecognizedText);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
    OcrResult ocrResult = ocrTesseract.Read(ocrInput);
    string RecognizedText = ocrResult.Text;
    Console.WriteLine(RecognizedText);
}
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput("ocr.png")
	Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
	Dim RecognizedText As String = ocrResult.Text
	Console.WriteLine(RecognizedText)
End Using
VB   C#

Este código utiliza IronOCR para realizar el reconocimiento óptico de caracteres(OCR) en un archivo de imagen llamado "ocr.png". Inicializa un objeto IronTesseract y lee la capa de texto del archivo de imagen en un objeto OcrInput.

El resultado del OCR se recupera como TextoReconocido y se imprime en la consola.

Salida

``cs

 - TIENDA DE LOGOTIPOS

 - LOREM IPSUM

 - DOLOR SITAMET CONSECTETUR

 - ADIPISCING ELIT

 - 1 LOREM IPSUM $3.20

 - 2 ORNARE MALESUADA $9.50

 - 3 PORTA FERMENTUM $5.90

 - 4 SODALES ARCU $6.00

 - 5 ELEIFEND $9.00

 - 6 SEMNISIMASSA 0,50

 - 7 DUIS FAMES DIS $7.60

 - 8 FACILISIRISUS $810

 - IMPORTE TOTAL 49,80

 - EFECTIVO $50.00

### Opciones avanzadas de OCR

IronOCR ofrece varias opciones que le permiten personalizar el proceso de OCR según sus archivos de imagen y requisitos. Por ejemplo, puede especificar el idioma de OCR, ajustar la configuración de preprocesamiento de imágenes o activar la limpieza de texto. He aquí un ejemplo que muestra algunas de estas opciones avanzadas:

```cs
using IronOcr;
class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
    ocrInput.LoadImage(@"images\image.png");
        // Set OCR language to English
        ocr.Language = OcrLanguage.English;
        // Enable text cleaning
        ocrInput.DeNoise();
    ocrInput.EnhanceResolution(225);
        var result = ocr.Read(ocrInput);
        if (result != null && result.Text != null)
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}

El código utiliza IronOCR para realizar el OCR en un archivo de imagen "image.png" ubicado en la carpeta "images". Ajusta el idioma del OCR al inglés, limpia el ruido de la imagen y mejora su resolución. Se extrae el texto reconocido de la imagen y se imprime en la consola.

Cómo crear una demostración de software OCR en C#: Figura 1

Lectura de códigos de barras

IronOCR también admite la lectura de códigos de barras, lo que permite crear software para extraer información de códigos de barras de imágenes. A continuación se muestra un ejemplo de código que demuestra cómo leer un código de barras utilizando IronOCR:

using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
    Console.WriteLine(barcode.Value);
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
    Console.WriteLine(barcode.Value);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Dim ocrInput As New OcrInput()
ocrInput.LoadImage("images\imageWithBarcode.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
For Each barcode In ocrResult.Barcodes
	Console.WriteLine(barcode.Value)
Next barcode
VB   C#

El código utiliza IronOCR para detectar y leer códigos de barras de un archivo de imagen "imageWithBarcode.png" en la carpeta "images". Configura IronOCR para habilitar la lectura de códigos de barras estableciendo ReadBarCodes en true. A continuación, los valores de los códigos de barras detectados se imprimen en la consola.

Cómo crear una demostración de software OCR en C#: Figura 2

Extracción de texto PDF

IronOCR también puede extraer texto de PDF y documentos escaneados. He aquí un ejemplo de código que demuestra cómo extraer texto de un archivo PDF utilizando IronOCR:

using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
Private ocrInput = New OcrInput()
' OCR entire document
ocrInput.LoadPdf("Email_Report.pdf")
Dim pages() As Integer = { 1, 2, 3, 4, 5 }
' Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
VB   C#

El código utiliza IronOCR para realizar el procesamiento OCR en un documento PDF llamado "Email_Informe.pdf". Puede OCR todo el documento utilizando LoadPdf, o páginas específicas de "ejemplo.pdf" utilizando LoadPdfPages con una contraseña. El texto reconocido de la operación OCR se imprime en la consola.

Cómo crear una demostración de software OCR en C#: Figura 3

Conclusión

IronOCR es una potente biblioteca .NET que ofrece funciones avanzadas de software de OCR, lo que facilita a los desarrolladores la realización de tareas de OCR en sus aplicaciones. En este artículo, exploramos cómo realizar una demostración básica y avanzada de software OCR utilizando IronOCR con ejemplos de código.

Si necesita reconocer texto manuscrito, varios formatos digitales, escanear y leer códigos de barras, o extraer texto de documentos PDF, IronOCR le tiene cubierto con su completo conjunto de funciones.

Si está trabajando en un proyecto .NET y necesita integrar funciones de OCR, merece la pena tener en cuenta IronOCR a la hora de buscar entre los distintos motores de OCR. Su facilidad de uso, velocidad, flexibilidad y amplia documentación lo convierten en una opción popular entre los desarrolladores para tareas de automatización de OCR.

¿Por qué no prueba IronOCR y comprueba cómo puede simplificar el proceso de desarrollo de su propio proyecto de OCR? Puede ser el mejor motor de OCR para sus proyectos.

IronOCR ofrece unlicencia de prueba a partir de 749 USD, lo que le permite seguir sacando el máximo partido de IronOCR en sus proyectos.

Para saber más sobre IronOCR, visiteaquí.

< ANTERIOR
Tesseract OCR para múltiples idiomas (Tutorial para desarrolladores)
SIGUIENTE >
Cómo realizar el OCR del registro de vehículos en C#

¿Listo para empezar? Versión: 2024.11 acaba de salir

Descarga gratuita de NuGet Descargas totales: 2,698,613 Ver licencias >