Pruebas en un entorno real
Pruebe en producción sin marcas de agua.
Funciona donde lo necesites.
IronOCR es una biblioteca de OCR que puede utilizarse para reconocer datos de texto de imágenes para la extracción de información, incluido el OCR de recibos. Está basado en el motor Tesseract OCR, considerado uno de los motores OCR más precisos disponibles hasta la fecha para el reconocimiento de recibos. IronOCR puede utilizarse para leer texto con información clave de distintos tipos de documentos, como PNG, JPG, TIFF, formato JSON y PDF, y puede reconocer texto en varios idiomas.
Una de las características o servicios clave de IronOCR que lo hacen especialmente útil para el OCR de recibos es su capacidad paradetectar automáticamente la orientación del textoaunque la imagen haya sido girada o sesgada. Esto es esencial para el reconocimiento preciso del texto en la carga de recibos y para la extracción de datos, ya que los recibos suelen tener mucha información y pueden estar doblados o arrugados, lo que hace que el texto esté torcido.
Abra el software Visual Studio y vaya al menú Archivo. Seleccione "Nuevo Proyecto" y luego seleccione Aplicación de Consola.
Introduzca el nombre del proyecto y seleccione la ruta en el cuadro de texto correspondiente. A continuación, haga clic en el botón Crear. Seleccione el .NET Framework necesario, como en la captura de pantalla siguiente:
Creación de un nuevo proyecto en Visual Studio
El proyecto de Visual Studio generará ahora la estructura de la aplicación de consola. Una vez terminado, abrirá el archivo Program.cs, en el que podrá escribir y ejecutar el código fuente.
El archivo program.cs generado por el Asistente para nuevos proyectos de Visual Studio.
En Visual Studio, puede integrar fácilmente IronOCR con su proyecto C#. IronOCR ofrece múltiples formas de integración con un proyecto C# .NET. A continuación, hablaremos de uno de ellos: la instalación de IronOCR mediante el gestor de paquetes NuGet.
En Visual Studio, vaya a Herramientas > Administrador de paquetes NuGet > Consola del administrador de paquetes.
La consola del gestor de paquetes NuGet de Visual Studio
Tras hacer clic, aparecerá una nueva consola en la parte inferior de la ventana de Visual Studio. Escriba el siguiente comando en la consola y pulse Intro.
Install-Package IronOcr
IronOCR se instalará en sólo unos segundos.
IronOCR es una potente librería OCR que puede utilizarse para extraer y acceder a datos con detalles de recibos. Con IronOCR, puede tomar una foto de un recibo y convertirla en texto legible por máquina que puede ser fácilmente analizado y procesado sin comprometer la privacidad de los datos.
He aquí un ejemplo de cómo puede utilizar IronOCR para extraer texto de un recibo y mostrar cómo funciona el OCR de recibos.
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput("ocr.png")
Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
Dim RecognizedText As String = ocrResult.Text
Console.WriteLine(RecognizedText)
End Using
Consulte elLectura de texto a partir de una imagen para más detalles sobre cómo IronOCR lee texto de imágenes utilizando el lenguaje informático C#.
A continuación se muestra el resultado del código presentado anteriormente:
- LOGO SHOP
- LOREM IPSUM
- DOLOR SITAMET CONSECTETUR
- ADIPISCING ELIT
- 1 LOREM IPSUM $3.20
- 2 ORNARE MALESUADA $9.50
- 3 PORTA FERMENTUM $5.90
- 4 SODALES ARCU $6.00
- 5 ELEIFEND $9.00
- 6 SEMNISIMASSA $0.50
- 7 DUIS FAMES DIS $7.60
- 8 FACILISIRISUS $810
- TOTAL AMOUNT $49.80
- CASH $50.00
Como potente librería OCR, IronOCR permite a los desarrolladores obtener información importante de los recibos escaneados, incluyendo el importe de los impuestos y el nombre del comerciante.
He aquí un ejemplo de cómo podría utilizar IronOCR para extraer el valor del importe total de una imagen de recibo:
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
ocrTesseract.Language = OcrLanguage.English;
// Code line to load the receipt image
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
// Optimize the input image for OCR
ocrInput.DeNoise(true);
ocrInput.Contrast();
ocrInput.EnhanceResolution();
ocrInput.ToGrayScale();
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Search for the total price in the OCR result
var totalPrice = ocrResult.Text.Contains("Total:") ? ocrResult.Text.Split("Total:")[1].Split("\n")[0] : "";
Console.WriteLine("Total Price: " + totalPrice);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
ocrTesseract.Language = OcrLanguage.English;
// Code line to load the receipt image
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
// Optimize the input image for OCR
ocrInput.DeNoise(true);
ocrInput.Contrast();
ocrInput.EnhanceResolution();
ocrInput.ToGrayScale();
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Search for the total price in the OCR result
var totalPrice = ocrResult.Text.Contains("Total:") ? ocrResult.Text.Split("Total:")[1].Split("\n")[0] : "";
Console.WriteLine("Total Price: " + totalPrice);
}
Imports Microsoft.VisualBasic
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
ocrTesseract.Language = OcrLanguage.English
' Code line to load the receipt image
Using ocrInput As New OcrInput("ocr.png")
' Optimize the input image for OCR
ocrInput.DeNoise(True)
ocrInput.Contrast()
ocrInput.EnhanceResolution()
ocrInput.ToGrayScale()
Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
' Search for the total price in the OCR result
Dim totalPrice = If(ocrResult.Text.Contains("Total:"), ocrResult.Text.Split("Total:")(1).Split(vbLf)(0), "")
Console.WriteLine("Total Price: " & totalPrice)
End Using
Gracias a los múltiples ajustes que ofrece elOcrInput
es posible optimizar la imagen de entrada para obtener una mayor precisión en el proceso de OCR.
La imagen de entrada utilizada para demostrar la extracción de datos específicos de los recibos
- Total 16.5
IronOCR puede utilizarse para leer códigos de barras en recibos, así como texto. Para leer los códigos de barras de los recibos con IronOCR, deberá utilizar la funciónLector de códigos de barras en combinación con la claseLeer códigos de barra método.
He aquí un ejemplo de cómo puede utilizar IronOCR para leer códigos de barras en una imagen de recibo.
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput("b.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput("b.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Using ocrInput As New OcrInput("b.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
For Each barcode In ocrResult.Barcodes
Console.WriteLine(barcode.Value)
Next barcode
End Using
**Entrada para la lectura del código de barras
**Resultado del tratamiento de la imagen del código de barras.
El artículo anterior explica el proceso de instalación y uso de IronOCR en un proyecto C# para extraer datos de recibos, con un fragmento de código de ejemplo.
Lea el tutorial sobreleer texto a partir de imágenes.
IronOCR forma parte delIron Suiteque incluye cinco bibliotecas .NET diferentes para manipular documentos e imágenes. Puedecompre la Iron Suite completa por el precio de sólo dosLicencias IronOCR.
Pruebe IronOCR en sus aplicaciones de producción con unprueba gratuita.
10 productos API de .NET para sus documentos de oficina