Saltar al pie de página

Resultados de OCR

Obtenga algo más que texto. Nuestra API proporciona datos estructurados que incluyen coordenadas, puntuaciones de confianza y una jerarquía completa del documento (páginas, líneas, palabras).

Icon Main related to Resultados de OCR
Salida de datos

1

Textos

IronOCR devuelve la salida de texto para párrafos, líneas, palabras y caracteres como objetos estructurados y cadenas, lo que permite a los desarrolladores acceder a los datos y manipularlos rápidamente.

using IronOcr;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    // Page text
    string PageText = page.Text;
}
C#
2

Localización de textos OCR

Obtenga las coordenadas X/Y precisas y las dimensiones del cuadro delimitador de cada párrafo, línea, palabra y carácter, lo que permite resaltar texto, realizar OCR por zonas y validar datos.

Aprenda a:Extraer resultados de lectura en .NET C#
using IronOcr;
using IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;

// Output Text location (X,Y) of the first paragraph
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
C#
3

Confianza en el resultado OCR

Recibe una puntuación de confianza para los textos extraídos. Marque de forma programática los resultados de baja confianza para su revisión humana con el fin de crear flujos de trabajo de automatización más fiables.

Aprenda a:Conseguir confianza de lectura en .NET C#
using IronOcr;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Load image from file
ocrInput.LoadImage("sameple.png");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Check Confidence level
Console.WriteLine($"Confidence: {ocrResult.Confidence}%");
C#
4

Imágenes de elementos OCR

Además del texto, exporte los elementos visuales de los textos detectados a partir del OCR del documento de entrada como archivos de imagen independientes, útiles para archivar o procesar datos no textuales.

Aprenda a:Extraer resultados de lectura en .NET C#
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage("sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    foreach (var word in page.Words)
    {
        word.ToBitmap(ocrInput).SaveAs($"page{page.PageNumber}_word{word.WordNumber}.png", AnyBitmap.ImageFormat.Png);
    }
}
C#

Icon Main related to Resultados de OCR
Tipos de resultados

1

Texto

Accede a los resultados del OCR a través de una API estructurada y jerárquica. Navegue fácilmente desde párrafos extensos hasta caracteres individuales, lo que le proporciona un control granular sobre el texto extraído y sus metadatos.

Aprenda a:Extraer resultados de lectura en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Output the first detected paragraph text
Console.WriteLine($"Text: {ocrResult.Paragraphs[0].Text}");
C#
2

PDFs buscables

Convierta cualquier documento o imagen escaneada en un archivo PDF que permita realizar búsquedas. Se conserva el diseño original, pero todo el texto se puede seleccionar, copiar y encontrar.

Aprenda a:Guardar los resultados como PDF con función de búsqueda
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as searchable PDF
ocrTesseract.Configuration.RenderSearchablePdf = true;

// Add image
using var imageInput = new OcrImageInput("sample.tiff");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf");
C#
3

hOCR

Exporte los resultados en formato hOCR, un estándar basado en HTML que proporciona metadatos enriquecidos, incluidos texto, información de diseño y coordenadas para cada palabra, ideales para el análisis avanzado de documentos.

Aprenda a:Guardar resultados como hOCR en un archivo HTML
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as hOCR
ocrTesseract.Configuration.RenderHocr = true;

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
imageInput.Title = "Html Title";

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as HTML
ocrResult.SaveAsHocrFile("result.html");
C#
4

Resaltar textos como imágenes

Para la depuración y la verificación, genera una imagen del documento original con todo el texto reconocido resaltado. Esto proporciona una rápida comprobación visual de la precisión del motor de OCR y de la ubicación del texto.

Aprenda a:Resaltar textos en C# para depurar
using IronOcr;

IronTesseract ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_page_", ResultHighlightType.Paragraph);
C#
5

Valores de códigos de barras y códigos QR

Extraiga los valores de cadena descodificados de cualquier código de barras o código QR que se encuentre en el documento. La API proporciona estos datos junto con los resultados de texto para una solución completa de captura de datos.

Aprenda a:Extraer resultados de lectura en .NET C#
using IronOcr;
using IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = true;

// Load PDF file
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Output Barcode value
Console.WriteLine(ocrResult.Barcodes[0].Value);
C#
¿Listo para empezar?
Nuget Descargas 5,167,857 | Version: 2025.11 recién lanzado