Cómo extraer resultados de lectura
El resultado de la lectura o del reconocimiento óptico de caracteres abarca una gran cantidad de información relativa a los párrafos, líneas, palabras y caracteres individuales detectados. Para cada uno de estos elementos, el resultado ofrece un amplio conjunto de detalles.
Para cada elemento, proporciona el contenido del texto, las coordenadas X e Y precisas, las dimensiones (anchura y altura)dirección del texto (De izquierda a derecha o de arriba abajo)y ubicación en un CropRectangle objeto.
Cómo extraer resultados de lectura
- Descargar una biblioteca C# para acceder a los resultados de lectura
- Preparar la imagen de destino y el documento PDF
- Utiliza el
Leer
para realizar el reconocimiento óptico de caracteres en el documento importado - Accede a la dirección X, Y, anchura, altura y texto del resultado
- Compruebe los párrafos, líneas, palabras y comparaciones de caracteres detectados
Instalar con NuGet
Install-Package IronOcr
Datos en OcrResult
El valor resultante no sólo contiene el texto extraído, sino que también proporciona información sobre páginas, párrafos, líneas, palabras, caracteres y códigos de barras descubiertos en el documento PDF y de imagen por IronOcr. Puede acceder a esta información desde el objeto OcrResult devuelto utilizando el método Read
.
:path=/static-assets/ocr/content-code-examples/how-to/read-results-output-information.cs
using IronOcr;
using System;
using static IronOcr.OcrResult;
// Instanciar IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Añadir imagen
using var imageInput = new OcrImageInput("sample.jpg");
// Realizar OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Recuperar la lista de párrafos detectados
Paragraph[] paragraphs = ocrResult.Paragraphs;
// Información de salida a la consola
Console.WriteLine($"Text: {paragraphs[0].Text}");
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
Console.WriteLine($"Width: {paragraphs[0].Width}");
Console.WriteLine($"Height: {paragraphs[0].Height}");
Console.WriteLine($"Text direction: {paragraphs[0].TextDirection}");
Imports IronOcr
Imports System
Imports IronOcr.OcrResult
' Instanciar IronTesseract
Private ocrTesseract As New IronTesseract()
' Añadir imagen
Private imageInput = New OcrImageInput("sample.jpg")
' Realizar OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Recuperar la lista de párrafos detectados
Private paragraphs() As Paragraph = ocrResult.Paragraphs
' Información de salida a la consola
Console.WriteLine($"Text: {paragraphs(0).Text}")
Console.WriteLine($"X: {paragraphs(0).X}")
Console.WriteLine($"Y: {paragraphs(0).Y}")
Console.WriteLine($"Width: {paragraphs(0).Width}")
Console.WriteLine($"Height: {paragraphs(0).Height}")
Console.WriteLine($"Text direction: {paragraphs(0).TextDirection}")
![Datos en OcrResult](/static-assets/ocr/how-to/read-results/result.webp)
Para cada parte del texto, como párrafos, líneas, palabras y caracteres individuales, proporcionamos la siguiente información:
- Texto: El texto real como cadena.
- X: La posición desde el borde izquierdo de la página en píxeles.
- Y: La posición desde el borde superior de la página en píxeles.
- Anchura: La anchura en píxeles.
- Altura: La altura en píxeles.
- Dirección del texto: La dirección en la que se leyó el texto, como 'De izquierda a derecha' o 'De arriba abajo'.
- Localización: Un rectángulo que muestra dónde se encuentra este texto en la página en píxeles.
Comparación de párrafos, líneas, palabras y caracteres
A continuación se comparan los párrafos, líneas, palabras y caracteres detectados.
![]() Párrafo | ![]() Línea |
![]() Palabra | ![]() Carácter |