Cómo extraer resultados de lectura

por Chaknith Bin

El resultado de la lectura o del reconocimiento óptico de caracteres abarca una gran cantidad de información relativa a los párrafos, líneas, palabras y caracteres individuales detectados. Para cada uno de estos elementos, el resultado ofrece un amplio conjunto de detalles.

Para cada elemento, proporciona el contenido del texto, las coordenadas X e Y precisas, las dimensiones (anchura y altura)dirección del texto (De izquierda a derecha o de arriba abajo)y ubicación en un CropRectangle objeto.


Biblioteca NuGet C# para OCR

Instalar con NuGet

Install-Package IronOcr
o
Java PDF JAR

Descargar DLL

Descargar DLL

Instalar manualmente en su proyecto

Datos en OcrResult

El valor resultante no sólo contiene el texto extraído, sino que también proporciona información sobre páginas, párrafos, líneas, palabras, caracteres y códigos de barras descubiertos en el documento PDF y de imagen por IronOcr. Puede acceder a esta información desde el objeto OcrResult devuelto utilizando el método Read.

:path=/static-assets/ocr/content-code-examples/how-to/read-results-output-information.cs
using IronOcr;
using System;
using static IronOcr.OcrResult;

//  Instanciar IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

//  Añadir imagen
using var imageInput = new OcrImageInput("sample.jpg");
//  Realizar OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

//  Recuperar la lista de párrafos detectados
Paragraph[] paragraphs = ocrResult.Paragraphs;

//  Información de salida a la consola
Console.WriteLine($"Text: {paragraphs[0].Text}");
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
Console.WriteLine($"Width: {paragraphs[0].Width}");
Console.WriteLine($"Height: {paragraphs[0].Height}");
Console.WriteLine($"Text direction: {paragraphs[0].TextDirection}");
Imports IronOcr
Imports System
Imports IronOcr.OcrResult

'  Instanciar IronTesseract
Private ocrTesseract As New IronTesseract()

'  Añadir imagen
Private imageInput = New OcrImageInput("sample.jpg")
'  Realizar OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

'  Recuperar la lista de párrafos detectados
Private paragraphs() As Paragraph = ocrResult.Paragraphs

'  Información de salida a la consola
Console.WriteLine($"Text: {paragraphs(0).Text}")
Console.WriteLine($"X: {paragraphs(0).X}")
Console.WriteLine($"Y: {paragraphs(0).Y}")
Console.WriteLine($"Width: {paragraphs(0).Width}")
Console.WriteLine($"Height: {paragraphs(0).Height}")
Console.WriteLine($"Text direction: {paragraphs(0).TextDirection}")
VB   C#
Datos en OcrResult

Para cada parte del texto, como párrafos, líneas, palabras y caracteres individuales, proporcionamos la siguiente información:

  • Texto: El texto real como cadena.
  • X: La posición desde el borde izquierdo de la página en píxeles.
  • Y: La posición desde el borde superior de la página en píxeles.
  • Anchura: La anchura en píxeles.
  • Altura: La altura en píxeles.
  • Dirección del texto: La dirección en la que se leyó el texto, como 'De izquierda a derecha' o 'De arriba abajo'.
  • Localización: Un rectángulo que muestra dónde se encuentra este texto en la página en píxeles.

Comparación de párrafos, líneas, palabras y caracteres

A continuación se comparan los párrafos, líneas, palabras y caracteres detectados.

Resaltar párrafo
Línea destacada
Resaltar palabra
Resaltar carácter

Chaknith Bin

Ingeniero de software

Chaknith es el Sherlock Holmes de los desarrolladores. La primera vez que se le ocurrió que podría tener futuro en la ingeniería de software fue cuando hacía retos de código por diversión. Su trabajo se centra en IronXL e IronBarcode, pero se enorgullece de ayudar a los clientes con todos los productos. Chaknith aprovecha sus conocimientos, adquiridos hablando directamente con los clientes, para ayudar a mejorar los propios productos. Sus comentarios anecdóticos van más allá de los tickets de Jira y apoyan el desarrollo de productos, la documentación y el marketing, para mejorar la experiencia general del cliente.Cuando no está en la oficina, se le puede encontrar aprendiendo sobre aprendizaje automático, codificación y senderismo.