Cómo usar valores de confianza de Tesseract OCR en C# | IronOCR

Cómo obtener confianza en la lectura de C# OCR con IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

La confianza en la lectura en OCR (Reconocimiento Óptico de Caracteres) se refiere al nivel de certeza o fiabilidad que el sistema OCR asigna a la precisión del texto que ha reconocido en una imagen o documento. Es una medida de cuán seguro está el sistema OCR de que el texto reconocido es correcto.

Una puntuación de alta confianza indica un alto grado de certeza de que el reconocimiento es preciso, mientras que una puntuación de baja confianza sugiere que el reconocimiento puede ser menos fiable.

Inicio Rápido: Obtener Confianza de Lectura en OCR en Una Línea

Use el método Read de IronTesseract con una ruta de archivo de imagen, luego acceda a la propiedad Confidence en el OcrResult devuelto para ver cuán seguro está IronOCR sobre su reconocimiento de texto. Es una manera simple y confiable de comenzar a evaluar la precisión del resultado OCR.

Nuget IconEmpieza a crear PDF con NuGet ahora:

  1. Instalar IronOCR con el gestor de paquetes NuGet

    PM > Install-Package IronOcr

  2. Copie y ejecute este fragmento de código.

    double confidence = new IronOcr.IronTesseract().Read("input.png").Confidence;
  3. Despliegue para probar en su entorno real

    Empieza a utilizar IronOCR en tu proyecto hoy mismo con una prueba gratuita
    arrow pointer


Obtenga un ejemplo de confianza en la lectura

Después de realizar OCR en la imagen de entrada, el nivel de confianza del texto se almacena en la propiedad Confidence. Utilice la instrucción 'using' para liberar automáticamente los objetos después de su uso. Agregue documentos como imágenes y PDFs con las clases OcrImageInput y OcrPdfInput, respectivamente. El método Read devolverá un objeto OcrResult que permite el acceso a la propiedad Confidence.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-confidence.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get confidence level
double confidence = ocrResult.Confidence;
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get confidence level
Private confidence As Double = ocrResult.Confidence
$vbLabelText   $csharpLabel

Obtenga confianzas de lectura en diferentes niveles

No solo puede recuperar el nivel de confianza de todo el documento, sino también acceder a los niveles de confianza de cada página, párrafo, línea, palabra y carácter. Además, puede obtener la confianza de un bloque, que representa una colección de uno o más párrafos ubicados de cerca.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-confidence-level.cs
// Get page confidence level
double pageConfidence = ocrResult.Pages[0].Confidence;

// Get paragraph confidence level
double paragraphConfidence = ocrResult.Paragraphs[0].Confidence;

// Get line confidence level
double lineConfidence = ocrResult.Lines[0].Confidence;

// Get word confidence level
double wordConfidence = ocrResult.Words[0].Confidence;

// Get character confidence level
double characterConfidence = ocrResult.Characters[0].Confidence;

// Get block confidence level
double blockConfidence = ocrResult.Blocks[0].Confidence;
' Get page confidence level
Dim pageConfidence As Double = ocrResult.Pages(0).Confidence

' Get paragraph confidence level
Dim paragraphConfidence As Double = ocrResult.Paragraphs(0).Confidence

' Get line confidence level
Dim lineConfidence As Double = ocrResult.Lines(0).Confidence

' Get word confidence level
Dim wordConfidence As Double = ocrResult.Words(0).Confidence

' Get character confidence level
Dim characterConfidence As Double = ocrResult.Characters(0).Confidence

' Get block confidence level
Dim blockConfidence As Double = ocrResult.Blocks(0).Confidence
$vbLabelText   $csharpLabel

Obtener opciones de personajes

Además del nivel de confianza, hay otra propiedad interesante llamada Opciones. Opciones contiene una lista de opciones alternativas de palabras y su relevancia estadística. Esta información permite al usuario acceder a otros caracteres posibles.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-choices.cs
using IronOcr;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get choices
Choice[] choices = ocrResult.Characters[0].Choices;
Imports IronOcr
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get choices
Private choices() As Choice = ocrResult.Characters(0).Choices
$vbLabelText   $csharpLabel

Información recuperada

Opciones

Preguntas Frecuentes

¿Qué significa la confianza de lectura en OCR?

La confianza de lectura en OCR se refiere al nivel de certeza o fiabilidad asignado por el sistema OCR respecto a la precisión del texto que ha reconocido. Una puntuación alta indica un reconocimiento de texto confiable, mientras que una puntuación baja sugiere posibles imprecisiones.

¿Cómo puedo empezar a usar una biblioteca de C# para obtener la confianza de lectura de OCR?

Comience descargando la biblioteca IronOCR desde NuGet. Prepare sus imágenes o documentos PDF para el procesamiento y utilice el método Read para acceder a la propiedad Confidence del objeto OcrResult.

¿Cómo recupero el nivel de confianza del texto reconocido en C#?

Para recuperar el nivel de confianza del texto reconocido, use el método Read de IronOCR, que devuelve un objeto OcrResult. Este objeto incluye una propiedad Confidence que indica el nivel de precisión del texto.

¿Puedo verificar los niveles de confianza para diferentes partes de un documento?

Sí, IronOCR te permite verificar niveles de confianza para varias partes de un documento, incluidas páginas, párrafos, líneas, palabras y caracteres. Esto proporciona una evaluación detallada de la precisión del proceso de OCR.

¿Qué son las opciones de caracteres en OCR?

Las opciones de caracteres en OCR proporcionan una lista de alternativas de palabras y su relevancia estadística. Esta función ayuda a los usuarios a acceder a otros posibles caracteres reconocidos por el sistema OCR, ofreciendo conocimientos adicionales sobre el proceso de reconocimiento.

¿Cómo se usa la propiedad de confianza en una biblioteca de OCR de C#?

La propiedad Confidence en una biblioteca de OCR de C# indica el nivel de precisión del texto reconocido. Proporciona una puntuación numérica que representa la certeza del sistema OCR sobre la precisión del reconocimiento.

¿Es posible acceder a la confianza a nivel de bloque en una biblioteca de OCR de C#?

Sí, puedes acceder a la confianza a nivel de bloque usando IronOCR. Un bloque representa una colección de párrafos cercanos, y se puede verificar su nivel de confianza para evaluar la precisión del reconocimiento de texto a este nivel.

¿Cuál es el propósito de la propiedad Choices en OCR?

La propiedad Choices ofrece alternativas de palabras y sus puntuaciones de confianza. Esto ayuda a los usuarios a comprender otras posibles interpretaciones del texto proporcionadas por el sistema OCR, mejorando la evaluación del texto reconocido.

¿Cómo implemento OCR con niveles de confianza en C#?

Implemente OCR con niveles de confianza en C# usando la biblioteca IronOCR. Configure su entorno, prepare sus documentos de entrada y utilice el método Read para obtener un objeto OcrResult, desde el cual puede acceder a la propiedad Confidence.

¿Qué pasos debo seguir para evaluar la confianza de lectura usando una biblioteca de OCR de C#?

Para evaluar la confianza de lectura, descargue la biblioteca IronOCR, prepare los documentos para el procesamiento OCR, use el método Read para obtener un OcrResult y acceda a la propiedad Confidence para evaluar la precisión del texto reconocido.

Curtis Chau
Escritor Técnico

Curtis Chau tiene una licenciatura en Ciencias de la Computación (Carleton University) y se especializa en el desarrollo front-end con experiencia en Node.js, TypeScript, JavaScript y React. Apasionado por crear interfaces de usuario intuitivas y estéticamente agradables, disfruta trabajando con frameworks modernos y creando manuales bien ...

Leer más
Revisado por
Jeff Fritz
Jeffrey T. Fritz
Gerente Principal de Programas - Equipo de la Comunidad .NET
Jeff también es Gerente Principal de Programas para los equipos de .NET y Visual Studio. Es el productor ejecutivo de la serie de conferencias virtuales .NET Conf y anfitrión de 'Fritz and Friends', una transmisión en vivo para desarrolladores que se emite dos veces a la semana donde habla sobre tecnología y escribe código junto con la audiencia. Jeff escribe talleres, presentaciones, y planifica contenido para los eventos de desarrolladores más importantes de Microsoft, incluyendo Microsoft Build, Microsoft Ignite, .NET Conf y la Cumbre de Microsoft MVP.
¿Listo para empezar?
Nuget Descargas 5,167,857 | Version: 2025.11 recién lanzado