Cómo usar valores de confianza de Tesseract OCR en C# | IronOCR

How to Get Read Confidence

This article was translated from English: Does it need improvement?
Translated
View the article in English

Read confidence in OCR (Optical Character Recognition) refers to the level of certainty or reliability that the OCR system assigns to the accuracy of the text it has recognized in an image or document. It is a measure of how confident the OCR system is that the recognized text is correct.

A high confidence score indicates a high degree of certainty that the recognition is accurate, while a low confidence score suggests that the recognition may be less reliable.

Quickstart: Get OCR Read Confidence in One Line

Use IronTesseract’s Read method with an image file path, then access the Confidence property on the returned OcrResult to see how certain IronOCR is about its text recognition. It’s a simple, reliable way to start evaluating OCR output accuracy.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    double confidence = new IronOcr.IronTesseract().Read("input.png").Confidence;
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer


Get Read Confidence Example

After performing OCR on the input image, the confidence level of the text is stored in the Confidence property. Utilize the 'using' statement to automatically dispose of objects after use. Add documents such as images and PDFs with the OcrImageInput and OcrPdfInput classes, respectively. The Read method will return an OcrResult object that allows access to the Confidence property.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-confidence.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get confidence level
double confidence = ocrResult.Confidence;
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get confidence level
Private confidence As Double = ocrResult.Confidence
$vbLabelText   $csharpLabel

Get Read Confidences at Different Levels

Not only can you retrieve the confidence level of the entire document, but you can also access the confidence levels of each page, paragraph, line, word, and character. Furthermore, you can obtain the confidence of a block, which represents a collection of one or more paragraphs located closely together.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-confidence-level.cs
// Get page confidence level
double pageConfidence = ocrResult.Pages[0].Confidence;

// Get paragraph confidence level
double paragraphConfidence = ocrResult.Paragraphs[0].Confidence;

// Get line confidence level
double lineConfidence = ocrResult.Lines[0].Confidence;

// Get word confidence level
double wordConfidence = ocrResult.Words[0].Confidence;

// Get character confidence level
double characterConfidence = ocrResult.Characters[0].Confidence;

// Get block confidence level
double blockConfidence = ocrResult.Blocks[0].Confidence;
' Get page confidence level
Dim pageConfidence As Double = ocrResult.Pages(0).Confidence

' Get paragraph confidence level
Dim paragraphConfidence As Double = ocrResult.Paragraphs(0).Confidence

' Get line confidence level
Dim lineConfidence As Double = ocrResult.Lines(0).Confidence

' Get word confidence level
Dim wordConfidence As Double = ocrResult.Words(0).Confidence

' Get character confidence level
Dim characterConfidence As Double = ocrResult.Characters(0).Confidence

' Get block confidence level
Dim blockConfidence As Double = ocrResult.Blocks(0).Confidence
$vbLabelText   $csharpLabel

Get Character Choices

Apart from the confidence level, there is another interesting property called Choices. Choices contain a list of alternative word choices and their statistical relevance. This information allows the user to access other possible characters.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-choices.cs
using IronOcr;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get choices
Choice[] choices = ocrResult.Characters[0].Choices;
Imports IronOcr
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get choices
Private choices() As Choice = ocrResult.Characters(0).Choices
$vbLabelText   $csharpLabel

Retrieved Information

Choices

Preguntas Frecuentes

¿Qué significa la confianza de lectura en OCR?

La confianza de lectura en OCR se refiere al nivel de certeza o fiabilidad asignado por el sistema OCR respecto a la precisión del texto que ha reconocido. Una puntuación alta indica un reconocimiento de texto confiable, mientras que una puntuación baja sugiere posibles imprecisiones.

¿Cómo puedo empezar a usar una biblioteca de C# para obtener la confianza de lectura de OCR?

Comience descargando la biblioteca IronOCR desde NuGet. Prepare sus imágenes o documentos PDF para el procesamiento y utilice el método Read para acceder a la propiedad Confidence del objeto OcrResult.

¿Cómo recupero el nivel de confianza del texto reconocido en C#?

Para recuperar el nivel de confianza del texto reconocido, use el método Read de IronOCR, que devuelve un objeto OcrResult. Este objeto incluye una propiedad Confidence que indica el nivel de precisión del texto.

¿Puedo verificar los niveles de confianza para diferentes partes de un documento?

Sí, IronOCR te permite verificar niveles de confianza para varias partes de un documento, incluidas páginas, párrafos, líneas, palabras y caracteres. Esto proporciona una evaluación detallada de la precisión del proceso de OCR.

¿Qué son las opciones de caracteres en OCR?

Las opciones de caracteres en OCR proporcionan una lista de alternativas de palabras y su relevancia estadística. Esta función ayuda a los usuarios a acceder a otros posibles caracteres reconocidos por el sistema OCR, ofreciendo conocimientos adicionales sobre el proceso de reconocimiento.

¿Cómo se usa la propiedad de confianza en una biblioteca de OCR de C#?

La propiedad Confidence en una biblioteca de OCR de C# indica el nivel de precisión del texto reconocido. Proporciona una puntuación numérica que representa la certeza del sistema OCR sobre la precisión del reconocimiento.

¿Es posible acceder a la confianza a nivel de bloque en una biblioteca de OCR de C#?

Sí, puedes acceder a la confianza a nivel de bloque usando IronOCR. Un bloque representa una colección de párrafos cercanos, y se puede verificar su nivel de confianza para evaluar la precisión del reconocimiento de texto a este nivel.

¿Cuál es el propósito de la propiedad Choices en OCR?

La propiedad Choices ofrece alternativas de palabras y sus puntuaciones de confianza. Esto ayuda a los usuarios a comprender otras posibles interpretaciones del texto proporcionadas por el sistema OCR, mejorando la evaluación del texto reconocido.

¿Cómo implemento OCR con niveles de confianza en C#?

Implemente OCR con niveles de confianza en C# usando la biblioteca IronOCR. Configure su entorno, prepare sus documentos de entrada y utilice el método Read para obtener un objeto OcrResult, desde el cual puede acceder a la propiedad Confidence.

¿Qué pasos debo seguir para evaluar la confianza de lectura usando una biblioteca de OCR de C#?

Para evaluar la confianza de lectura, descargue la biblioteca IronOCR, prepare los documentos para el procesamiento OCR, use el método Read para obtener un OcrResult y acceda a la propiedad Confidence para evaluar la precisión del texto reconocido.

Curtis Chau
Escritor Técnico

Curtis Chau tiene una licenciatura en Ciencias de la Computación (Carleton University) y se especializa en el desarrollo front-end con experiencia en Node.js, TypeScript, JavaScript y React. Apasionado por crear interfaces de usuario intuitivas y estéticamente agradables, disfruta trabajando con frameworks modernos y creando manuales bien ...

Leer más
Revisado por
Jeff Fritz
Jeffrey T. Fritz
Gerente Principal de Programas - Equipo de la Comunidad .NET
Jeff también es Gerente Principal de Programas para los equipos de .NET y Visual Studio. Es el productor ejecutivo de la serie de conferencias virtuales .NET Conf y anfitrión de 'Fritz and Friends', una transmisión en vivo para desarrolladores que se emite dos veces a la semana donde habla sobre tecnología y escribe código junto con la audiencia. Jeff escribe talleres, presentaciones, y planifica contenido para los eventos de desarrolladores más importantes de Microsoft, incluyendo Microsoft Build, Microsoft Ignite, .NET Conf y la Cumbre de Microsoft MVP.
¿Listo para empezar?
Nuget Descargas 5,044,537 | Versión: 2025.11 recién lanzado