Comment utiliser les valeurs de confiance Tesseract OCR en C# | IronOCR

Comment obtenir une lecture OCR fiable en C# avec IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

La confiance en lecture dans la ROC (reconnaissance optique de caractères) fait référence au niveau de certitude ou de fiabilité que le système ROC attribue à l'exactitude du texte qu'il a reconnu dans une image ou un document. Il s'agit d'une mesure du degré de confiance du système OCR quant à l'exactitude du texte reconnu.

Un score de confiance élevé indique un haut degré de certitude que la reconnaissance est précise, tandis qu'un faible score de confiance suggère que la reconnaissance peut être moins fiable.

Démarrage rapide : Obtenez une confiance en lecture OCR en une seule ligne

Utilisez la méthode Read d'IronTesseract avec un chemin d'accès à un fichier image, puis accédez à la propriété Confidence de l' OcrResult renvoyé pour voir à quel point IronOCR est sûr de sa reconnaissance de texte. C'est une méthode simple et fiable pour commencer à évaluer la précision des résultats de la reconnaissance optique de caractères (OCR).

Nuget IconCommencez dès maintenant à créer des PDF avec NuGet :

  1. Installez IronOCR avec le gestionnaire de packages NuGet

    PM > Install-Package IronOcr

  2. Copiez et exécutez cet extrait de code.

    double confidence = new IronOcr.IronTesseract().Read("input.png").Confidence;
  3. Déployez pour tester sur votre environnement de production.

    Commencez à utiliser IronOCR dans votre projet dès aujourd'hui grâce à un essai gratuit.
    arrow pointer


Obtenez un exemple de confiance en lecture

Après avoir effectué la reconnaissance optique de caractères (OCR) sur l'image d'entrée, le niveau de confiance du texte est stocké dans la propriété Confiance . Utilisez l'instruction " using " pour libérer automatiquement les objets après utilisation. Ajoutez des documents tels que des images et des PDF avec les classes OcrImageInput et OcrPdfInput , respectivement. La méthode Read renverra un objet OcrResult qui permettra d'accéder à la propriété Confidence .

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-confidence.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get confidence level
double confidence = ocrResult.Confidence;
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get confidence level
Private confidence As Double = ocrResult.Confidence
$vbLabelText   $csharpLabel

Obtenez des niveaux de confiance en lecture à différents niveaux

Vous pouvez non seulement récupérer le niveau de confiance de l'ensemble du document, mais aussi accéder aux niveaux de confiance de chaque page, paragraphe, ligne, mot et caractère. De plus, vous pouvez obtenir la confiance d'un bloc, qui représente un ensemble d'un ou plusieurs paragraphes étroitement liés.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-confidence-level.cs
// Get page confidence level
double pageConfidence = ocrResult.Pages[0].Confidence;

// Get paragraph confidence level
double paragraphConfidence = ocrResult.Paragraphs[0].Confidence;

// Get line confidence level
double lineConfidence = ocrResult.Lines[0].Confidence;

// Get word confidence level
double wordConfidence = ocrResult.Words[0].Confidence;

// Get character confidence level
double characterConfidence = ocrResult.Characters[0].Confidence;

// Get block confidence level
double blockConfidence = ocrResult.Blocks[0].Confidence;
' Get page confidence level
Dim pageConfidence As Double = ocrResult.Pages(0).Confidence

' Get paragraph confidence level
Dim paragraphConfidence As Double = ocrResult.Paragraphs(0).Confidence

' Get line confidence level
Dim lineConfidence As Double = ocrResult.Lines(0).Confidence

' Get word confidence level
Dim wordConfidence As Double = ocrResult.Words(0).Confidence

' Get character confidence level
Dim characterConfidence As Double = ocrResult.Characters(0).Confidence

' Get block confidence level
Dim blockConfidence As Double = ocrResult.Blocks(0).Confidence
$vbLabelText   $csharpLabel

Obtenez des choix de personnages

Outre le niveau de confiance, il existe une autre propriété intéressante appelée Choix . Les choix contiennent une liste d'alternatives de choix de mots et leur pertinence statistique. Ces informations permettent à l'utilisateur d'accéder à d'autres personnages possibles.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-choices.cs
using IronOcr;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get choices
Choice[] choices = ocrResult.Characters[0].Choices;
Imports IronOcr
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get choices
Private choices() As Choice = ocrResult.Characters(0).Choices
$vbLabelText   $csharpLabel

Informations récupérées

Choix

Questions Fréquemment Posées

Que signifie la confiance de lecture en OCR ?

La confiance de lecture en OCR fait référence au niveau de certitude ou de fiabilité assigné par le système OCR concernant la précision du texte qu'il a reconnu. Un score élevé indique une reconnaissance fiable du texte, tandis qu'un score faible suggère des inexactitudes possibles.

Comment puis-je commencer à utiliser une bibliothèque C# pour obtenir la confiance de lecture OCR ?

Commencez par télécharger la bibliothèque IronOCR depuis NuGet. Préparez vos images ou documents PDF pour le traitement, et utilisez la méthode Read pour accéder à la propriété Confidence de l'objet OcrResult.

Comment puis-je récupérer le niveau de confiance du texte reconnu en C# ?

Pour récupérer le niveau de confiance du texte reconnu, utilisez la méthode Read d'IronOCR, qui renvoie un objet OcrResult. Cet objet inclut une propriété Confidence qui indique le niveau de précision du texte.

Puis-je vérifier les niveaux de confiance pour différentes parties d'un document ?

Oui, IronOCR vous permet de vérifier les niveaux de confiance pour différentes parties d'un document, y compris les pages, les paragraphes, les lignes, les mots et les caractères. Cela offre une évaluation détaillée de la précision du processus OCR.

Quels sont les choix de caractères en OCR ?

Les choix de caractères en OCR fournissent une liste de choix de mots alternatifs et leur pertinence statistique. Cette fonctionnalité aide les utilisateurs à accéder à d'autres caractères possibles reconnus par le système OCR, offrant des informations supplémentaires sur le processus de reconnaissance.

Comment la propriété de confiance est-elle utilisée dans une bibliothèque OCR C# ?

La propriété Confidence dans une bibliothèque OCR C# indique le niveau de précision du texte reconnu. Elle fournit un score numérique qui représente la certitude du système OCR concernant la précision de la reconnaissance.

Est-il possible d'accéder à la confiance au niveau des blocs dans une bibliothèque OCR C# ?

Oui, vous pouvez accéder à la confiance au niveau des blocs en utilisant IronOCR. Un bloc représente un ensemble de paragraphes étroitement localisés, et son niveau de confiance peut être vérifié pour évaluer la précision de la reconnaissance de texte à ce niveau.

Quel est le but de la propriété Choices en OCR ?

La propriété Choices offre des choix de mots alternatifs et leurs scores de confiance. Cela aide les utilisateurs à comprendre d'autres interprétations textuelles potentielles fournies par le système OCR, améliorant ainsi l'évaluation du texte reconnu.

Comment puis-je implémenter l'OCR avec des niveaux de confiance en C# ?

Implémentez l'OCR avec des niveaux de confiance en C# en utilisant la bibliothèque IronOCR. Configurez votre environnement, préparez vos documents d'entrée et utilisez la méthode Read pour obtenir un objet OcrResult, à partir duquel vous pouvez accéder à la propriété Confidence.

Quelles étapes dois-je suivre pour évaluer la confiance de lecture en utilisant une bibliothèque OCR C# ?

Pour évaluer la confiance de lecture, téléchargez la bibliothèque IronOCR, préparez les documents pour le traitement OCR, utilisez la méthode Read pour obtenir un OcrResult, et accédez à la propriété Confidence pour évaluer la précision du texte reconnu.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Revu par
Jeff Fritz
Jeffrey T. Fritz
Responsable principal du programme - Équipe de la communauté .NET
Jeff est également responsable principal du programme pour les équipes .NET et Visual Studio. Il est le producteur exécutif de la série de conférences virtuelles .NET Conf et anime 'Fritz and Friends', une diffusion en direct pour développeurs qui est diffusée deux fois par semaine où il parle de technologie et écrit du code avec les téléspectateurs. Jeff écrit des ateliers, des présentations et prévoit du contenu pour les plus grands événements de développement Microsoft, y compris Microsoft Build, Microsoft Ignite, .NET Conf et le sommet Microsoft MVP
Prêt à commencer?
Nuget Téléchargements 5,167,857 | Version: 2025.11 vient de sortir