Comment obtenir la confiance en lecture

This article was translated from English: Does it need improvement?
Translated
View the article in English

par Chaknith Bin

Lire la confiance dans l'OCR (Reconnaissance optique de caractères) désigne le niveau de certitude ou de fiabilité que le système OCR attribue à l'exactitude du texte qu'il a reconnu dans une image ou un document. Il s'agit d'une mesure du degré de confiance du système d'OCR dans l'exactitude du texte reconnu.

Une note de confiance élevée indique un degré élevé de certitude que la reconnaissance est exacte, tandis qu'une note de confiance faible suggère que la reconnaissance peut être moins fiable.


Bibliothèque NuGet C# pour OCR

Installer avec NuGet

Install-Package IronOcr
ou
Java PDF JAR

Télécharger DLL

Télécharger la DLL

Installation manuelle dans votre projet

Bibliothèque NuGet C# pour OCR

Installer avec NuGet

Install-Package IronOcr
ou
Java PDF JAR

Télécharger DLL

Télécharger la DLL

Installation manuelle dans votre projet

Commencez à utiliser IronPDF dans votre projet dès aujourd'hui avec un essai gratuit.

Première étape :
green arrow pointer

Découvrez IronOCR sur NuGet pour une installation rapide et un déploiement facile. Avec plus de 8 millions de téléchargements, il transforme OCR avec C#.

Bibliothèque NuGet C# pour OCR nuget.org/packages/IronOcr/
Install-Package IronOcr

Envisagez d'installer le IronOCR DLL directement. Téléchargez et installez-le manuellement pour votre projet ou sous forme de GAC : {{lienDllAfficher}}

Installation manuelle dans votre projet

Télécharger la DLL

Exemple de confiance en lecture

Après avoir effectué l'OCR sur l'image d'entrée, le niveau de confiance du texte est stocké dans la propriété Confidence. Utilisez l'instruction "using" pour éliminer automatiquement les objets. Ajoutez des documents tels que des images et des PDF avec les classes OcrImageInput et OcrPdfInput, respectivement. La méthode Read renvoie un objet 'OcrResult' qui permet d'accéder à la propriété Confidence

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-confidence.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get confidence level
double confidence = ocrResult.Confidence;
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get confidence level
Private confidence As Double = ocrResult.Confidence
VB   C#

Obtenir des confidences de lecture à différents niveaux

Vous pouvez non seulement récupérer le niveau de confiance de l'ensemble du document, mais aussi accéder aux niveaux de confiance de chaque page, paragraphe, ligne, mot et caractère. En outre, vous pouvez obtenir la confiance d'un bloc, qui représente un ensemble d'un ou plusieurs paragraphes situés à proximité les uns des autres.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-confidence-level.cs
// Get page confidence level
double pageConfidence = ocrResult.Pages[0].Confidence;

// Get paragraph confidence level
double paragraphConfidence = ocrResult.Paragraphs[0].Confidence;

// Get line confidence level
double lineConfidence = ocrResult.Lines[0].Confidence;

// Get word confidence level
double wordConfidence = ocrResult.Words[0].Confidence;

// Get character confidence level
double characterConfidence = ocrResult.Characters[0].Confidence;

// Get block confidence level
double blockConfidence = ocrResult.Blocks[0].Confidence;
' Get page confidence level
Dim pageConfidence As Double = ocrResult.Pages(0).Confidence

' Get paragraph confidence level
Dim paragraphConfidence As Double = ocrResult.Paragraphs(0).Confidence

' Get line confidence level
Dim lineConfidence As Double = ocrResult.Lines(0).Confidence

' Get word confidence level
Dim wordConfidence As Double = ocrResult.Words(0).Confidence

' Get character confidence level
Dim characterConfidence As Double = ocrResult.Characters(0).Confidence

' Get block confidence level
Dim blockConfidence As Double = ocrResult.Blocks(0).Confidence
VB   C#

Obtenir des choix de personnages

Outre le niveau de confiance, il existe une autre propriété intéressante appelée Choices. Les choix contiennent une liste de choix de mots alternatifs et leur pertinence statistique. Cette information permet à l'utilisateur d'accéder à d'autres caractères possibles.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-choices.cs
using IronOcr;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get choices
Choice[] choices = ocrResult.Characters[0].Choices;
Imports IronOcr
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get choices
Private choices() As Choice = ocrResult.Characters(0).Choices
VB   C#

Informations extraites

Choix

Chaknith Bin

Ingénieur logiciel

Chaknith est le Sherlock Holmes des développeurs. C'est en s'amusant à relever des défis de code qu'il s'est rendu compte pour la première fois qu'il pourrait avoir un avenir dans le domaine de l'ingénierie logicielle. Il se concentre sur IronXL et IronBarcode, mais il est fier d'aider les clients avec chaque produit. Chaknith tire parti des connaissances qu'il a acquises en discutant directement avec les clients pour améliorer les produits eux-mêmes. Ses commentaires anecdotiques vont au-delà des tickets Jira et soutiennent le développement de produits, la documentation et le marketing, afin d'améliorer l'expérience globale des clients.Quand il n'est pas au bureau, on peut le trouver en train d'apprendre sur l'apprentissage automatique, le codage et la randonnée.