Comment obtenir la confiance en lecture

This article was translated from English: Does it need improvement?
Translated
View the article in English

par Chaknith Bin

Lire la confiance dans l'OCR(Reconnaissance optique de caractères) désigne le niveau de certitude ou de fiabilité que le système OCR attribue à l'exactitude du texte qu'il a reconnu dans une image ou un document. Il s'agit d'une mesure du degré de confiance du système d'OCR dans l'exactitude du texte reconnu.

Une note de confiance élevée indique un degré élevé de certitude que la reconnaissance est exacte, tandis qu'une note de confiance faible suggère que la reconnaissance peut être moins fiable.

Commencez avec IronOCR

Commencez à utiliser IronOCR dans votre projet dès aujourd'hui avec un essai gratuit.

Première étape :
green arrow pointer



Exemple de confiance en lecture

Après avoir effectué l'OCR sur l'image d'entrée, le niveau de confiance du texte est stocké dans la propriété Confidence. Utilisez l'instruction "using" pour éliminer automatiquement les objets. Ajoutez des documents tels que des images et des PDF avec les classes OcrImageInput et OcrPdfInput, respectivement. La méthode Read renvoie un objet 'OcrResult' qui permet d'accéder à la propriété Confidence

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-confidence.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get confidence level
double confidence = ocrResult.Confidence;
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get confidence level
Private confidence As Double = ocrResult.Confidence
VB   C#

Obtenir des confidences de lecture à différents niveaux

Vous pouvez non seulement récupérer le niveau de confiance de l'ensemble du document, mais aussi accéder aux niveaux de confiance de chaque page, paragraphe, ligne, mot et caractère. En outre, vous pouvez obtenir la confiance d'un bloc, qui représente un ensemble d'un ou plusieurs paragraphes situés à proximité les uns des autres.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-confidence-level.cs
// Get page confidence level
double pageConfidence = ocrResult.Pages[0].Confidence;

// Get paragraph confidence level
double paragraphConfidence = ocrResult.Paragraphs[0].Confidence;

// Get line confidence level
double lineConfidence = ocrResult.Lines[0].Confidence;

// Get word confidence level
double wordConfidence = ocrResult.Words[0].Confidence;

// Get character confidence level
double characterConfidence = ocrResult.Characters[0].Confidence;

// Get block confidence level
double blockConfidence = ocrResult.Blocks[0].Confidence;
' Get page confidence level
Dim pageConfidence As Double = ocrResult.Pages(0).Confidence

' Get paragraph confidence level
Dim paragraphConfidence As Double = ocrResult.Paragraphs(0).Confidence

' Get line confidence level
Dim lineConfidence As Double = ocrResult.Lines(0).Confidence

' Get word confidence level
Dim wordConfidence As Double = ocrResult.Words(0).Confidence

' Get character confidence level
Dim characterConfidence As Double = ocrResult.Characters(0).Confidence

' Get block confidence level
Dim blockConfidence As Double = ocrResult.Blocks(0).Confidence
VB   C#

Obtenir des choix de personnages

Outre le niveau de confiance, il existe une autre propriété intéressante appelée Choices. Les choix contiennent une liste de choix de mots alternatifs et leur pertinence statistique. Cette information permet à l'utilisateur d'accéder à d'autres caractères possibles.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-choices.cs
using IronOcr;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get choices
Choice[] choices = ocrResult.Characters[0].Choices;
Imports IronOcr
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get choices
Private choices() As Choice = ocrResult.Characters(0).Choices
VB   C#

Informations extraites

Choix
Chaknith related to Informations extraites

Chaknith Bin

Ingénieur logiciel

Chaknith est le Sherlock Holmes des développeurs. C'est en s'amusant à relever des défis de code qu'il s'est rendu compte pour la première fois qu'il pourrait avoir un avenir dans le domaine de l'ingénierie logicielle. Il se concentre sur IronXL et IronBarcode, mais il est fier d'aider les clients avec chaque produit. Chaknith tire parti des connaissances qu'il a acquises en discutant directement avec les clients pour améliorer les produits eux-mêmes. Ses commentaires anecdotiques vont au-delà des tickets Jira et soutiennent le développement de produits, la documentation et le marketing, afin d'améliorer l'expérience globale des clients.Quand il n'est pas au bureau, on peut le trouver en train d'apprendre sur l'apprentissage automatique, le codage et la randonnée.