Comment obtenir la confiance en lecture
La confiance de lecture dans la ROC (Reconnaissance Optique de Caractères) désigne le niveau de certitude ou de fiabilité que le système ROC attribue à la précision du texte qu'il a reconnu dans une image ou un document. Il s'agit d'une mesure du degré de confiance du système d'OCR dans l'exactitude du texte reconnu.
Une note de confiance élevée indique un degré élevé de certitude que la reconnaissance est exacte, tandis qu'une note de confiance faible suggère que la reconnaissance peut être moins fiable.
Commencez avec IronOCR
Commencez à utiliser IronOCR dans votre projet dès aujourd'hui avec un essai gratuit.
Comment obtenir la confiance en lecture
Exemple de confiance en lecture
Après avoir effectué la reconnaissance optique de caractères sur l'image d'entrée, le niveau de confiance du texte est stocké dans la propriété Confidence. Utilisez l'instruction "using" pour éliminer automatiquement les objets. Ajoutez des documents tels que des images et des PDF avec respectivement la classe OcrImageInput
et OcrPdfInput
. La méthode Read
retournera un objet 'OcrResult' qui permet d'accéder à la propriété Confidence
:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-confidence.cs
using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Get confidence level
double confidence = ocrResult.Confidence;
Imports IronOcr
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("sample.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Get confidence level
Private confidence As Double = ocrResult.Confidence
Obtenir des confidences de lecture à différents niveaux
Vous pouvez non seulement récupérer le niveau de confiance de l'ensemble du document, mais aussi accéder aux niveaux de confiance de chaque page, paragraphe, ligne, mot et caractère. En outre, vous pouvez obtenir la confiance d'un bloc, qui représente un ensemble d'un ou plusieurs paragraphes situés à proximité les uns des autres.
:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-confidence-level.cs
// Get page confidence level
double pageConfidence = ocrResult.Pages[0].Confidence;
// Get paragraph confidence level
double paragraphConfidence = ocrResult.Paragraphs[0].Confidence;
// Get line confidence level
double lineConfidence = ocrResult.Lines[0].Confidence;
// Get word confidence level
double wordConfidence = ocrResult.Words[0].Confidence;
// Get character confidence level
double characterConfidence = ocrResult.Characters[0].Confidence;
// Get block confidence level
double blockConfidence = ocrResult.Blocks[0].Confidence;
' Get page confidence level
Dim pageConfidence As Double = ocrResult.Pages(0).Confidence
' Get paragraph confidence level
Dim paragraphConfidence As Double = ocrResult.Paragraphs(0).Confidence
' Get line confidence level
Dim lineConfidence As Double = ocrResult.Lines(0).Confidence
' Get word confidence level
Dim wordConfidence As Double = ocrResult.Words(0).Confidence
' Get character confidence level
Dim characterConfidence As Double = ocrResult.Characters(0).Confidence
' Get block confidence level
Dim blockConfidence As Double = ocrResult.Blocks(0).Confidence
Obtenir des choix de personnages
En plus du niveau de confiance, il existe une autre propriété intéressante appelée Choices. Les choix contiennent une liste de choix de mots alternatifs et leur pertinence statistique. Cette information permet à l'utilisateur d'accéder à d'autres caractères possibles.
:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-choices.cs
using IronOcr;
using static IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Get choices
Choice[] choices = ocrResult.Characters[0].Choices;
Imports IronOcr
Imports IronOcr.OcrResult
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Get choices
Private choices() As Choice = ocrResult.Characters(0).Choices