Wie man Lesevertrauen gewinnt
Lesekonfidenz in der OCR (Optische Zeichenerkennung) bezieht sich auf das Maß an Sicherheit oder Zuverlässigkeit, das das OCR-System der Genauigkeit des Textes zuweist, den es in einem Bild oder Dokument erkannt hat. Sie ist ein Maß dafür, wie sicher das OCR-System ist, dass der erkannte Text korrekt ist.
Ein hoher Konfidenzwert zeigt an, dass die Erkennung mit großer Sicherheit korrekt ist, während ein niedriger Konfidenzwert darauf hindeutet, dass die Erkennung möglicherweise weniger zuverlässig ist.
Legen Sie los mit IronOCR
Beginnen Sie noch heute mit der Verwendung von IronOCR in Ihrem Projekt mit einer kostenlosen Testversion.
Wie man Lesevertrauen gewinnt
- Laden Sie eine C#-Bibliothek herunter, um auf Lesesicherheit zuzugreifen
- Bereiten Sie das Zielbild und das PDF-Dokument vor
- Zugriff auf die Confidence-Eigenschaft des OCR-Ergebnisses
- Abrufen der Zuverlässigkeitswerte von Seiten, Absätzen, Zeilen, Wörtern und Zeichen
- Überprüfen Sie die Choices-Eigenschaft für alternative Wortwahlmöglichkeiten
Get Read Confidence Beispiel
Nachdem OCR auf das Eingabebild angewendet wurde, wird das Sicherheitsniveau des Textes in der Confidence-Eigenschaft gespeichert. Verwenden Sie die "using"-Anweisung, um Objekte automatisch zu entsorgen. Fügen Sie Dokumente wie Bilder und PDFs mit der Klasse OcrImageInput
bzw. OcrPdfInput
hinzu. Die Read
-Methode gibt ein 'OcrResult'-Objekt zurück, das Zugriff auf die Confidence-Eigenschaft ermöglicht
:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-confidence.cs
using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Get confidence level
double confidence = ocrResult.Confidence;
Imports IronOcr
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("sample.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Get confidence level
Private confidence As Double = ocrResult.Confidence
Lesen Sie Vertraulichkeiten auf verschiedenen Ebenen
Sie können nicht nur den Konfidenzgrad des gesamten Dokuments abrufen, sondern auch die Konfidenzgrade jeder Seite, jedes Absatzes, jeder Zeile, jedes Worts und jedes Zeichens. Außerdem können Sie das Vertrauen in einen Block gewinnen, der eine Sammlung von einem oder mehreren eng beieinander liegenden Absätzen darstellt.
:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-confidence-level.cs
// Get page confidence level
double pageConfidence = ocrResult.Pages[0].Confidence;
// Get paragraph confidence level
double paragraphConfidence = ocrResult.Paragraphs[0].Confidence;
// Get line confidence level
double lineConfidence = ocrResult.Lines[0].Confidence;
// Get word confidence level
double wordConfidence = ocrResult.Words[0].Confidence;
// Get character confidence level
double characterConfidence = ocrResult.Characters[0].Confidence;
// Get block confidence level
double blockConfidence = ocrResult.Blocks[0].Confidence;
' Get page confidence level
Dim pageConfidence As Double = ocrResult.Pages(0).Confidence
' Get paragraph confidence level
Dim paragraphConfidence As Double = ocrResult.Paragraphs(0).Confidence
' Get line confidence level
Dim lineConfidence As Double = ocrResult.Lines(0).Confidence
' Get word confidence level
Dim wordConfidence As Double = ocrResult.Words(0).Confidence
' Get character confidence level
Dim characterConfidence As Double = ocrResult.Characters(0).Confidence
' Get block confidence level
Dim blockConfidence As Double = ocrResult.Blocks(0).Confidence
Charakterwahlen erhalten
Abgesehen vom Vertrauensniveau gibt es eine weitere interessante Eigenschaft namens Choices. Die Auswahlmöglichkeiten enthalten eine Liste alternativer Wortwahlen und deren statistische Relevanz. Diese Informationen ermöglichen dem Benutzer den Zugriff auf andere mögliche Zeichen.
:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-choices.cs
using IronOcr;
using static IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Get choices
Choice[] choices = ocrResult.Characters[0].Choices;
Imports IronOcr
Imports IronOcr.OcrResult
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Get choices
Private choices() As Choice = ocrResult.Characters(0).Choices
Abgerufene Informationen
