Wie man Lesevertrauen gewinnt
Vertrauen in OCR lesen(Optische Zeichenerkennung) bezieht sich auf den Grad der Sicherheit oder Zuverlässigkeit, den das OCR-System der Genauigkeit des erkannten Textes in einem Bild oder Dokument zuordnet. Sie ist ein Maß dafür, wie sicher das OCR-System ist, dass der erkannte Text korrekt ist.
Ein hoher Konfidenzwert zeigt an, dass die Erkennung mit großer Sicherheit korrekt ist, während ein niedriger Konfidenzwert darauf hindeutet, dass die Erkennung möglicherweise weniger zuverlässig ist.
Legen Sie los mit IronOCR
Beginnen Sie noch heute mit der Verwendung von IronOCR in Ihrem Projekt mit einer kostenlosen Testversion.
Wie man Lesevertrauen gewinnt
- Laden Sie eine C#-Bibliothek herunter, um auf das Lesevertrauen zuzugreifen
- Bereiten Sie das Zielbild und das PDF-Dokument vor
- Zugriff auf die Vertrauen eigenschaft des OCR-Ergebnisses
- Abrufen des Vertrauens von Seiten, Absätzen, Zeilen, Wörtern und Zeichen
- Prüfen Sie die Auswahlmöglichkeiten eigenschaft für alternative Wortwahlen
Get Read Confidence Beispiel
Nach der OCR des Eingabebildes wird die Vertrauensstufe des Textes in der Eigenschaft Confidence gespeichert. Verwenden Sie die "using"-Anweisung, um Objekte automatisch zu entsorgen. Fügen Sie Dokumente wie Bilder und PDFs mit der Klasse OcrImageInput
bzw. OcrPdfInput
hinzu. Die Methode "Read" gibt ein "OcrResult"-Objekt zurück, das den Zugriff auf die Eigenschaft Confidence ermöglicht
:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-confidence.cs
using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Get confidence level
double confidence = ocrResult.Confidence;
Imports IronOcr
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("sample.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Get confidence level
Private confidence As Double = ocrResult.Confidence
Lesen Sie Vertraulichkeiten auf verschiedenen Ebenen
Sie können nicht nur den Konfidenzgrad des gesamten Dokuments abrufen, sondern auch die Konfidenzgrade jeder Seite, jedes Absatzes, jeder Zeile, jedes Worts und jedes Zeichens. Außerdem können Sie das Vertrauen in einen Block gewinnen, der eine Sammlung von einem oder mehreren eng beieinander liegenden Absätzen darstellt.
:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-confidence-level.cs
// Get page confidence level
double pageConfidence = ocrResult.Pages[0].Confidence;
// Get paragraph confidence level
double paragraphConfidence = ocrResult.Paragraphs[0].Confidence;
// Get line confidence level
double lineConfidence = ocrResult.Lines[0].Confidence;
// Get word confidence level
double wordConfidence = ocrResult.Words[0].Confidence;
// Get character confidence level
double characterConfidence = ocrResult.Characters[0].Confidence;
// Get block confidence level
double blockConfidence = ocrResult.Blocks[0].Confidence;
' Get page confidence level
Dim pageConfidence As Double = ocrResult.Pages(0).Confidence
' Get paragraph confidence level
Dim paragraphConfidence As Double = ocrResult.Paragraphs(0).Confidence
' Get line confidence level
Dim lineConfidence As Double = ocrResult.Lines(0).Confidence
' Get word confidence level
Dim wordConfidence As Double = ocrResult.Words(0).Confidence
' Get character confidence level
Dim characterConfidence As Double = ocrResult.Characters(0).Confidence
' Get block confidence level
Dim blockConfidence As Double = ocrResult.Blocks(0).Confidence
Charakterwahlen erhalten
Neben dem Konfidenzniveau gibt es eine weitere interessante Eigenschaft, die Choices genannt wird. Die Auswahlmöglichkeiten enthalten eine Liste alternativer Wortwahlen und deren statistische Relevanz. Diese Informationen ermöglichen dem Benutzer den Zugriff auf andere mögliche Zeichen.
:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-choices.cs
using IronOcr;
using static IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Get choices
Choice[] choices = ocrResult.Characters[0].Choices;
Imports IronOcr
Imports IronOcr.OcrResult
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Get choices
Private choices() As Choice = ocrResult.Characters(0).Choices