Wie man Lesevertrauen gewinnt

This article was translated from English: Does it need improvement?
Translated
View the article in English

von Chaknith Bin

Vertrauen in OCR lesen(Optische Zeichenerkennung) bezieht sich auf den Grad der Sicherheit oder Zuverlässigkeit, den das OCR-System der Genauigkeit des erkannten Textes in einem Bild oder Dokument zuordnet. Sie ist ein Maß dafür, wie sicher das OCR-System ist, dass der erkannte Text korrekt ist.

Ein hoher Konfidenzwert zeigt an, dass die Erkennung mit großer Sicherheit korrekt ist, während ein niedriger Konfidenzwert darauf hindeutet, dass die Erkennung möglicherweise weniger zuverlässig ist.


C# NuGet-Bibliothek für OCR

Installieren mit NuGet

Install-Package IronOcr
oder
Java PDF JAR

Herunterladen DLL

DLL herunterladen

Manuelle Installation in Ihr Projekt

C# NuGet-Bibliothek für OCR

Installieren mit NuGet

Install-Package IronOcr
oder
Java PDF JAR

Herunterladen DLL

DLL herunterladen

Manuelle Installation in Ihr Projekt

Fangen Sie noch heute an, IronPDF in Ihrem Projekt mit einer kostenlosen Testversion zu verwenden.

Erster Schritt:
green arrow pointer

Schau dir an IronOCR an Nuget Für schnelle Installation und Bereitstellung. Mit über 8 Millionen Downloads verwandelt es OCR mit C#.

C# NuGet-Bibliothek für OCR nuget.org/packages/IronOcr/
Install-Package IronOcr

Erwägen Sie die Installation der IronOCR DLL direkt. Laden Sie es herunter und installieren Sie es manuell für Ihr Projekt oder die GAC-Form: IronOcr.zip

Manuelle Installation in Ihr Projekt

DLL herunterladen

Get Read Confidence Beispiel

Nach der OCR des Eingabebildes wird die Vertrauensstufe des Textes in der Eigenschaft Confidence gespeichert. Verwenden Sie die "using"-Anweisung, um Objekte automatisch zu entsorgen. Fügen Sie Dokumente wie Bilder und PDFs mit der Klasse OcrImageInput bzw. OcrPdfInput hinzu. Die Methode "Read" gibt ein "OcrResult"-Objekt zurück, das den Zugriff auf die Eigenschaft Confidence ermöglicht

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-confidence.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get confidence level
double confidence = ocrResult.Confidence;
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get confidence level
Private confidence As Double = ocrResult.Confidence
VB   C#

Lesen Sie Vertraulichkeiten auf verschiedenen Ebenen

Sie können nicht nur den Konfidenzgrad des gesamten Dokuments abrufen, sondern auch die Konfidenzgrade jeder Seite, jedes Absatzes, jeder Zeile, jedes Worts und jedes Zeichens. Außerdem können Sie das Vertrauen in einen Block gewinnen, der eine Sammlung von einem oder mehreren eng beieinander liegenden Absätzen darstellt.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-confidence-level.cs
// Get page confidence level
double pageConfidence = ocrResult.Pages[0].Confidence;

// Get paragraph confidence level
double paragraphConfidence = ocrResult.Paragraphs[0].Confidence;

// Get line confidence level
double lineConfidence = ocrResult.Lines[0].Confidence;

// Get word confidence level
double wordConfidence = ocrResult.Words[0].Confidence;

// Get character confidence level
double characterConfidence = ocrResult.Characters[0].Confidence;

// Get block confidence level
double blockConfidence = ocrResult.Blocks[0].Confidence;
' Get page confidence level
Dim pageConfidence As Double = ocrResult.Pages(0).Confidence

' Get paragraph confidence level
Dim paragraphConfidence As Double = ocrResult.Paragraphs(0).Confidence

' Get line confidence level
Dim lineConfidence As Double = ocrResult.Lines(0).Confidence

' Get word confidence level
Dim wordConfidence As Double = ocrResult.Words(0).Confidence

' Get character confidence level
Dim characterConfidence As Double = ocrResult.Characters(0).Confidence

' Get block confidence level
Dim blockConfidence As Double = ocrResult.Blocks(0).Confidence
VB   C#

Charakterwahlen erhalten

Neben dem Konfidenzniveau gibt es eine weitere interessante Eigenschaft, die Choices genannt wird. Die Auswahlmöglichkeiten enthalten eine Liste alternativer Wortwahlen und deren statistische Relevanz. Diese Informationen ermöglichen dem Benutzer den Zugriff auf andere mögliche Zeichen.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-choices.cs
using IronOcr;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get choices
Choice[] choices = ocrResult.Characters[0].Choices;
Imports IronOcr
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get choices
Private choices() As Choice = ocrResult.Characters(0).Choices
VB   C#

Abgerufene Informationen

Auswahlmöglichkeiten

Chaknith Bin

Software-Ingenieur

Chaknith ist der Sherlock Holmes der Entwickler. Zum ersten Mal kam ihm der Gedanke, dass er eine Zukunft in der Softwareentwicklung haben könnte, als er zum Spaß an Code Challenges teilnahm. Sein Schwerpunkt liegt auf IronXL und IronBarcode, aber er ist stolz darauf, Kunden mit jedem Produkt zu helfen. Chaknith nutzt sein Wissen aus direkten Gesprächen mit Kunden, um die Produkte selbst weiter zu verbessern. Sein anekdotisches Feedback geht über Jira-Tickets hinaus und unterstützt die Produktentwicklung, die Dokumentation und das Marketing, um das Gesamterlebnis der Kunden zu verbessern.Wenn er nicht im Büro ist, lernt er über maschinelles Lernen, programmiert und wandert.