Wie man Tesseract OCR Vertrauenswerte in C# verwendet | IronOCR

How to Get Read Confidence

This article was translated from English: Does it need improvement?
Translated
View the article in English

Lesevertrauen in OCR (Optische Zeichenerkennung) bezieht sich auf das Maß an Sicherheit oder Zuverlässigkeit, das das OCR-System der Genauigkeit des erkannten Textes in einem Bild oder Dokument zuweist. Es ist ein Maß dafür, wie sicher das OCR-System ist, dass der erkannte Text korrekt ist.

Ein hoher Vertrauenswert zeigt eine hohe Sicherheit an, dass die Erkennung genau ist, während ein niedriger Vertrauenswert darauf hindeutet, dass die Erkennung weniger zuverlässig sein könnte.

als-Überschrift:2(Kurzstart: OCR-Lesevertrauen in einer Zeile erhalten)

Verwenden Sie IronTesseracts Read-Methode mit einem Bilddateipfad und greifen Sie dann auf die Confidence-Eigenschaft des zurückgegebenen OcrResult zu, um zu sehen, wie sicher IronOCR bei der Texterkennung ist. Es ist eine einfache, zuverlässige Methode, um mit der Bewertung der OCR-Ausgabegenauigkeit zu beginnen.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    double confidence = new IronOcr.IronTesseract().Read("input.png").Confidence;
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer
class="hsg-featured-snippet">

Minimaler Arbeitsablauf (5 Schritte)

  1. Laden Sie eine C#-Bibliothek herunter, um das Lesevertrauen zu erhalten
  2. Bereiten Sie das Zielbild und das PDF-Dokument vor
  3. Greifen Sie auf die Confidence-Eigenschaft des OCR-Ergebnisses zu
  4. Rufen Sie die Zuverlässigkeit von Seiten, Absätzen, Zeilen, Wörtern und Zeichen ab
  5. Überprüfen Sie die Choices-Eigenschaft für alternative Wortauswahl


Beispiel: Lesen-Vertrauen erhalten

Nach der Durchführung der OCR auf dem Eingabebild wird die Vertrauensstufe des Textes in der Confidence-Eigenschaft gespeichert. Verwenden Sie die 'using'-Anweisung, um Objekte nach Gebrauch automatisch zu entsorgen. Fügen Sie Dokumente wie Bilder und PDFs mit den Klassen OcrImageInput und OcrPdfInput hinzu. Die Read-Methode gibt ein OcrResult-Objekt zurück, das den Zugriff auf die Confidence-Eigenschaft ermöglicht.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-confidence.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get confidence level
double confidence = ocrResult.Confidence;
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get confidence level
Private confidence As Double = ocrResult.Confidence
$vbLabelText   $csharpLabel

Lesen-Vertrauen auf verschiedenen Ebenen erhalten

Sie können nicht nur die Vertrauensstufe des gesamten Dokuments abrufen, sondern auch die Vertrauensstufen jeder Seite, jedes Absatzes, jeder Zeile, jedes Wortes und jedes Zeichens. Darüber hinaus können Sie das Vertrauen in einen Block erhalten, der eine Sammlung von einem oder mehreren Absätzen darstellt, die eng beieinander liegen.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-confidence-level.cs
// Get page confidence level
double pageConfidence = ocrResult.Pages[0].Confidence;

// Get paragraph confidence level
double paragraphConfidence = ocrResult.Paragraphs[0].Confidence;

// Get line confidence level
double lineConfidence = ocrResult.Lines[0].Confidence;

// Get word confidence level
double wordConfidence = ocrResult.Words[0].Confidence;

// Get character confidence level
double characterConfidence = ocrResult.Characters[0].Confidence;

// Get block confidence level
double blockConfidence = ocrResult.Blocks[0].Confidence;
' Get page confidence level
Dim pageConfidence As Double = ocrResult.Pages(0).Confidence

' Get paragraph confidence level
Dim paragraphConfidence As Double = ocrResult.Paragraphs(0).Confidence

' Get line confidence level
Dim lineConfidence As Double = ocrResult.Lines(0).Confidence

' Get word confidence level
Dim wordConfidence As Double = ocrResult.Words(0).Confidence

' Get character confidence level
Dim characterConfidence As Double = ocrResult.Characters(0).Confidence

' Get block confidence level
Dim blockConfidence As Double = ocrResult.Blocks(0).Confidence
$vbLabelText   $csharpLabel

Zeichenauswahl erhalten

Neben der Vertrauensstufe gibt es auch eine interessante Eigenschaft namens Choices. Choices enthalten eine Liste von alternativen Wortwahlen und deren statistische Relevanz. Diese Information ermöglicht es dem Benutzer, auf andere mögliche Zeichen zuzugreifen.

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-choices.cs
using IronOcr;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get choices
Choice[] choices = ocrResult.Characters[0].Choices;
Imports IronOcr
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get choices
Private choices() As Choice = ocrResult.Characters(0).Choices
$vbLabelText   $csharpLabel

Abgerufene Informationen

class="content-img-align-center">
class="center-image-wrapper"> Choices

Häufig gestellte Fragen

Was bedeutet Lesesicherheit in OCR?

Die Lesesicherheit in OCR bezieht sich auf die Sicherheit, die das System dem erkannten Text zuweist. Hohe Bewertungen zeigen zuverlässige Texterkennung, während niedrige auf mögliche Ungenauigkeiten hinweisen.

Wie kann ich eine C#-Bibliothek verwenden, um die Lesesicherheit zu erhalten?

Beginnen Sie mit dem Herunterladen der IronOCR-Bibliothek von NuGet. Bereiten Sie Ihre Bilder oder PDF-Dokumente für die Verarbeitung vor und verwenden Sie die Read-Methode, um auf die Confidence-Eigenschaft des OcrResult-Objekts zuzugreifen.

Wie kann ich die Zuverlässigkeitsstufe des erkannten Textes in C# abrufen?

Um die Zuverlässigkeitsstufe des erkannten Textes abzurufen, verwenden Sie die Read-Methode von IronOCR, die ein OcrResult-Objekt zurückgibt. Dieses Objekt enthält eine Confidence-Eigenschaft, die den Genauigkeitsgrad des Textes angibt.

Kann ich die Zuverlässigkeitsstufen für verschiedene Teile eines Dokuments überprüfen?

Ja, IronOCR ermöglicht es Ihnen, die Zuverlässigkeitsstufen für verschiedene Teile eines Dokuments zu überprüfen, einschließlich Seiten, Absätzen, Zeilen, Wörtern und Zeichen. Dies bietet eine detaillierte Genauigkeitsbewertung des OCR-Prozesses.

Was sind Zeichenentscheidungen in OCR?

Zeichenentscheidungen in OCR bieten eine Liste von alternativen Wortwahlmöglichkeiten und deren statistische Relevanz. Diese Funktion hilft Benutzern, auf andere mögliche Zeichen zuzugreifen, die vom OCR-System erkannt wurden, und bietet zusätzliche Einblicke in den Erkennungsprozess.

Wie wird die Zuverlässigkeitseigenschaft in einer C#-OCR-Bibliothek verwendet?

Die Confidence-Eigenschaft in einer C#-OCR-Bibliothek gibt den Genauigkeitsgrad des erkannten Textes an. Sie liefert eine numerische Punktzahl, die die Sicherheit des OCR-Systems über die Erkennungsgenauigkeit darstellt.

Ist es möglich, auf Block-Zuverlässigkeit in einer C#-OCR-Bibliothek zuzugreifen?

Ja, Sie können mit IronOCR auf Block-Zuverlässigkeit zugreifen. Ein Block repräsentiert eine Sammlung von eng beieinander liegenden Absätzen, und sein Zuverlässigkeitsgrad kann überprüft werden, um die Genauigkeit der Texterkennung auf dieser Ebene zu evaluieren.

Was ist der Zweck der Choices-Eigenschaft in OCR?

Die Choices-Eigenschaft bietet alternative Wortwahlmöglichkeiten und deren Zuverlässigkeitspunkte. Dies hilft Benutzern, andere potenzielle Textinterpretationen des OCR-Systems zu verstehen und verbessert die Bewertung des erkannten Textes.

Wie implementiere ich OCR mit Zuverlässigkeitsstufen in C#?

Implementieren Sie OCR mit Zuverlässigkeitsstufen in C#, indem Sie die IronOCR-Bibliothek verwenden. Richten Sie Ihre Umgebung ein, bereiten Sie Ihre Eingabedokumente vor und nutzen Sie die Read-Methode, um ein OcrResult-Objekt zu erhalten, aus dem Sie die Confidence-Eigenschaft abrufen können.

Welche Schritte sollte ich befolgen, um die Lesesicherheit mit einer C#-OCR-Bibliothek zu bewerten?

Um die Lesesicherheit zu bewerten, laden Sie die IronOCR-Bibliothek herunter, bereiten Sie die Dokumente für die OCR-Verarbeitung vor, verwenden Sie die Read-Methode, um ein OcrResult zu erhalten, und greifen Sie auf die Confidence-Eigenschaft zu, um die Genauigkeit des erkannten Textes zu bewerten.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen
Rezensiert von
Jeff Fritz
Jeffrey T. Fritz
Principal Program Manager - .NET Community Team
Jeff ist außerdem Principal Program Manager für das .NET- und Visual Studio-Team. Er ist der ausführende Produzent der .NET Conf Virtual Conference Series und moderiert ‚Fritz and Friends‘, einen Livestream für Entwickler, der zweimal wöchentlich ausgestrahlt wird. Dort spricht er über Technik und schreibt gemeinsam mit den Zuschauern Code. Jeff schreibt Workshops, Präsentationen und plant Inhalte für die größten Microsoft-Entwicklerveranstaltungen, einschließlich Microsoft Build, Microsoft Ignite, .NET Conf und dem Microsoft MVP Summit.
Bereit anzufangen?
Nuget Downloads 5,044,537 | Version: 2025.11 gerade veröffentlicht