How to Extract Read Results

This article was translated from English: Does it need improvement?
Translated
View the article in English

Das Lese- oder OCR-Ergebnis umfasst eine Fülle von Informationen zu erkannten Absätzen, Zeilen, Wörtern und einzelnen Zeichen. Für jedes dieser Elemente liefert das Ergebnis eine umfassende Reihe von Details.

Für jedes Element werden der Textinhalt, präzise X- und Y-Koordinaten, Abmessungen (Breite und Höhe), Textrichtung (von links nach rechts oder von oben nach unten) und der Standort in einem CropRectangle-Objekt bereitgestellt.

als-Überschrift:2(Schnellstart: Worttext vom ersten erkannten Wort abrufen)

In Sekundenschnelle loslegen: Verwenden Sie die Read-Methode von IronTesseract, um ein Bild zu OCRen und den Text des ersten Wortes mit der Words-Sammlung zu extrahieren. Perfekt für schnelle Setups und einfache Extraktionsaufgaben.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    string wordText = new IronTesseract().Read("file.jpg").Words[0].Text;
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer
class="hsg-featured-snippet">

Minimaler Workflow (5 Schritte)

  1. Laden Sie eine C#-Bibliothek herunter, um Leseergebnisse zuzugreifen
  2. Bereiten Sie das Zielbild und das PDF-Dokument vor
  3. Verwenden Sie die Read-Methode, um OCR auf dem importierten Dokument durchzuführen
  4. Greifen Sie auf X, Y, Breite, Höhe und Textrichtung des Ergebnisses zu
  5. Überprüfen Sie die erkannten Absätze, Zeilen, Wörter und Zeichenerkennungen


Daten in OcrResult

Der Ergebniswert enthält nicht nur den extrahierten Text, sondern liefert auch Informationen über Seiten, Absätze, Zeilen, Wörter, Zeichen und Barcodes, die im PDF- und Bilddokument von IronOcr entdeckt wurden. Sie können auf diese Informationen aus dem zurückgegebenen OcrResult-Objekt mit der Read-Methode zugreifen.

:path=/static-assets/ocr/content-code-examples/how-to/read-results-output-information.cs
using IronOcr;
using System;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;

// Output information to console
Console.WriteLine($"Text: {paragraphs[0].Text}");
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
Console.WriteLine($"Width: {paragraphs[0].Width}");
Console.WriteLine($"Height: {paragraphs[0].Height}");
Console.WriteLine($"Text direction: {paragraphs[0].TextDirection}");
Imports IronOcr
Imports System
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.jpg")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Retrieve list of detected paragraphs
Private paragraphs() As Paragraph = ocrResult.Paragraphs

' Output information to console
Console.WriteLine($"Text: {paragraphs(0).Text}")
Console.WriteLine($"X: {paragraphs(0).X}")
Console.WriteLine($"Y: {paragraphs(0).Y}")
Console.WriteLine($"Width: {paragraphs(0).Width}")
Console.WriteLine($"Height: {paragraphs(0).Height}")
Console.WriteLine($"Text direction: {paragraphs(0).TextDirection}")
$vbLabelText   $csharpLabel
class="content-img-align-center">
class="center-image-wrapper"> Daten in OcrResult

Für jeden Teil des Textes, wie Absätze, Zeilen, Wörter und einzelne Zeichen, stellen wir folgende Informationen bereit:

  • Text: Der tatsächliche Text als String.
  • X: Die Position vom linken Rand der Seite in Pixeln.
  • Y: Die Position vom oberen Rand der Seite in Pixeln.
  • Breite: Die Breite in Pixeln.
  • Höhe: Die Höhe in Pixeln.
  • Textrichtung: Die Richtung, in der der Text gelesen wurde, wie 'Von links nach rechts' oder 'Von oben nach unten'.
  • Standort: Ein Rechteck, das zeigt, wo sich dieser Text auf der Seite in Pixeln befindet.

Vergleich von Absatz, Zeile, Wort und Zeichen

Nachfolgend finden Sie den Vergleich der erkannten Absätze, Zeilen, Wörter und Zeichen.

class="content-img-align-center">
class="center-image-wrapper"> Abschnitt hervorheben
class="content-img-align-center">
class="center-image-wrapper"> Zeile hervorheben
class="content-img-align-center">
class="center-image-wrapper"> Wort hervorheben
class="content-img-align-center">
class="center-image-wrapper"> Zeichen hervorheben

Barcode und QR Code

Das ist korrekt! IronOcr kann Barcodes und QR-Codes lesen. Zwar ist die Funktion möglicherweise nicht so robust wie IronBarcode, doch IronOcr unterstützt gängige Barcode-Typen. Um die Barcodelesung zu aktivieren, setzen Sie die Configuration.ReadBarCodes-Eigenschaft auf wahr.

Darüber hinaus können wertvolle Informationen aus dem erkannten Barcode extrahiert werden, einschließlich seines Formats, Werts, seiner Koordinaten (x, y), Höhe, Breite und seines Standorts als IronSoftware.Drawing.Rectangle-Objekt. Diese Rectangle-Klasse in IronDrawing ermöglicht eine präzise Positionierung im Dokument.

:path=/static-assets/ocr/content-code-examples/how-to/read-results-barcodes.cs
using IronOcr;
using System;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = true;

// Add image
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Output information to console
foreach(var barcode in ocrResult.Barcodes)
{
    Console.WriteLine("Format = " + barcode.Format);
    Console.WriteLine("Value = " + barcode.Value);
    Console.WriteLine("X = " + barcode.X);
    Console.WriteLine("Y = " + barcode.Y);
}
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports System
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = True

' Add image
Using ocrInput As New OcrInput()
	ocrInput.LoadPdf("sample.pdf")
	
	' Perform OCR
	Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
	
	' Output information to console
	For Each barcode In ocrResult.Barcodes
		Console.WriteLine("Format = " & barcode.Format)
		Console.WriteLine("Value = " & barcode.Value)
		Console.WriteLine("X = " & barcode.X)
		Console.WriteLine("Y = " & barcode.Y)
	Next barcode
	Console.WriteLine(ocrResult.Text)
End Using
$vbLabelText   $csharpLabel

Ausgabe

class="content-img-align-center">
class="center-image-wrapper"> Barcodes erkennen

Häufig gestellte Fragen

Wie extrahiere ich Textelemente aus Bildern und PDFs mit C#?

Sie können Textelemente aus Bildern und PDFs mit IronOCR extrahieren, indem Sie die Read-Methode nutzen, die optische Zeichenerkennung (OCR) durchführt, um Details zu Absätzen, Zeilen, Wörtern und Zeichen zu erhalten, einschließlich ihres Textinhalts, ihrer Koordinaten und Abmessungen.

Wie starte ich den OCR-Prozess in .NET C#?

Um mit OCR in .NET C# zu beginnen, laden Sie die IronOCR-Bibliothek von NuGet herunter, bereiten Sie Ihr Bild- oder PDF-Dokument vor und verwenden Sie die Read-Methode, um ein OcrResult-Objekt zu erhalten, das detaillierte Informationen über den extrahierten Text und die Dokumentstruktur enthält.

Kann IronOCR Barcode-Informationen erkennen und extrahieren?

Ja, IronOCR kann Barcode-Informationen erkennen und extrahieren, indem die Eigenschaft Configuration.ReadBarCodes auf wahr gesetzt wird, wodurch Sie Daten wie das Barcode-Format, den Wert und die Position innerhalb des Dokuments abrufen können.

Welche Dokumentelemente kann IronOCR erkennen?

IronOCR kann verschiedene Dokumentelemente erkennen, einschließlich Seiten, Absätze, Zeilen, Wörter und einzelne Zeichen, sowie Barcodes und QR-Codes. Es bietet eine umfassende Analyse der Dokumentstruktur.

Wie kann ich IronOCR konfigurieren, um Text in unterschiedlichen Richtungen zu lesen?

IronOCR ist in der Lage, Text in mehreren Richtungen zu lesen, wie beispielsweise von links nach rechts oder von oben nach unten, indem es die Richtungseigenschaft innerhalb des OcrResult-Objekts analysiert.

Was ist das CropRectangle-Objekt in IronOCR?

Das CropRectangle-Objekt in IronOCR definiert den Ort und die Größe von Textelementen auf einer Seite in Bezug auf Koordinaten und Abmessungen, was bei der präzisen Textidentifikation und -extraktion hilft.

Wie verwende ich die Read-Methode von IronOCR, um Dokumente zu analysieren?

Um die Read-Methode in IronOCR zu verwenden, erstellen Sie eine Instanz der IronOCR-Engine, laden Sie Ihr Zieldokument und führen Sie die Read-Methode aus, um OCR-Ergebnisse zu erhalten, die zum Zugriff auf Textdaten und Dokumenteigenschaften verwendet werden können.

Wie behandelt IronOCR die Erkennung von QR-Codes?

IronOCR behandelt die Erkennung von QR-Codes, indem es das Barcode-Lesen über die Einstellung Configuration.ReadBarCodes aktiviert, was es ermöglicht, QR-Code-Daten wie Format, Wert und Ort zu extrahieren.

Welche Rolle spielt das OcrResult-Objekt bei der Textextraktion?

Das OcrResult-Objekt spielt eine entscheidende Rolle bei der Textextraktion, indem es den extrahierten Text und begleitende Details wie die Position, Abmessungen und Richtung von Textelementen sowie Barcode-Informationen hält.

Wie kann ich eine genaue Textextraktion mit IronOCR sicherstellen?

Um eine genaue Textextraktion mit IronOCR sicherzustellen, stellen Sie sicher, dass Sie hochwertige Eingangsdokumente bereitstellen und Einstellungen wie Configuration.ReadBarCodes für die Barcode-Erkennung richtig konfigurieren, um die OCR-Leistung zu optimieren.

Chaknith Bin
Software Ingenieur
Chaknith arbeitet an IronXL und IronBarcode. Er hat umfassende Expertise in C# und .NET und hilft, die Software zu verbessern und Kunden zu unterstützen. Seine Einblicke aus Benutzerinteraktionen tragen zu besseren Produkten, Dokumentationen und einem insgesamt besseren Erlebnis bei.
Bereit anzufangen?
Nuget Downloads 5,044,537 | Version: 2025.11 gerade veröffentlicht