Zum Fußzeileninhalt springen

OCR-Ergebnisse

Erhalten Sie mehr als nur Text. Unsere API bietet strukturierte Daten wie Koordinaten, Konfidenzwerte und eine vollständige Dokumenthierarchie (Seiten, Zeilen, Wörter).

Icon Main related to OCR-Ergebnisse
Datenausgabe

1

Texte

IronOCR gibt die Textausgabe für Absätze, Zeilen, Wörter und Zeichen als strukturierte Objekte und Zeichenketten zurück, so dass Entwickler schnell auf die Daten zugreifen und sie manipulieren können.

using IronOcr;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    // Page text
    string PageText = page.Text;
}
C#
2

OCR-Texte Standort

Erhalten Sie die exakten X/Y-Koordinaten und Bounding-Box-Abmessungen für jeden Absatz, jede Zeile, jedes Wort und jedes Zeichen und ermöglichen Sie so Texthervorhebung, zonale OCR und Datenvalidierung.

Erfahren Sie, wie man:Leseergebnisse in .NET C# extrahiert
using IronOcr;
using IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;

// Output Text location (X,Y) of the first paragraph
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
C#
3

OCR Output Vertrauen

Sie erhalten einen Konfidenzwert für die extrahierten Texte. Programmgesteuertes Markieren von Ergebnissen mit geringer Konfidenz zur Überprüfung durch einen Menschen, um zuverlässigere Automatisierungsworkflows zu erstellen.

Erfahren Sie, wie Sie:Lesesicherheit in .NET C# erhalten
using IronOcr;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Load image from file
ocrInput.LoadImage("sameple.png");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Check Confidence level
Console.WriteLine($"Confidence: {ocrResult.Confidence}%");
C#
4

Bilder von OCR-Elementen

Zusätzlich zum Text können Sie visuelle Elemente von Texten, die durch OCR aus dem Eingabedokument erkannt wurden, als separate Bilddateien exportieren, was für die Archivierung oder Verarbeitung von nicht-textlichen Daten nützlich ist.

Erfahren Sie, wie man:Leseergebnisse in .NET C# extrahiert
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage("sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    foreach (var word in page.Words)
    {
        word.ToBitmap(ocrInput).SaveAs($"page{page.PageNumber}_word{word.WordNumber}.png", AnyBitmap.ImageFormat.Png);
    }
}
C#

Icon Main related to OCR-Ergebnisse
Output-Typen

1

Text

Zugriff auf die OCR-Ergebnisse über eine strukturierte, hierarchische API. Navigieren Sie mühelos von großen Absätzen bis hinunter zu einzelnen Zeichen, so dass Sie den extrahierten Text und seine Metadaten genauestens kontrollieren können.

Erfahren Sie, wie man:Leseergebnisse in .NET C# extrahiert
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Output the first detected paragraph text
Console.WriteLine($"Text: {ocrResult.Paragraphs[0].Text}");
C#
2

Durchsuchbare PDFs

Konvertieren Sie jedes gescannte Dokument oder Bild in eine vollständig durchsuchbare PDF-Datei. Das ursprüngliche Layout bleibt erhalten, aber der gesamte Text wird auswählbar, kopierbar und durchsuchbar.

Erfahren Sie, wie Sie:Ergebnisse als durchsuchbare PDF-Datei speichern
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as searchable PDF
ocrTesseract.Configuration.RenderSearchablePdf = true;

// Add image
using var imageInput = new OcrImageInput("sample.tiff");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf");
C#
3

hOCR

Die Ergebnisse werden im hOCR-Format exportiert, einem HTML-basierten Standard, der umfangreiche Metadaten, einschließlich Text, Layoutinformationen und Koordinaten für jedes Wort, bereitstellt und sich ideal für die erweiterte Dokumentenanalyse eignet.

Erfahren Sie, wie Sie:Ergebnisse als hOCR in einer HTML-Datei speichern
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as hOCR
ocrTesseract.Configuration.RenderHocr = true;

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
imageInput.Title = "Html Title";

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as HTML
ocrResult.SaveAsHocrFile("result.html");
C#
4

Texte als Bilder hervorheben

Zur Fehlersuche und Überprüfung erstellen Sie ein Bild des Originaldokuments, in dem der erkannte Text hervorgehoben ist. Dies ermöglicht eine schnelle visuelle Überprüfung der Genauigkeit der OCR-Engine und der Textposition.

Lernen Sie, wie man:C# Texte für die Fehlersuche hervorhebt
using IronOcr;

IronTesseract ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_page_", ResultHighlightType.Paragraph);
C#
5

BarCode- und QR-Code-Werte

Extrahieren Sie die dekodierten String-Werte von BarCodes oder QR-Codes, die sich im Dokument befinden. Die API liefert diese Daten zusammen mit den Textergebnissen für eine vollständige Datenerfassungslösung.

Erfahren Sie, wie man:Leseergebnisse in .NET C# extrahiert
using IronOcr;
using IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = true;

// Load PDF file
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Output Barcode value
Console.WriteLine(ocrResult.Barcodes[0].Value);
C#
Bereit anzufangen?
Nuget Downloads 5,167,857 | Version: 2025.11 gerade veröffentlicht