Lesen von PDFs in C# mit IronOCR

Aktualisiert:3. Juni 2026

Translated

View the article in English

IronOCR ermöglicht die Extraktion von Text aus PDF-Dateien in C# mit einer einzigen Codezeile, unterstützt alle PDF-Versionen und liefert dank seiner Tesseract-basierten Engine präzise OCR-Ergebnisse.

PDF steht für "Portable Document Format" Dabei handelt es sich um ein von Adobe entwickeltes Dateiformat, das die Schriftarten, Bilder, Grafiken und das Layout eines beliebigen Quelldokuments unabhängig von der Anwendung und der Plattform, die zur Erstellung verwendet wurden, beibehält. PDF-Dateien werden typischerweise zum Teilen und Anzeigen von Dokumenten in einem konsistenten Format verwendet, unabhängig von der verwendeten Software oder Hardware. IronOCR verarbeitet verschiedene Versionen von PDF-Dokumenten, von älteren PDF 1.0-Spezifikationen bis hin zu den neuesten PDF 2.0-Standards.

Schnellstart: PDF-Datei in Sekunden ocren

Konfigurieren Sie OCR schnell mit IronOCR, indem Sie einen OcrPdfInput erstellen, der auf Ihre PDF-Datei verweist, und rufen Sie dann Read auf. Dieses Beispiel demonstriert die Textextraktion aus einer PDF-Datei mit IronOCR.

Installieren Sie IronOCR mit NuGet Package Manager
PM > Install-Package IronOcr

Kopieren Sie diesen Codeausschnitt und führen Sie ihn aus.

using var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrPdfInput("document.pdf", PdfContents.TextAndImages));

Bereitstellen zum Testen in Ihrer Live-Umgebung

Beginnen Sie noch heute, IronOCR in Ihrem Projekt zu verwenden, mit einer kostenlosen Testversion

Minimaler Arbeitsablauf (5 Schritte)

Herunterladen einer C#-Bibliothek zum Lesen von PDFs
Bereiten Sie das PDF-Dokument zum Lesen vor
Konstruieren Sie das OcrPdfInput Objekt mit dem PDF-Dateipfad
Verwenden Sie die Methode Lesen, um die importierte PDF-Datei mit OCR zu bearbeiten
Lesen Sie bestimmte Seiten, indem Sie die Liste der Seitenindizes angeben

Wie kann ich eine ganze PDF-Datei lesen?

Beginnen Sie mit der Instanziierung der Klasse IronTesseract, um OCR durchzuführen. Verwenden Sie anschließend eine "using"-Anweisung, um ein OcrPdfInput-Objekt zu erstellen, und übergeben Sie ihm den Pfad zur PDF-Datei. Führen Sie abschließend eine OCR mit der Methode Read durch. Dieser Ansatz funktioniert sowohl mit gescannten PDFs (bildbasiert) als auch mit durchsuchbaren PDFs (textbasiert) und eignet sich für die Extraktion von Text aus verschiedenen PDF-Typen.

/* :path=/static-assets/ocr/content-code-examples/how-to/input-pdfs-read-pdf.cs */
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add PDF
using var pdfInput = new OcrPdfInput("Potter.pdf");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(pdfInput);

// Access the extracted text
string extractedText = ocrResult.Text;
System.Console.WriteLine(extractedText);

/* :path=/static-assets/ocr/content-code-examples/how-to/input-pdfs-read-pdf.cs */
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add PDF
using var pdfInput = new OcrPdfInput("Potter.pdf");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(pdfInput);

// Access the extracted text
string extractedText = ocrResult.Text;
System.Console.WriteLine(extractedText);

Imports IronOcr

' Instantiate IronTesseract
Dim ocrTesseract As New IronTesseract()

' Add PDF
Using pdfInput As New OcrPdfInput("Potter.pdf")
    ' Perform OCR
    Dim ocrResult As OcrResult = ocrTesseract.Read(pdfInput)

    ' Access the extracted text
    Dim extractedText As String = ocrResult.Text
    System.Console.WriteLine(extractedText)
End Using

$vbLabelText $csharpLabel

In den meisten Fällen ist es nicht erforderlich, die Eigenschaft DPI anzugeben. Die Angabe eines hohen DPI-Werts bei der Erstellung von OcrPdfInput kann jedoch die Lesegenauigkeit verbessern. Die Standard-DPI-Einstellung ist in der Regel für die meisten Standard-PDF-Dokumente ausreichend, aber spezielle Dokumente können von einer Anpassung profitieren.

Wann sollte ich die DPI-Einstellungen anpassen?

Die DPI-Einstellungen (Dots Per Inch) sind von entscheidender Bedeutung, wenn es um gescannte Dokumente mit niedriger Auflösung oder PDF-Dateien mit kleinem Text geht. Um optimale Ergebnisse zu erzielen, sollten Sie die DPI-Einstellungen anpassen, wenn:

Arbeiten mit gescannten Dokumenten unter 200 DPI
Verarbeitung historischer oder archivierter PDFs
Umgang mit komplexen Layouts oder kleinen Schriftarten
Probleme mit der Genauigkeit bei Standardeinstellungen

Für die meisten OCR-Vorgänge wird ein DPI-Wert von 300 empfohlen, während für Dokumente mit sehr kleinem Text oder komplizierten Details ein DPI-Wert von 600 erforderlich sein kann.

Welche Dateiformate unterstützt IronOCR neben PDF?

IronOCR bietet umfassende Unterstützung für zahlreiche Dateiformate über PDFs hinaus. Sie können Bilder in verschiedenen Formaten verarbeiten, darunter:

JPEG/JPG für Standardfotos
PNG für Bilder mit Transparenz
TIFF für mehrseitige Dokumente
BMP für unkomprimierte Bilder
GIF für einfache Grafiken

Darüber hinaus kann IronOCR PDF-Streams direkt aus dem Speicher verarbeiten, was für Webanwendungen und Cloud-Dienste geeignet ist.

Arbeiten mit PDF-Inhaltstypen

Bei der Verarbeitung von PDFs können Sie die Leistung durch Angabe des Inhaltstyps optimieren. Mit der Enumeration PdfContents können Sie bestimmte Inhalte gezielt ansprechen:

// For text-only PDFs (faster processing)
var textOnlyPdf = new OcrPdfInput("document.pdf", PdfContents.Text);

// For image-only PDFs (scanned documents)
var imageOnlyPdf = new OcrPdfInput("scanned.pdf", PdfContents.Images);

// For mixed content (default)
var mixedPdf = new OcrPdfInput("mixed.pdf", PdfContents.TextAndImages);

// For text-only PDFs (faster processing)
var textOnlyPdf = new OcrPdfInput("document.pdf", PdfContents.Text);

// For image-only PDFs (scanned documents)
var imageOnlyPdf = new OcrPdfInput("scanned.pdf", PdfContents.Images);

// For mixed content (default)
var mixedPdf = new OcrPdfInput("mixed.pdf", PdfContents.TextAndImages);

' For text-only PDFs (faster processing)
Dim textOnlyPdf = New OcrPdfInput("document.pdf", PdfContents.Text)

' For image-only PDFs (scanned documents)
Dim imageOnlyPdf = New OcrPdfInput("scanned.pdf", PdfContents.Images)

' For mixed content (default)
Dim mixedPdf = New OcrPdfInput("mixed.pdf", PdfContents.TextAndImages)

$vbLabelText $csharpLabel

Wie lese ich bestimmte Seiten aus einer PDF-Datei?

Wenn Sie bestimmte Seiten aus einem PDF-Dokument lesen, geben Sie die Seitenindexnummer für den Import an. Geben Sie dazu beim Erstellen des OcrPdfInput die Liste der Seitenindizes an den Parameter PageIndices weiter. Bedenken Sie, dass bei Seitenindizes nullbasierte Nummerierung verwendet wird. Diese Funktion ist besonders nützlich bei der Arbeit mit umfangreichen Dokumenten, bei denen nur bestimmte Seiten relevante Informationen enthalten.

:path=/static-assets/ocr/content-code-examples/how-to/input-pdfs-read-pdf-pages.cs

using IronOcr;
using System.Collections.Generic;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Create page indices list
List<int> pageIndices = new List<int>() { 0, 2 };

// Add PDF
using var pdfInput = new OcrPdfInput("Potter.pdf", PageIndices: pageIndices);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(pdfInput);

Imports IronOcr
Imports System.Collections.Generic

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Create page indices list
Private pageIndices As New List(Of Integer)() From {0, 2}

' Add PDF
Private pdfInput = New OcrPdfInput("Potter.pdf", PageIndices:= pageIndices)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(pdfInput)

$vbLabelText $csharpLabel

Warum beginnt die Seitennummerierung bei Null?

Null-basierte Indizierung ist eine Standardkonvention in C# und den meisten Programmiersprachen. Das bedeutet, dass die erste Seite den Index 0 hat, die zweite Seite den Index 1 und so weiter. Diese Konsistenz mit der Array-Indizierung erleichtert den Entwicklern die programmatische Arbeit mit Seitenkollektionen. Bei der Konvertierung von Seitenzahlen (1, 2, 3...) in Indizes wird einfach 1 von der Seitenzahl abgezogen.

Wie kann ich nicht-zusammenhängende Seiten lesen?

Das Lesen von nicht-konsekutiven Seiten ist mit IronOCR ganz einfach. Fügen Sie einfach die gewünschten Seitenindizes in beliebiger Reihenfolge zu Ihrer Liste hinzu. Zum Beispiel:

// Read pages 1, 3, 5, and 10 (using zero-based indices)
List<int> pageIndices = new List<int>() { 0, 2, 4, 9 };

// Or use LINQ for range-based selection
var evenPages = Enumerable.Range(0, 10).Where(x => x % 2 == 0).ToList();

// Read pages 1, 3, 5, and 10 (using zero-based indices)
List<int> pageIndices = new List<int>() { 0, 2, 4, 9 };

// Or use LINQ for range-based selection
var evenPages = Enumerable.Range(0, 10).Where(x => x % 2 == 0).ToList();

Imports System.Collections.Generic
Imports System.Linq

' Read pages 1, 3, 5, and 10 (using zero-based indices)
Dim pageIndices As New List(Of Integer)() From {0, 2, 4, 9}

' Or use LINQ for range-based selection
Dim evenPages = Enumerable.Range(0, 10).Where(Function(x) x Mod 2 = 0).ToList()

$vbLabelText $csharpLabel

Die OCR-Engine wird nur die angegebenen Seiten verarbeiten, was die Leistung bei großen Dokumenten erheblich verbessert.

Was passiert, wenn ich ungültige Seitenzahlen angebe?

Wenn Sie Seitenindizes angeben, die die Seitenzahl des Dokuments überschreiten, löst IronOCR eine Ausnahme aus. Implementieren Sie eine Fehlerbehandlung oder validieren Sie die Seitenzahlen vor der Verarbeitung. Sie können die Gesamtseitenzahl einer PDF-Datei überprüfen, bevor Sie die OCR durchführen, um sicherzustellen, dass Ihre Indizes gültig sind.

Wie erkenne ich einen bestimmten Bereich einer PDF-Datei mit OCR?

Indem Sie den zu lesenden Bereich eingrenzen, können Sie die Leseeffizienz erheblich steigern. Um dies zu erreichen, geben Sie den genauen Bereich der importierten PDF-Datei an, der gelesen werden muss. Im folgenden Codebeispiel konzentriert sich IronOCR ausschließlich auf die Extraktion der Kapitelnummer und des Titels. Diese Technik, die der Definition von OCR-Regionen für Bilder ähnelt, verbessert sowohl die Geschwindigkeit als auch die Genauigkeit.

:path=/static-assets/ocr/content-code-examples/how-to/input-pdfs-read-specific-region.cs

using IronOcr;
using IronSoftware.Drawing;
using System;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Specify crop regions
Rectangle[] scanRegions = { new Rectangle(550, 100, 600, 300) };

// Add PDF
using (var pdfInput = new OcrPdfInput("Potter.pdf", ContentAreas: scanRegions))
{
    // Perform OCR
    OcrResult ocrResult = ocrTesseract.Read(pdfInput);

    // Output the result to console
    Console.WriteLine(ocrResult.Text);
}

Imports IronOcr
Imports IronSoftware.Drawing
Imports System

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Specify crop regions
Private scanRegions() As Rectangle = { New Rectangle(550, 100, 600, 300) }

' Add PDF
Using pdfInput = New OcrPdfInput("Potter.pdf", ContentAreas:= scanRegions)
	' Perform OCR
	Dim ocrResult As OcrResult = ocrTesseract.Read(pdfInput)

	' Output the result to console
	Console.WriteLine(ocrResult.Text)
End Using

$vbLabelText $csharpLabel

Wie bestimme ich die korrekten Rechteckkoordinaten?

Um die richtigen Koordinaten zu finden, muss man das Koordinatensystem der PDF-Datei verstehen. Der Konstruktor Rectangle nimmt vier Parameter entgegen: X (horizontale Position), Y (vertikale Position), Width und Height. Alle Maße sind in Pixeln angegeben. Tools wie PDF-Viewer mit Linealfunktionen oder Debugging-Dienstprogramme können dabei helfen, genaue Koordinaten zu ermitteln. Alternativ können Sie auch durch Ausprobieren und kleine Anpassungen Ihren Auswahlbereich verfeinern.

Zur genaueren Definition von Bereichen können Sie die Funktion Texte für die Fehlersuche hervorheben nutzen, um die bearbeiteten Bereiche zu visualisieren.

Kann ich mehrere Regionen in einem Vorgang angeben?

Ja, IronOCR unterstützt mehrere Regionen in einem einzigen OCR-Vorgang. Fügen Sie einfach mehrere Rectangle-Objekte zu Ihrem Array hinzu:

Rectangle[] scanRegions = { 
    new Rectangle(50, 50, 200, 100),    // Header region
    new Rectangle(50, 200, 500, 300),   // Main content region
    new Rectangle(50, 550, 200, 50)     // Footer region
};

Rectangle[] scanRegions = { 
    new Rectangle(50, 50, 200, 100),    // Header region
    new Rectangle(50, 200, 500, 300),   // Main content region
    new Rectangle(50, 550, 200, 50)     // Footer region
};

Imports System.Drawing

Dim scanRegions As Rectangle() = {
    New Rectangle(50, 50, 200, 100),    ' Header region
    New Rectangle(50, 200, 500, 300),   ' Main content region
    New Rectangle(50, 550, 200, 50)     ' Footer region
}

$vbLabelText $csharpLabel

Jede Region wird separat bearbeitet, und die Ergebnisse werden in der angegebenen Reihenfolge kombiniert.

Warum regionsspezifische OCR anstelle von Ganzseitenübersetzung verwenden?

Die regionalspezifische OCR bietet mehrere Vorteile:

Leistung: Die Verarbeitung kleinerer Bereiche ist deutlich schneller
Genauigkeit: Die Fokussierung auf bestimmte Regionen reduziert das Rauschen irrelevanter Inhalte
Struktur: Zuverlässigeres Extrahieren von Daten aus Formularen und Tabellen
Kosteneffizienz: Geringere Bearbeitungszeit bedeutet geringere Rechenkosten

Dieser Ansatz ist besonders wertvoll bei der Arbeit mit strukturierten Dokumenten wie Rechnungen, Formularen oder Berichten, in denen Daten an vorhersehbaren Stellen erscheinen. Bei komplexen Dokumentstrukturen sollten Sie sich über Lesen von Tabellen in Dokumenten informieren, um spezielle Techniken zur Extraktion von Tabellen kennenzulernen.

Welche erweiterten PDF OCR-Funktionen sind verfügbar?

IronOCR bietet zusätzliche Funktionen für die PDF-Verarbeitung, die über die einfache Textextraktion hinausgehen. Sie können durchsuchbare PDFs aus gescannten Dokumenten erstellen, wobei das ursprüngliche Layout erhalten bleibt und eine Textebene zum Suchen und Kopieren hinzugefügt wird. Die Bibliothek unterstützt auch Multithreading für eine schnellere Verarbeitung von großen PDF-Sammlungen.

Für Entwickler, die mit OCR in ihren .NET-Anwendungen beginnen möchten, bieten die einfachen OCR-Beispiele eine solide Grundlage für das Verständnis der Fähigkeiten und bewährten Verfahren von IronOCR.

Behandlung komplexer PDF-Szenarien

Für den Umgang mit anspruchsvollen PDF-Dokumenten bietet IronOCR mehrere erweiterte Funktionen:

Bildvorverarbeitung: Wenden Sie Bildfilter an, um die Textklarheit zu verbessern
Mehrere Sprachen: Verarbeiten Sie Dokumente, die mehrere Sprachen gleichzeitig enthalten
Individuelle Konfigurationen: Passen Sie die OCR-Einstellungen für bestimmte Dokumenttypen an
Exportoptionen: Speichern Sie die Ergebnisse in verschiedenen Formaten, darunter durchsuchbare PDFs und hOCR HTML

Diese Funktionen machen IronOCR zu einer umfassenden Lösung für PDF-Verarbeitungsanforderungen auf Unternehmensebene.

Häufig gestellte Fragen

Wie kann ich in C# Text aus einer PDF-Datei extrahieren?

Sie können mit IronOCR mit nur einer Zeile Code Text aus PDF-Dateien extrahieren. Erstellen Sie einfach eine IronTesseract-Instanz und verwenden Sie die Read-Methode mit OcrPdfInput: `using var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrPdfInput("document.pdf", PdfContents.TextAndImages));`. IronOCR verarbeitet sowohl gescannte PDFs (bildbasiert) als auch durchsuchbare PDFs (textbasiert).

Welche PDF-Versionen werden für die Textextraktion unterstützt?

IronOCR unterstützt alle PDF-Versionen, von älteren PDF 1.0-Spezifikationen bis hin zu den neuesten PDF 2.0-Standards. Die OCR-Engine basiert auf der Tesseract-Technologie und gewährleistet eine genaue Textextraktion, unabhängig von der PDF-Version, mit der Sie arbeiten.

Kann ich nur bestimmte Seiten eines PDF-Dokuments lesen und nicht das gesamte Dokument?

Ja, IronOCR ermöglicht es Ihnen, bestimmte Seiten aus einem PDF-Dokument zu lesen, indem es Seitenindizes bereitstellt. Anstatt das gesamte Dokument zu verarbeiten, können Sie mithilfe des OcrPdfInput-Objekts angeben, aus welchen Seiten der Text extrahiert werden soll, wodurch der OCR-Prozess bei großen Dokumenten effizienter wird.

Wie sieht der minimale Arbeitsablauf für OCR bei einer PDF-Datei aus?

Der minimale Arbeitsablauf mit IronOCR besteht aus 5 Schritten: 1) Herunterladen der C#-Bibliothek, 2) Vorbereiten Ihres PDF-Dokuments, 3) Erstellen eines OcrPdfInput-Objekts mit dem PDF-Dateipfad, 4) Verwenden der Read-Methode zur Durchführung der OCR und 5) Optionales Festlegen von Seitenindizes für das selektive Lesen.

Wann sollte ich die DPI-Einstellungen für PDF OCR anpassen?

Während die Standard-DPI-Einstellungen von IronOCR für die meisten Standard-PDFs gut funktionieren, sollten Sie eine Anpassung der DPI in Betracht ziehen, wenn Sie mit gescannten Dokumenten mit niedriger Auflösung (unter 200 DPI) oder PDFs mit kleinem Text arbeiten. Höhere DPI-Einstellungen in der OcrPdfInput-Konstruktion können die Lesegenauigkeit für spezielle Dokumente erheblich verbessern.

Funktioniert die OCR-Engine sowohl mit gescannten als auch mit durchsuchbaren PDFs?

Ja, IronOCR verarbeitet sowohl gescannte PDFs (bildbasiert) als auch durchsuchbare PDFs (textbasiert) effektiv. Die auf Tesseract basierende Engine verarbeitet automatisch verschiedene PDF-Typen, so dass sie vielseitig einsetzbar ist, um Text aus verschiedenen PDF-Formaten zu extrahieren, ohne dass unterschiedliche Ansätze erforderlich sind.

Kann IronOCR in bestehende Anwendungen integriert werden?

IronOCR ist darauf ausgelegt, leicht in bestehende Anwendungen mithilfe von C# integriert zu werden, sodass Entwickler OCR-Funktionalität mit minimalem Aufwand zu ihrer Software hinzufügen können.

Was sind die Vorteile der Nutzung von IronOCR für das Dokumentenmanagement?

Die Verwendung von IronOCR für das Dokumentenmanagement rationalisiert den Arbeitsablauf, indem gescannte Dokumente in durchsuchbare und bearbeitbare Texte umgewandelt werden, wodurch der Bedarf an manueller Dateneingabe reduziert und die Zugänglichkeit von Dokumenten verbessert wird.

Wie kann IronOCR die Datenqualität verbessern?

IronOCR verbessert die Datenqualität durch seine fortschrittlichen Erkennungsalgorithmen und Bildkorrekturfunktionen, die sicherstellen, dass der Textextraktionsprozess sowohl zuverlässig als auch genau ist.

Gibt es eine kostenlose Testversion von IronOCR?

Ja, Iron Software bietet eine kostenlose Testversion von IronOCR an, die es den Benutzern ermöglicht, die Funktionen und Fähigkeiten zu testen, bevor sie eine Kaufentscheidung treffen.

Curtis Chau

Jetzt mit dem Ingenieurteam chatten

Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Jeffrey T. Fritz

Principal Program Manager - .NET Community Team

Jeff ist außerdem Principal Program Manager für das .NET- und Visual Studio-Team. Er ist der ausführende Produzent der .NET Conf Virtual Conference Series und moderiert ‚Fritz and Friends‘, einen Livestream für Entwickler, der zweimal wöchentlich ausgestrahlt wird. Dort spricht er über Technik und schreibt gemeinsam mit den Zuschauern Code. Jeff schreibt Workshops, Präsentationen und plant Inhalte für die größten Microsoft-Entwicklerveranstaltungen, einschließlich Microsoft Build, Microsoft Ignite, .NET Conf und dem Microsoft MVP Summit.

Bereit anzufangen?

Nuget Downloads 6,151,372 | Version: 2026.7 gerade veröffentlicht

Lizenzen anzeigen

Scrollst du immer noch?

Sie brauchen schnell einen Beweis? PM > Install-Package IronOcr
Führen Sie ein Beispiel aus und beobachten Sie, wie Ihr Bild zu durchsuchbarem Text wird.

Lizenzen anzeigen

Kunden-Highlight:

Entwickler im Rampenlicht:

Webinare:

Starten Sie die kostenlose 30-Tage-Testversion

Auf dieser Seite

Lesen von PDFs in C# mit IronOCR

Installieren Sie IronOCR mit NuGet Package Manager

Kopieren Sie diesen Codeausschnitt und führen Sie ihn aus.

Bereitstellen zum Testen in Ihrer Live-Umgebung

Minimaler Arbeitsablauf (5 Schritte)

Wie kann ich eine ganze PDF-Datei lesen?

Wann sollte ich die DPI-Einstellungen anpassen?

Welche Dateiformate unterstützt IronOCR neben PDF?

Arbeiten mit PDF-Inhaltstypen

Wie lese ich bestimmte Seiten aus einer PDF-Datei?

Warum beginnt die Seitennummerierung bei Null?

Wie kann ich nicht-zusammenhängende Seiten lesen?

Was passiert, wenn ich ungültige Seitenzahlen angebe?

Wie erkenne ich einen bestimmten Bereich einer PDF-Datei mit OCR?

Wie bestimme ich die korrekten Rechteckkoordinaten?

Kann ich mehrere Regionen in einem Vorgang angeben?

Warum regionsspezifische OCR anstelle von Ganzseitenübersetzung verwenden?

Welche erweiterten PDF OCR-Funktionen sind verfügbar?

Behandlung komplexer PDF-Szenarien

Häufig gestellte Fragen

Wie kann ich in C# Text aus einer PDF-Datei extrahieren?

Welche PDF-Versionen werden für die Textextraktion unterstützt?

Kann ich nur bestimmte Seiten eines PDF-Dokuments lesen und nicht das gesamte Dokument?

Wie sieht der minimale Arbeitsablauf für OCR bei einer PDF-Datei aus?

Wann sollte ich die DPI-Einstellungen für PDF OCR anpassen?

Funktioniert die OCR-Engine sowohl mit gescannten als auch mit durchsuchbaren PDFs?

Kann IronOCR in bestehende Anwendungen integriert werden?

Was sind die Vorteile der Nutzung von IronOCR für das Dokumentenmanagement?

Wie kann IronOCR die Datenqualität verbessern?

Gibt es eine kostenlose Testversion von IronOCR?

Scrollst du immer noch?

Ihr Lizenzschlüssel wurde in Ihren Posteingang geliefert

Ihre Demo-Anfrage ist eingegangen.

Iron-Support-Team

Starten Sie die kostenlose 30-Tage-Testversion

Auf dieser Seite

Lesen von PDFs in C# mit IronOCR

Installieren Sie IronOCR mit NuGet Package Manager

Kopieren Sie diesen Codeausschnitt und führen Sie ihn aus.

Bereitstellen zum Testen in Ihrer Live-Umgebung

Minimaler Arbeitsablauf (5 Schritte)

Wie kann ich eine ganze PDF-Datei lesen?

Wann sollte ich die DPI-Einstellungen anpassen?

Welche Dateiformate unterstützt IronOCR neben PDF?

Arbeiten mit PDF-Inhaltstypen

Wie lese ich bestimmte Seiten aus einer PDF-Datei?

Warum beginnt die Seitennummerierung bei Null?

Wie kann ich nicht-zusammenhängende Seiten lesen?

Was passiert, wenn ich ungültige Seitenzahlen angebe?

Wie erkenne ich einen bestimmten Bereich einer PDF-Datei mit OCR?

Wie bestimme ich die korrekten Rechteckkoordinaten?

Kann ich mehrere Regionen in einem Vorgang angeben?

Warum regionsspezifische OCR anstelle von Ganzseitenübersetzung verwenden?

Welche erweiterten PDF OCR-Funktionen sind verfügbar?

Behandlung komplexer PDF-Szenarien

Häufig gestellte Fragen

Wie kann ich in C# Text aus einer PDF-Datei extrahieren?

Welche PDF-Versionen werden für die Textextraktion unterstützt?

Kann ich nur bestimmte Seiten eines PDF-Dokuments lesen und nicht das gesamte Dokument?

Wie sieht der minimale Arbeitsablauf für OCR bei einer PDF-Datei aus?

Wann sollte ich die DPI-Einstellungen für PDF OCR anpassen?

Funktioniert die OCR-Engine sowohl mit gescannten als auch mit durchsuchbaren PDFs?

Kann IronOCR in bestehende Anwendungen integriert werden?

Was sind die Vorteile der Nutzung von IronOCR für das Dokumentenmanagement?

Wie kann IronOCR die Datenqualität verbessern?

Gibt es eine kostenlose Testversion von IronOCR?

Scrollst du immer noch?

Holen Sie sich Ihre KOSTENLOSE

Nächster Schritt: Kostenlosen 30-Tage-Test starten

Thank You

Nächster Schritt: Kostenlosen 30-Tage-Test starten

Möchten Sie IronSuite KOSTENLOS in einem Live-Projekt einsetzen?

DLL-Download

Ihr Lizenzschlüssel wurde in Ihren Posteingang geliefert

Ihre Demo-Anfrage ist eingegangen.

Von Millionen von Ingenieur*innen weltweit vertraut

Iron-Support-Team