PDF OCR Textextraktion

VB C#

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

using var ocrInput = new OcrInput();

// OCR entire document
ocrInput.LoadPdf("example.pdf", Password: "password");

int[] pages = { 1, 2, 3, 4, 5 };

// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");

var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);

Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()

Private ocrInput = New OcrInput()

' OCR entire document
ocrInput.LoadPdf("example.pdf", Password:= "password")

Dim pages() As Integer = { 1, 2, 3, 4, 5 }

' Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")

Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)

Install-Package IronOcr

PDF OCR Textextraktion

Iron Tesseract kann viele Bildformate und auch PDF-Dokumente lesen. Diese Funktion ist mit herkömmlichen kostenlosen Tesseract-Engines nicht möglich.

OcrInput bietet die Möglichkeit, PDF-Merkmale automatisch zu korrigieren, wenn Scans von schlechter Qualität sind.

Entwickler können angeben, ob ein ganzes PDF, eine Auswahl von Seiten oder ein bestimmter Ausschnitt gelesen werden soll.

OCR von PDF-Dateien in C#

Herunterladen einer C#-Bibliothek zur OCR von PDF-Dateien
Verwenden Sie die Methode AddPdf, um ein PDF-Dokument hinzuzufügen
Hinzufügen bestimmter Seiten eines PDF-Dokuments mit der Methode AddPdfPages
Verwenden Sie die Lesen-Methode, um OCR für hinzugefügte PDF-Dateien durchzuführen
Zeigen Sie alle QR-Code-Werte in der Barcodes-Eigenschaft an. Zugriff auf die Text-Eigenschaft, um das OCR-Ergebnis abzurufen

C# PDF OCR

Viele OCR-Tools funktionieren bei optimalen Bedingungen gut, aber wenn Sie etwas brauchen, das den Job mit verbesserter Stabilität und Genauigkeit unter allen Bedingungen erledigt, ist die IronOCR-Textextraktionslösung das, was Sie benötigen.

IronOCR für die Textextraktion wurde von Grund auf neu gebaut und mit der Fähigkeit, reale Bilder mit 99-prozentiger Genauigkeit umzuwandeln.

IronTesseract, unsere native C# OCR-Bibliothek, kann Zeichen nahezu menschlich aus realen Bildern erkennen, die nicht immer von guter Qualität und manchmal schief sind.

Unser OCR erlaubt es, dass PDF- oder Bildeigenschaften automatisch korrigiert werden, wenn Scans von schlechter Qualität sind.

Während ich Sie durch die beste verfügbare OCR-Lösung führe, können Sie sich selbst davon überzeugen.

Warum IronOCR für die OCR-Textextraktion von Bildern oder PDFs?

Die Wahl der IronOCR-Lösung für das Tesseract-Management ist die offensichtliche Wahl, wenn wir seine einzigartigen Fähigkeiten betrachten, die folgende umfassen:

Der IronOCR für die PDF-OCR-Textextraktionsengine funktioniert sofort in purem .NET
Es ist nicht erforderlich, Tesseract auf Ihrem Computer zu installieren.
Es funktioniert hervorragend mit den neuesten Engines: Tesseract 5 (sowie Tesseract 4 & 3).
Es ist für jedes .NET-Projekt verfügbar: .NET Framework 4.5 +, .NET Standard 2 + und .NET Core 2, 3 & 5!
Es hat eine verbesserte Genauigkeit und Geschwindigkeit im Vergleich zu anderen Open-Source-Tesseracts.
IronOCR unterstützt die Entwicklungsplattformen Xamarin, Mono, Azure und Docker.
Sie können komplexe Tesseract-Wörbuchsysteme mit NuGet-Paketen verwalten.
Es kann Text von PDFs, MultiFrame-Tiffs und allen wichtigen Bilddateien ohne zusätzliche Anpassungen extrahieren.
Es kann minderwertige und schiefe Bildscans korrigieren, um die besten Ergebnisse aus Ihrem Textextraktionsprojekt zu erzielen.

Haben Sie minderwertige Scans? Kein Problem!

IronOCR sticht bei OCR-Aufgaben auf einem höheren Niveau hervor. In der Realität sind viele ähnliche Produkte darauf ausgelegt, gut mit maschinengedruckten, hochauflösenden und perfekten Texten oder Bildern zu arbeiten, und deshalb werden sie in realen Anwendungen ungenau oder scheitern. Dies ist jedoch bei IronOCR nicht der Fall.

IronOCR glänzt bei der Korrektur von unvollkommenen Dokumenten. Es kann ein schief gescanntes Bild begradigen und minderwertige Fotos so verbessern, dass sie zu durchsuchbaren PDF-Dokumenten oder Bildern werden. Das ist es, was unser Produkt von anderen abhebt.

IronOCR-Leistung an Ihren Workflow anpassen

Mit der OCR-Lösung von Iron Software können Sie die Leistung Ihrer Textextraktionsaufgaben so anpassen, dass sie das richtige Gleichgewicht für Ihren Workflow schaffen. Wir wissen, dass dies für viele Benutzer und Entwickler sehr wichtig ist, deshalb haben wir unsere OCR-Lösung leistungsanpassbar und flexibel gemacht.

Ein sehr wichtiger Faktor, der die Geschwindigkeit eines OCR-Jobs beeinflusst, ist beispielsweise die Qualität des Eingabebildes. Wenn es weniger Hintergrundrauschen gibt und das Bild eine höhere DPI (200 DPI ist ein guter Bereich) hat, desto schneller sind die Ergebnisse und desto genauer die OCR-Ergebnisse. Mit der IronOCR-Leistungsabstimmungsfunktion können jedoch sogar Aufgaben mit minderwertigen Bildern schnell abgeschlossen werden.

Zudem kann die Auswahl von Eingabebildern oder gescannten Textformaten mit weniger digitalem Rauschen, wie PNG oder TIFF, auch schnellere Ergebnisse liefern als minderwertige Bildformate wie JPEG.

Die Installation der IronOCR-Lösung ist ein Kinderspiel

Das Iron Software-Paket ist sehr einfach zu installieren und auszuführen. Es ist für die beliebtesten Entwicklungsplattformen verfügbar. Unsere Lösung bietet plattformübergreifende Unterstützung, einschließlich Windows, Linux, macOS, Azure, AWS und Docker – es gibt einen Grund, warum C# es zur bevorzugten Tesseract-OCR-Engine unter Entwicklern macht.

Unterstützung für über 125 internationale Sprachen

Für OCR-Aufgaben wird eine bestimmte Software nützlicher, wenn sie mehrere Sprachen unterstützt. Die IronOCR-Lösung macht sich unverzichtbar, weil sie 125 internationale Sprachen unterstützt. Diese Sprachen können über Sprachpakete installiert werden, die als DLL-Dateien verteilt werden. Sie können von dieser Website oder dem NuGet Package Manager für Visual Studio heruntergeladen werden.

Wie man OCR-Sprachpakete installiert

Es werden einhundertzwanzig Sprachen unterstützt. Sie können zusätzliche OCR-Sprachpakete auf zwei Wegen herunterladen:

Installieren Sie das NuGet-Paket

Suchen Sie auf NuGet nach IronOCR Sprachen.

Verwendung der OCR-Datenmethode

Laden Sie die ocrdata Datei herunter und fügen Sie sie Ihrem .NET-Projekt oder Programmdateien hinzu.

Erstellen Sie ganz einfach durchsuchbare Dokumente aus Ihren gescannten Dateien oder Bildern

Ein Merkmal, auf das wir sehr stolz sind, ist die Fähigkeit unserer Tesseract-Software, ein durchsuchbares PDF-Dokument oder durchsuchbaren Text aus Eingabebildern oder einer gescannten PDF-Datei zu erstellen. Sie können Ihr OCR-Ergebnis als PDF exportieren, das in C# und VB.NET ein durchsuchbares PDF-Dokument sein wird. Dies kann Unternehmen und Regierungen bei der Datenbankabwicklung, SEO und PDFs wirklich helfen.

Nutzen Sie die Kraft des besten OCR-Tools

IronOCR ist das beste Werkzeug seiner Klasse, um Text aus Bildern und Dokumenten zu extrahieren. Es kommt mit einer Reihe von Funktionen, Funktionalitäten und Lösungen, die Ihnen ein angenehmes und reibungsloses Erlebnis bei der Durchführung von OCR-Aufgaben bieten.

Unsere OCR Tesseract C#-Bibliotheken können Ihnen helfen, Text aus Bildern und gescannten Dokumenten in Entwicklungsumgebungen wie C# und .NET-Anwendungen zu extrahieren.

Mit IronOCR können Sie sogar passwortgeschützte PDF-Dokumente problemlos öffnen und Text nahtlos extrahieren.

Es hat auch folgende Eigenschaften:

Keine ausführbaren Dateien oder C++-Code erforderlich
Vollständige PDF-OCR-Unterstützung
Kompatibel mit MVC, Web-App, Desktop, Konsole und Serveranwendungen
Umfassende .NET Core-, Standard- und Framework-Unterstützung
Lesen mit C# & VB .NET
Liest QR- und Barcodes
Exportiert OCR nach XHTML oder in ein durchsuchbares PDF-Dokument
Unterstützt Multithreading
Extrahiert Bilder, Koordinaten, Statistiken, Schriften und vieles mehr

Den mutigen Schritt in Richtung IronOCR machen

Angesichts der Funktionen dieser unglaublichen OCR-Lösung können Sie nichts falsch machen, wenn Sie sich entscheiden, IronOCR auszuprobieren.

Die Nutzung unserer Software ist nur ein paar Klicks entfernt. Beginnen Sie mit der Installation von IronOCR – es ist ganz einfach. Darüber hinaus gibt es unglaublich hilfreiche und detaillierte Schritt-für-Schritt-Anleitungen zur Nutzung unserer Tools und How-Tos, ganz zu schweigen von unserem Ressourcenstarken Supportzentrum, das Anfragen so schnell wie möglich (fast sofort) beantwortet.

Zögern Sie nicht – wählen Sie heute IronOCR. Es ist der erste und wichtigste Schritt, um zu lernen, wie man PDF-Dateien in C# liest.

Falls noch Zweifel bestehen, ist unser kostenloser Testlizenzschlüssel perfekt für Sie. Er kann Ihnen helfen, das volle Potenzial der neuesten Version von IronOCR ohne finanzielle Bedingungen zu erkunden. Er kann Ihnen helfen, zu entscheiden, welche Softwarelizenz die richtige für Sie ist. Wenn Sie sich nicht sicher sind, zögern Sie bitte nicht, sich unabhängig von Ihrem Standort an unser Expertenteam zu wenden.

Lernen Sie, durchsuchbare PDFs mit IronOCR zu erstellen

Bereit anzufangen?

Nuget Downloads 6,151,372 | Version: 2026.7 gerade veröffentlicht

Lizenzen anzeigen

Scrollst du immer noch?

Sie brauchen schnell einen Beweis? PM > Install-Package IronOcr
Führen Sie ein Beispiel aus und beobachten Sie, wie Ihr Bild zu durchsuchbarem Text wird.