Zum Fußzeileninhalt springen
VERWENDUNG VON IRONOCR

Wie man eine Zeichenerkennung in C# erstellt

Die Technologie der optischen Zeichenerkennung (OCR) ermöglicht die Umwandlung von Text in digitale Formate, die von Maschinen lesbar sind. Wenn ein Dokument gescannt wird (wie z.B. eine Rechnung oder Quittung), wird es von Ihrem Computer als Bilddatei gespeichert. Der Text innerhalb des gescannten Bildes kann jedoch nicht bearbeitet, durchsucht oder mit einem regulären Texteditor gezählt werden.

OCR kann das Bild verarbeiten, den Text extrahieren und in ein Textformat umwandeln, das von Computern gelesen werden kann. Dies ermöglicht die Extraktion von Text aus verschiedenen Quellen, einschließlich PDF-Dateien und anderen gescannten Bildern. Darüber hinaus gehen die OCR-Fähigkeiten über die einfache Textextraktion hinaus, indem sie wichtige Bildformate und PDF-Dokumente in durchsuchbare OCR-Daten umwandeln.

In C#, developers can leverage the power of OCR through various libraries, and one of which is the powerful library IronOCR from Iron Software. In diesem Tutorial werden wir die Grundlagen von OCR erkunden und demonstrieren, wie man IronOCR effizient für die Zeichenerkennung in C# verwendet.

Wie man in C# eine Zeichenerkennung erstellt

  1. Erstellen Sie ein brandneues C#-Projekt und benennen Sie das Projekt in Visual Studio.
  2. Installieren Sie die IronOCR .NET-Bibliothek und fügen Sie sie in den Projektordner ein.
  3. Nutzen Sie das IronOCR Tesseract, um Text aus Bildern zu lesen.
  4. Nutzen Sie die erweiterten Funktionen von IronOCR, um den Text in Bildern zu lesen.
  5. Leistungstuning der IronOCR-Leseoperation.

Einstieg mit IronOCR

IronOCR, a C# library developed by Iron Software, bietet fortschrittliche OCR-Fähigkeiten. Es bietet eine genaue Textextraktion aus Bildern, PDFs und gescannten Dokumenten. Bevor wir in den Code eintauchen, stellen Sie sicher, dass IronOCR in Ihrem Projekt installiert ist.

Key features of IronOCR from Iron Software

Verbesserter Tesseract-OCR-Engine

IronOCR hebt die Fähigkeiten der weit verbreiteten Tesseract-OCR-Engine durch Erhöhung der Genauigkeit und Geschwindigkeit hervor. Es dient als robuste Lösung zur Extraktion von Text aus verschiedenen Quellen, einschließlich Bildern, PDFs und verschiedenen Dokumentformaten.

Umfassende Sprachabdeckung

Mit der Unterstützung von über 125 Sprachen ist IronOCR in der Lage, mehrsprachige Anforderungen zu bewältigen und stellt eine ideale Wahl für Anwendungen dar, die sprachliche Vielseitigkeit erfordern.

Vielseitige Ausgabeoptionen

Der extrahierte Text kann bequem als Klartext oder strukturierte Daten ausgegeben werden, um eine nahtlose Integration in weitere Verarbeitungspipelines zu ermöglichen. Außerdem ermöglicht IronOCR die Erstellung durchsuchbarer PDFs direkt aus Bildvorlagen.

Plattformübergreifende Anpassungsfähigkeit

Entwickelt für die Kompatibilität mit C#, F# und VB.NET, funktioniert IronOCR nahtlos in verschiedenen .NET-Umgebungen, einschließlich Versionen 8, 7, 6, Core, Standard und Framework.

Nutzung von Tesseract 5

IronOCR nutzt die Leistung von Tesseract 5, fein abgestimmt für optimale Leistung innerhalb des .NET-Ökosystems.

Zonenbasierte OCR-Fähigkeit

Mit IronOCR können Benutzer spezifische Zonen in Dokumenten genau definieren und so ein gezieltes OCR-Processing ermöglichen. Diese Funktion verbessert die Genauigkeit und Effizienz, indem die Verarbeitungsleistung auf die Bereiche fokussiert wird, wo sie am meisten gebraucht wird.

Bildvorverarbeitungstools

Die Bibliothek bietet eine Vielzahl von Bildvorverarbeitungsfunktionen, wie z.B. das Begradigen und Rauschminderung. Diese Tools sorgen auch bei unvollkommenen Quellbildern für überlegene Ergebnisse und optimieren letztlich das gesamte OCR-Erlebnis.

Jetzt werden wir eine Demo-Anwendung entwickeln, die IronOCR nutzt, um Text aus Bildern zu lesen.

Voraussetzungen

  1. Visual Studio: Stellen Sie sicher, dass Sie Visual Studio oder eine andere C#-Entwicklungsumgebung installiert haben.
  2. NuGet Package Manager: Stellen Sie sicher, dass NuGet vorhanden ist, um Pakete in Ihrem Projekt zu verwalten.

Schritt 1: Erstellen Sie ein neues C#-Projekt in Visual Studio

Um zu beginnen, erstellen wir eine neue Konsolenanwendung in Visual Studio wie unten gezeigt.

Wie man in C# eine Zeichenerkennung erstellt: Abbildung 1 - Erstellen eines brandneuen C#-Projekts in Visual Studio

Geben Sie unten einen Projektnamen und einen Speicherort an.

Wie man in C# eine Zeichenerkennung erstellt: Abbildung 2 - Geben Sie einen Projektnamen und den Speicherort an, an dem Sie speichern möchten.

Wählen Sie die benötigte .NET-Version für das Projekt.

Wie man in C# eine Zeichenerkennung erstellt: Abbildung 3 - Wählen Sie die geeignete .NET-Version für das Projekt.

Klicken Sie auf die Schaltfläche "Erstellen", um das neue Projekt zu erstellen.

Schritt 2: Installieren Sie die IronOCR-Bibliothek und integrieren Sie sie in Ihr Projekt

IronOCR can be found in the NuGet-Paketverwaltungskonsole gefunden werden, wie unten gezeigt. Verwenden Sie den angegebenen Befehl, um das Paket zu installieren.

Wie man in C# eine Zeichenerkennung erstellt: Abbildung 4 - IronOCR NuGet Package Manager Download-Seite

Verwenden Sie den NuGet-Paketmanager in Visual Studio, suchen Sie nach IronOCR und installieren Sie es in Ihrem Projektordner.

Wie man in C# eine Zeichenerkennung erstellt: Abbildung 5 - IronOCR über die Browsetab mit dem NuGet-Paketmanager suchen

Nach der Installation ist die Anwendung bereit, IronOCR zu nutzen, um Text aus Bildern zu lesen.

Schritt 3: Nutzen Sie das IronOCR Tesseract, um Text aus Bildern zu lesen

IronOCR zeichnet sich als die exklusive .NET-Bibliothek aus, die Tesseract 5 OCR-Fähigkeiten bietet. Derzeit hat sie das Privileg, die fortschrittlichste Tesseract 5 Bibliothek über alle Programmiersprachen hinweg zu sein. IronOCR integriert Tesseract 5 nahtlos in verschiedene .NET-Umgebungen, einschließlich Framework, Standard, Core, Xamarin und Mono, und gewährleistet eine umfassende Unterstützung im gesamten Ökosystem.

Betrachten Sie die unten dargestellte Bilddatei als Eingabe. Sehen wir uns nun an, wie der Text in dieser Bilddatei gelesen wird.

Wie man in C# eine Zeichenerkennung erstellt: Abbildung 6 - Beispielinput

using IronOcr;

public class Program
{
    public static void Main(string[] args)
    {
        var ocrTesseract = new IronTesseract();
        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"sample1.png");
        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
}
using IronOcr;

public class Program
{
    public static void Main(string[] args)
    {
        var ocrTesseract = new IronTesseract();
        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"sample1.png");
        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
}
Imports IronOcr

Public Class Program
	Public Shared Sub Main(ByVal args() As String)
		Dim ocrTesseract = New IronTesseract()
		Dim ocrInput As New OcrInput()
		ocrInput.LoadImage("sample1.png")
		Dim ocrResult = ocrTesseract.Read(ocrInput)
		Console.WriteLine(ocrResult.Text)
	End Sub
End Class
$vbLabelText   $csharpLabel

Code-Erklärung

  1. IronTesseract-Instanz: Wir beginnen mit der Erstellung einer IronTesseract-Instanz, um OCR-Operationen durchzuführen.
  2. Laden von Bildern: Wir laden das Beispielbild in das OcrInput-Objekt.
  3. Texterkennung: Der Text im Bild wird gelesen, und das Ergebnis wird in der Konsole ausgegeben.

Ausgabe

Wie man in C# eine Zeichenerkennung erstellt: Abbildung 7 - Extrahierter Text mit IronOCR

Schritt 4: Nutzen Sie die erweiterten Funktionen von IronOCR, um den Text in Bildern zu lesen

Das IronTesseract.Configuration-Objekt bietet fortgeschrittenen Benutzern Zugang zur zugrundeliegenden Tesseract-API innerhalb von C#/.NET und ermöglicht eine detaillierte Einrichtungskonfiguration für Feinabstimmung und Optimierung. Nachfolgend sind einige der möglichen erweiterten Konfigurationen aufgeführt.

Sprachauswahl

Sie können die Sprache für das OCR mit der Sprachproperty festlegen. Zum Beispiel, um die Sprache auf Englisch festzulegen, verwenden Sie:

IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
Dim ocr As New IronTesseract()
ocr.Language = OcrLanguage.English
$vbLabelText   $csharpLabel

Seitensegmentierungsmodus

Der Seitensegmentierungsmodus bestimmt, wie Tesseract das Eingabebild segmentiert. Die Optionen umfassen AutoOsd, SingleBlock, SingleLine und mehr. Zum Beispiel:

ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd;
ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd;
ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd
$vbLabelText   $csharpLabel

Benutzerdefinierte Tesseract-Variablen

Sie können Tesseract feinabstimmen, indem Sie spezifische Variablen festlegen. Zum Beispiel, um die Parallelisierung zu deaktivieren:

ocr.Configuration.TesseractVariables["tessedit_parallelize"] = false;
ocr.Configuration.TesseractVariables["tessedit_parallelize"] = false;
ocr.Configuration.TesseractVariables("tessedit_parallelize") = False
$vbLabelText   $csharpLabel

Whitelisting und Blacklisting von Zeichen

Verwenden Sie WhiteListCharacters und BlackListCharacters, um zu steuern, welche Zeichen Tesseract erkennt. Zum Beispiel:

ocr.Configuration.WhiteListCharacters = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
ocr.Configuration.BlackListCharacters = "`ë|^";
ocr.Configuration.WhiteListCharacters = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
ocr.Configuration.BlackListCharacters = "`ë|^";
ocr.Configuration.WhiteListCharacters = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"
ocr.Configuration.BlackListCharacters = "`ë|^"
$vbLabelText   $csharpLabel

Zusätzliche Konfigurationsvariablen

Erkunden Sie andere Tesseract-Konfigurationsvariablen, um das Verhalten nach Ihren Bedürfnissen anzupassen. PDF-Erstellung und PDF-Generierung werden von iText 7 unterstützt, während die HTML-zu-PDF-Konvertierung von pdfHTML unterstützt wird.

ocr.Configuration.TesseractVariables["classify_num_cp_levels"] = 3;
ocr.Configuration.TesseractVariables["textord_debug_tabfind"] = 0;
// ... (more variables)
ocr.Configuration.TesseractVariables["classify_num_cp_levels"] = 3;
ocr.Configuration.TesseractVariables["textord_debug_tabfind"] = 0;
// ... (more variables)
ocr.Configuration.TesseractVariables("classify_num_cp_levels") = 3
ocr.Configuration.TesseractVariables("textord_debug_tabfind") = 0
' ... (more variables)
$vbLabelText   $csharpLabel

Nun lassen Sie uns versuchen, dasselbe Bild mit erweiterten Einstellungen zu dekodieren

using IronOcr;

public class Program
{
    public static void Main()
    {
        Console.WriteLine("Decoding using advanced features");
        var ocrTesseract = new IronTesseract() // Create instance
        {
            Language = OcrLanguage.EnglishBest, // Configure best English language
            Configuration = new TesseractConfiguration()
            {
                ReadBarCodes = false, // Disable reading barcodes
                BlackListCharacters = "`ë|^", // Blacklisted characters
                WhiteListCharacters = null, // No whitelist, allow all
                PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd,
                TesseractVariables = null, // No custom variables used
            },
            MultiThreaded = false,
        };

        using var ocrInput = new OcrInput(); // Create a disposible ocr input object
        ocrInput.AddImage(@"sample1.png"); // Load the sample image
        var ocrResult = ocrTesseract.Read(ocrInput); // Read the text from the image
        Console.WriteLine(ocrResult.Text); // Output the text
    }
}
using IronOcr;

public class Program
{
    public static void Main()
    {
        Console.WriteLine("Decoding using advanced features");
        var ocrTesseract = new IronTesseract() // Create instance
        {
            Language = OcrLanguage.EnglishBest, // Configure best English language
            Configuration = new TesseractConfiguration()
            {
                ReadBarCodes = false, // Disable reading barcodes
                BlackListCharacters = "`ë|^", // Blacklisted characters
                WhiteListCharacters = null, // No whitelist, allow all
                PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd,
                TesseractVariables = null, // No custom variables used
            },
            MultiThreaded = false,
        };

        using var ocrInput = new OcrInput(); // Create a disposible ocr input object
        ocrInput.AddImage(@"sample1.png"); // Load the sample image
        var ocrResult = ocrTesseract.Read(ocrInput); // Read the text from the image
        Console.WriteLine(ocrResult.Text); // Output the text
    }
}
Imports IronOcr

Public Class Program
	Public Shared Sub Main()
		Console.WriteLine("Decoding using advanced features")
		Dim ocrTesseract = New IronTesseract() With {
			.Language = OcrLanguage.EnglishBest,
			.Configuration = New TesseractConfiguration() With {
				.ReadBarCodes = False,
				.BlackListCharacters = "`ë|^",
				.WhiteListCharacters = Nothing,
				.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd,
				.TesseractVariables = Nothing
			},
			.MultiThreaded = False
		}

		Dim ocrInput As New OcrInput() ' Create a disposible ocr input object
		ocrInput.AddImage("sample1.png") ' Load the sample image
		Dim ocrResult = ocrTesseract.Read(ocrInput) ' Read the text from the image
		Console.WriteLine(ocrResult.Text) ' Output the text
	End Sub
End Class
$vbLabelText   $csharpLabel

Code-Erklärung

  1. IronOCR-Konfiguration: Eine Instanz von IronTesseract (der Hauptklasse von IronOCR) wird erstellt und der Variable ocrTesseract zugewiesen.

    Konfigurationseinstellungen werden auf ocrTesseract angewendet:

    • Sprache: Legt die Sprache für das OCR fest (in diesem Fall Englisch).
    • Konfiguration: Ein TesseractConfiguration-Objekt, das weitere Anpassungen ermöglicht:
      • ReadBarCodes: Deaktiviert das Lesen von Barcodes.
      • BlackListCharacters: Gibt die Zeichen an, die auf die schwarze Liste gesetzt werden sollen (Zeichen, die nicht erkannt werden sollen).
      • WhiteListCharacters: Keine Whitelist festgelegt, alle Zeichen sind erlaubt.
      • PageSegmentationMode: Legt den Modus zur Seitensegmentierung auf "AutoOsd" fest.
      • TesseractVariables: Es wurden keine benutzerdefinierten Variablen verwendet.
    • MultiThreaded: Deaktiviert das Multithreading.
  2. OCR-Eingang und Bildladen: Ein using-Block erstellt ein entfernbares ocrInput-Objekt vom Typ OcrInput. Die Bilddatei "sample1.png" wird zu ocrInput hinzugefügt.
  3. Textextraktion: Die Read-Methode wird auf ocrTesseract aufgerufen und ocrInput übergeben. Das Ergebnis wird in der ocrResult-Variable gespeichert.
  4. Ausgabe: Der extrahierte Text wird mit Console.WriteLine(ocrResult.Text) in der Konsole ausgegeben.

Ausgabe

Wie man in C# eine Zeichenerkennung erstellt: Abbildung 8 - Extrahierter Text mit IronOCR

Schritt 5: Leistungstuning der IronOCR-Leseoperation.

Bei der Arbeit mit IronOCR stehen Ihnen verschiedene Bildfilter zur Verfügung, die bei der Vorverarbeitung von Bildern vor dem OCR-Einsatz helfen können. Diese Filter optimieren die Bildqualität, verbessern die Sichtbarkeit und reduzieren das Rauschen oder Artefakte. Sie helfen, die Leistung der OCR-Operation zu verbessern.

  1. Drehen:

    Der Rotationsfilter ermöglicht es Ihnen, Bilder um eine bestimmte Anzahl von Grad im Uhrzeigersinn zu drehen. Für eine Drehung gegen den Uhrzeigersinn verwenden Sie negative Zahlen.

  2. Begradigen:

    Der Begradigungsfilter korrigiert die Schräglage des Bildes und stellt sicher, dass der Text aufrecht und orthogonal ist. Dies ist besonders nützlich für OCR, da Tesseract am besten mit korrekt ausgerichteten Scans arbeitet.

  3. Skalieren:

    Der Skalierungsfilter skaliert OCR-Eingabeseiten proportional.

  4. Binarisieren:

    Der Binärisierungsfilter konvertiert jeden Pixel entweder in Schwarz oder Weiß, ohne einen Mittelwert. Er kann die OCR-Leistung in Fällen sehr schwachen Kontrasts zwischen Text und Hintergrund verbessern.

  5. In Graustufen konvertieren:

    Der Filter "In Graustufen konvertieren" wandelt jeden Pixel in einen Graustufenbereich um. Auch wenn dies die OCR-Genauigkeit vermutlich nicht signifikant verbessert, kann es die Geschwindigkeit erhöhen.

  6. Invertieren:

    Der Invertierungsfilter kehrt Farben um - Weiß wird zu Schwarz, und Schwarz wird zu Weiß.

  7. Farbe ersetzen:

    Der Farbwechsel-Filter ersetzt eine bestimmte Farbe in einem Bild durch eine andere Farbe unter Berücksichtigung eines gewissen Schwellenwerts.

  8. Kontrast:

    Der Kontrastfilter erhöht automatisch den Kontrast. Er verbessert oft die OCR-Geschwindigkeit und Genauigkeit bei scans mit geringem Kontrast.

  9. Erweitern und Erodieren:

    Diese erweiterten Morphologie-Filter manipulieren die Objektgrenzen in einem Bild.

    • Das Erweitern fügt den Objektgrenzen Pixel hinzu.
    • Das Erodieren entfernt Pixel von den Objektgrenzen.
  10. Schärfen:

    Der Schärfefilter schärft verschwommene OCR-Dokumente und ebnet Alphakanäle zu Weiß aus.

  11. Rauschunterdrückung:

    Der Rauschunterdrückungsfilter entfernt digitales Rauschen. Verwenden Sie ihn, wenn mit Rauschen zu rechnen ist.

  12. Starke Hintergrundrauschunterdrückung:

    Dieser schwere Filter zur Hintergrundrauschunterdrückung sollte nur verwendet werden, wenn starker Dokumenthintergrundrausch bekannt ist. Es kann die OCR-Genauigkeit bei sauberen Dokumenten reduzieren und ist CPU-intensiv.

  13. Auflösung verbessern:

    Der Auflösungsverbesserungsfilter verbessert die Auflösung von Bildern minderer Qualität. Er wird aufgrund der automatischen Auflösungsbehandlung selten benötigt.

Hier ist ein Beispiel dafür, wie Filter mit IronOCR in C# angewendet werden können:

var ocr = new IronTesseract();
var input = new OcrInput();
input.LoadImage("sample.png");
input.Deskew();
var result = ocr.Read(input);
Console.WriteLine(result.Text);
var ocr = new IronTesseract();
var input = new OcrInput();
input.LoadImage("sample.png");
input.Deskew();
var result = ocr.Read(input);
Console.WriteLine(result.Text);
Dim ocr = New IronTesseract()
Dim input = New OcrInput()
input.LoadImage("sample.png")
input.Deskew()
Dim result = ocr.Read(input)
Console.WriteLine(result.Text)
$vbLabelText   $csharpLabel

Häufige OCR-Anwendungen

  1. Dokumentendigitalisierung: OCR wird häufig verwendet, um gescannte Papierdokumente wie Rechnungen, Quittungen, Formulare und Verträge in digitale Formate umzuwandeln. Dieser Digitalisierungsprozess optimiert die Dokumentenlagerung, -abfrage und -verwaltung, reduziert Papieransammlungen und verbessert die Effizienz.
  2. Datenextraktion: OCR ermöglicht die Extraktion von Text und Daten aus gescannten Dokumenten, Bildern und PDFs. Diese extrahierten Daten können für die automatisierte Dateneingabe, Inhaltsanalyse, Indizierung und die Integration in Datenbanken oder Geschäftssysteme verwendet werden.
  3. Texterkennung in Bildern: Die OCR-Technologie ermöglicht die Textextraktion aus gedruckten Dokumenten und Bildern zu Indizierungs- und Suchzwecken. Diese Fähigkeit wird in verschiedenen Anwendungen eingesetzt, darunter erweiterte Realität, bildbasierte Suchmaschinen und Übersetzungsdienste.
  4. Automatische Nummernschilderkennung (ALPR): ALPR-Systeme nutzen OCR, um Nummernschilder aus Bildern oder Videostreams zu lesen, die von Kameras in Verkehrskontrollen, Parkplatzmanagement, Mauterhebung und Strafverfolgungsanwendungen erfasst werden.
  5. Barrierefreie Lösungen: OCR spielt eine entscheidende Rolle bei der Erstellung von zugänglichen Inhalten für Personen mit Sehbehinderungen. Indem Texte aus Bildern oder Dokumenten in Sprache oder Brailleschrift umgewandelt werden, hilft OCR, Informationen für Menschen mit Behinderungen zugänglich zu machen.
  6. Identitätsverifizierung: OCR-Technologie wird in Identitätsverifizierungsprozessen eingesetzt, beispielsweise beim Scannen und Verarbeiten von Ausweisdokumenten wie Pässen, Führerscheinen und Ausweisen. Sie hilft bei der Verifizierung der Echtheit von Dokumenten und bei der Extraktion relevanter Informationen für die Identitätsüberprüfung.
  7. Bankwesen und Finanzen: OCR wird im Bankwesen und in der Finanzbranche bei Aufgaben wie dem Lesen von Schecks, der Bearbeitung von Rechnungen, der Umwandlung bestehender PDF-Dokumente, der Extraktion von Daten aus Finanzberichten und der Automatisierung dokumentenbasierter Arbeitsabläufe verwendet, um die Genauigkeit und Effizienz in Finanzoperationen zu verbessern.
  8. Automatische Übersetzung: OCR-Technologie wird in Übersetzungswerkzeuge und Sprachlern-Apps integriert, um gedruckte Texte von einer Sprache in eine andere zu konvertieren. Benutzer können Text mit ihren Geräten erfassen, und OCR hilft dabei, ihn in Echtzeit in die gewünschte Sprache zu übersetzen.
  9. Archivierung und Bewahrung historischer Dokumente: OCR wird zur Digitalisierung von Archivmaterialien und historischen Dokumenten verwendet, um sie in digitalen Formaten für zukünftigen Zugang, Forschung und Analyse zu bewahren und gleichzeitig das wertvolle kulturelle Erbe zu erhalten.

Lizenzanforderungen

IronOCR. Geben Sie die untenstehenden Details an, um den Schlüssel an Ihre E-Mail-Adresse zu erhalten.

Wie man in C# eine Zeichenerkennung erstellt: Abbildung 9 - IronPDF-Testlizenzseite

Sobald der Schlüssel entweder durch Kauf oder kostenloses Testabonnement erhalten wurde, befolgen Sie die unten stehenden Schritte, um den Schlüssel zu verwenden.

Ihren Lizenzschlüssel festlegen: Setzen Sie Ihren IronOCR-Lizenzschlüssel mit dem Code. Fügen Sie die folgende Zeile zum Start Ihrer Anwendung hinzu (bevor Sie IronOCR verwenden):

IronOcr.License.LicenseKey = "IRONOCR-MYLICENSE-KEY-1EF01";
IronOcr.License.LicenseKey = "IRONOCR-MYLICENSE-KEY-1EF01";
IronOcr.License.LicenseKey = "IRONOCR-MYLICENSE-KEY-1EF01"
$vbLabelText   $csharpLabel

Globaler Anwendungsschlüssel (Web.Config oder App.Config): Um einen Schlüssel global in Ihrer Anwendung anzuwenden, verwenden Sie die Konfigurationsdatei (Web.Config oder App.Config). Fügen Sie den folgenden Schlüssel zu Ihren appSettings hinzu:

<configuration>
    <!-- Other settings -->
    <appSettings>
        <add key="IronOcr.LicenseKey" value="IRONOCR-MYLICENSE-KEY-1EF01"/>
    </appSettings>
</configuration>
<configuration>
    <!-- Other settings -->
    <appSettings>
        <add key="IronOcr.LicenseKey" value="IRONOCR-MYLICENSE-KEY-1EF01"/>
    </appSettings>
</configuration>
XML

Verwendung von .NET Core appsettings.json: Für .NET Core-Anwendungen erstellen Sie eine appsettings.json-Datei im Stammverzeichnis Ihres Projekts. Ersetzen Sie den "IronOcr.LicenseKey"-Schlüssel mit Ihrem Lizenzwert:

{
    "IronOcr.LicenseKey": "IRONOCR-MYLICENSE-KEY-1EF01"
}

Testen Sie Ihren Lizenzschlüssel: Verifizieren Sie, dass Ihr Schlüssel korrekt installiert wurde, indem Sie ihn testen:

bool result = IronOcr.License.IsValidLicense("IRONOCR-MYLICENSE-KEY-1EF01");
bool result = IronOcr.License.IsValidLicense("IRONOCR-MYLICENSE-KEY-1EF01");
Dim result As Boolean = IronOcr.License.IsValidLicense("IRONOCR-MYLICENSE-KEY-1EF01")
$vbLabelText   $csharpLabel

Abschluss

Zusammenfassend bietet IronOCR eine robuste Lösung für OCR, beginnend bei $799. Nutzen Sie die Leistungsfähigkeit von OCR mit IronOCR und erschließen Sie neue Möglichkeiten in Ihren C#-Projekten.

Häufig gestellte Fragen

Wie kann ich die Zeichenerkennung in C# durchführen?

Um die Zeichenerkennung in C# durchzuführen, können Sie IronOCR verwenden. Beginnen Sie mit der Erstellung eines neuen C#-Projekts in Visual Studio und installieren Sie dann die IronOCR .NET-Bibliothek über den NuGet-Paketmanager. Verwenden Sie die Klassen und Methoden von IronOCR, um Text aus Bildern, PDFs oder gescannten Dokumenten zu extrahieren.

Was sind die Vorteile der Verwendung von IronOCR zur Textextraktion?

IronOCR verbessert die Textextraktion, indem es die Genauigkeit und Geschwindigkeit der Tesseract-OCR-Engine verbessert. Es unterstützt über 125 Sprachen, bietet zonenbasierte OCR-Fähigkeiten und stellt Bildvorverarbeitungswerkzeuge zur Verfügung, um OCR-Ergebnisse zu optimieren.

Wie optimiere ich die OCR-Genauigkeit mit IronOCR?

Um die OCR-Genauigkeit mit IronOCR zu optimieren, verwenden Sie Bildvorverarbeitungswerkzeuge wie Drehen, Entzerren und Kontrastanpassung. Sie können auch die Konfiguration mit Sprachwahl, Seitensegmentierung und Zeichen-Whitelisting oder -Blacklisting feinabstimmen.

Was sind häufige Anwendungen für OCR-Technologie?

OCR-Technologie wird häufig zur Dokumentendigitalisierung, Datenextraktion, Texterkennung in Bildern, automatisierten Kennzeichenerkennung und für Barrierefreiheitlösungen eingesetzt. Es spielt auch eine Rolle im Bankwesen, der Identitätsüberprüfung und der Archivdokumentenbewahrung.

Welche Umgebungen können IronOCR unterstützen?

IronOCR ist mit verschiedenen .NET-Umgebungen kompatibel, einschließlich C#, F# und VB.NET. Es unterstützt .NET Versionen 8, 7, 6, Core, Standard und Framework und ist somit vielseitig für zahlreiche Entwicklungsumgebungen geeignet.

Wie gehe ich bei der Lizenzierung von IronOCR vor?

Um die Lizenzierung von IronOCR zu handhaben, geben Sie Ihren Lizenzschlüssel über die IronOcr.License.LicenseKey-Eigenschaft in Ihrem Anwendungsstart an. Alternativ können Sie es global in Ihrer Web.Config oder App.Config-Datei oder in der appsettings.json für .NET Core-Anwendungen konfigurieren.

Welche fortgeschrittenen Funktionen bietet IronOCR?

IronOCR bietet fortgeschrittene Funktionen wie Sprachwahl, Seitensegmentierungsmodus, benutzerdefinierte Tesseract-Variablen und Zeichen-Whitelisting oder -Blacklisting. Diese Funktionen ermöglichen eine detaillierte Anpassung und Optimierung von OCR-Vorgängen.

Kann ich IronOCR für zonenbasierte OCR verwenden?

Ja, IronOCR unterstützt zonenbasierte OCR, wodurch Sie bestimmte Bereiche eines Bildes oder Dokuments zur Textextraktion angeben können. Diese Funktion ist nützlich für die gezielte Datenextraktion aus komplexen Layouts.

Wie kann ich OCR in mein C#-Projekt integrieren?

Um OCR in Ihr C#-Projekt zu integrieren, installieren Sie die IronOCR-Bibliothek von NuGet und referenzieren Sie sie in Ihrem Projekt. Nutzen Sie die Methoden der Bibliothek, um OCR-Funktionalität zu implementieren, sodass Ihre Anwendung Bilder und gescannte Dokumente verarbeiten kann.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen