Wie man eine Zeichenerkennung in C# erstellt
Die Technologie der optischen Zeichenerkennung (OCR) ermöglicht die Umwandlung von Text in digitale Formate, die von Maschinen lesbar sind. Wenn ein Dokument gescannt wird (wie z.B. eine Rechnung oder Quittung), wird es von Ihrem Computer als Bilddatei gespeichert. Der Text innerhalb des gescannten Bildes kann jedoch nicht bearbeitet, durchsucht oder mit einem regulären Texteditor gezählt werden.
OCR kann das Bild verarbeiten, den Text extrahieren und in ein Textformat umwandeln, das von Computern gelesen werden kann. Dies ermöglicht die Extraktion von Text aus verschiedenen Quellen, einschließlich PDF-Dateien und anderen gescannten Bildern. Darüber hinaus gehen die OCR-Fähigkeiten über die einfache Textextraktion hinaus, indem sie wichtige Bildformate und PDF-Dokumente in durchsuchbare OCR-Daten umwandeln.
In C# können Entwickler die Leistungsfähigkeit von OCR durch verschiedene Bibliotheken nutzen, eine davon ist die leistungsstarke Bibliothek IronOCR von Iron Software. In diesem Tutorial werden wir die Grundlagen von OCR erkunden und demonstrieren, wie man IronOCR effizient für die Zeichenerkennung in C# verwendet.
How to create Character Recognition in C
- Erstellen Sie ein brandneues C#-Projekt und benennen Sie das Projekt in Visual Studio.
- Installieren Sie die IronOCR .NET-Bibliothek und fügen Sie sie in den Projektordner ein.
- Nutzen Sie das IronOCR Tesseract, um Text aus Bildern zu lesen.
- Nutzen Sie die erweiterten Funktionen von IronOCR, um den Text in Bildern zu lesen.
- Leistungstuning der IronOCR-Leseoperation.
Einstieg mit IronOCR
IronOCR, eine C#-Bibliothek, entwickelt von Iron Software, bietet fortschrittliche OCR-Fähigkeiten. Es bietet eine genaue Textextraktion aus Bildern, PDFs und gescannten Dokumenten. Bevor wir in den Code eintauchen, stellen Sie sicher, dass IronOCR in Ihrem Projekt installiert ist.
Hauptmerkmale von IronOCR von Iron Software
Verbesserter Tesseract-OCR-Engine
IronOCR hebt die Fähigkeiten der weit verbreiteten Tesseract-OCR-Engine durch Erhöhung der Genauigkeit und Geschwindigkeit hervor. Es dient als robuste Lösung zur Extraktion von Text aus verschiedenen Quellen, einschließlich Bildern, PDFs und verschiedenen Dokumentformaten.
Umfassende Sprachabdeckung
Mit der Unterstützung von über 125 Sprachen ist IronOCR in der Lage, mehrsprachige Anforderungen zu bewältigen und stellt eine ideale Wahl für Anwendungen dar, die sprachliche Vielseitigkeit erfordern.
Vielseitige Ausgabeoptionen
Der extrahierte Text kann bequem als Klartext oder strukturierte Daten ausgegeben werden, um eine nahtlose Integration in weitere Verarbeitungspipelines zu ermöglichen. Außerdem ermöglicht IronOCR die Erstellung durchsuchbarer PDFs direkt aus Bildvorlagen.
Plattformübergreifende Anpassungsfähigkeit
Entwickelt für die Kompatibilität mit C#, F# und VB.NET, funktioniert IronOCR nahtlos in verschiedenen .NET-Umgebungen, einschließlich Versionen 8, 7, 6, Core, Standard und Framework.
Nutzung von Tesseract 5
IronOCR nutzt die Leistung von Tesseract 5, fein abgestimmt für optimale Leistung innerhalb des .NET-Ökosystems.
Zonenbasierte OCR-Fähigkeit
Mit IronOCR können Benutzer spezifische Zonen in Dokumenten genau definieren und so ein gezieltes OCR-Processing ermöglichen. Diese Funktion verbessert Genauigkeit und Effizienz, indem sie die Verarbeitungsleistung gezielt einsetzt.
Bildvorverarbeitungstools
Die Bibliothek bietet eine Vielzahl von Bildvorverarbeitungsfunktionen, wie z.B. das Begradigen und Rauschminderung. Diese Tools sorgen auch bei unvollkommenen Quellbildern für überlegene Ergebnisse und optimieren letztlich das gesamte OCR-Erlebnis.
Jetzt werden wir eine Demo-Anwendung entwickeln, die IronOCR nutzt, um Text aus Bildern zu lesen.
Voraussetzungen
- Visual Studio: Stellen Sie sicher, dass Sie Visual Studio oder eine andere C#-Entwicklungsumgebung installiert haben.
- NuGet Package Manager: Stellen Sie sicher, dass NuGet vorhanden ist, um Pakete in Ihrem Projekt zu verwalten.
Schritt 1: Erstellen Sie ein neues C#-Projekt in Visual Studio
Um zu beginnen, erstellen wir eine neue Konsolenanwendung in Visual Studio wie unten gezeigt.

Geben Sie unten einen Projektnamen und einen Speicherort an.

Wählen Sie die benötigte .NET-Version für das Projekt.

Klicken Sie auf "Erstellen", um das Projekt zu erstellen.
Schritt 2: Installieren Sie die IronOCR-Bibliothek und integrieren Sie sie in Ihr Projekt
IronOCR kann in der NuGet-Paketverwaltungskonsole gefunden werden, wie unten gezeigt. Verwenden Sie den angegebenen Befehl, um das Paket zu installieren.

Verwenden Sie den NuGet-Paketmanager in Visual Studio, suchen Sie nach IronOCR und installieren Sie es in Ihrem Projektordner.

Nach der Installation ist die Anwendung bereit, IronOCR zu nutzen, um Text aus Bildern zu lesen.
Schritt 3: Nutzen Sie das IronOCR Tesseract, um Text aus Bildern zu lesen
IronOCR zeichnet sich als die exklusive .NET-Bibliothek aus, die Tesseract 5 OCR-Fähigkeiten bietet. Derzeit hat sie das Privileg, die fortschrittlichste Tesseract 5 Bibliothek über alle Programmiersprachen hinweg zu sein. IronOCR integriert Tesseract 5 nahtlos in verschiedene .NET-Umgebungen, einschließlich Framework, Standard, Core, Xamarin und Mono, und gewährleistet eine umfassende Unterstützung im gesamten Ökosystem.
Betrachten Sie die unten angegebene Bilddatei als Eingabe. Sehen wir uns nun an, wie der Text in dieser Bilddatei gelesen wird.

using IronOcr;
public class Program
{
public static void Main(string[] args)
{
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"sample1.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
}
using IronOcr;
public class Program
{
public static void Main(string[] args)
{
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"sample1.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
}
Imports IronOcr
Public Class Program
Public Shared Sub Main(ByVal args() As String)
Dim ocrTesseract = New IronTesseract()
Dim ocrInput As New OcrInput()
ocrInput.LoadImage("sample1.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
End Sub
End Class
Code-Erklärung
- IronTesseract-Instanz: Wir beginnen mit der Erstellung einer IronTesseract-Instanz, um OCR-Operationen durchzuführen.
- Laden von Bildern: Wir laden das Beispielbild in das OcrInput-Objekt.
- Texterkennung: Der Text im Bild wird gelesen, und das Ergebnis wird in der Konsole ausgegeben.
Ausgabe

Schritt 4: Nutzen Sie die erweiterten Funktionen von IronOCR, um den Text in Bildern zu lesen
Das IronTesseract.Configuration-Objekt bietet fortgeschrittenen Benutzern Zugang zur zugrundeliegenden Tesseract-API innerhalb von C#/.NET und ermöglicht eine detaillierte Einrichtungskonfiguration für Feinabstimmung und Optimierung. Nachfolgend sind einige der möglichen erweiterten Konfigurationen aufgeführt.
Sprachauswahl
Sie können die Sprache für das OCR mit der Sprachproperty festlegen. Zum Beispiel, um die Sprache auf Englisch festzulegen, verwenden Sie:
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
Dim ocr As New IronTesseract()
ocr.Language = OcrLanguage.English
Seitensegmentierungsmodus
Der Seitensegmentierungsmodus bestimmt, wie Tesseract das Eingabebild segmentiert. Die Optionen umfassen AutoOsd, SingleBlock, SingleLine und mehr. Zum Beispiel:
ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd;
ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd;
ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd
Benutzerdefinierte Tesseract-Variablen
Sie können Tesseract feinabstimmen, indem Sie spezifische Variablen festlegen. Zum Beispiel, um die Parallelisierung zu deaktivieren:
ocr.Configuration.TesseractVariables["tessedit_parallelize"] = false;
ocr.Configuration.TesseractVariables["tessedit_parallelize"] = false;
ocr.Configuration.TesseractVariables("tessedit_parallelize") = False
Whitelisting und Blacklisting von Zeichen
Verwenden Sie WhiteListCharacters und BlackListCharacters, um zu steuern, welche Zeichen Tesseract erkennt. Zum Beispiel:
ocr.Configuration.WhiteListCharacters = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
ocr.Configuration.BlackListCharacters = "`ë|^";
ocr.Configuration.WhiteListCharacters = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
ocr.Configuration.BlackListCharacters = "`ë|^";
ocr.Configuration.WhiteListCharacters = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"
ocr.Configuration.BlackListCharacters = "`ë|^"
Zusätzliche Konfigurationsvariablen
Erforschen Sie andere Tesseract-Konfigurationsvariablen, um das Verhalten an Ihre Bedürfnisse anzupassen. Zum Beispiel:
ocr.Configuration.TesseractVariables["classify_num_cp_levels"] = 3;
ocr.Configuration.TesseractVariables["textord_debug_tabfind"] = 0;
// ... (more variables)
ocr.Configuration.TesseractVariables["classify_num_cp_levels"] = 3;
ocr.Configuration.TesseractVariables["textord_debug_tabfind"] = 0;
// ... (more variables)
ocr.Configuration.TesseractVariables("classify_num_cp_levels") = 3
ocr.Configuration.TesseractVariables("textord_debug_tabfind") = 0
' ... (more variables)
Nun lassen Sie uns versuchen, dasselbe Bild mit erweiterten Einstellungen zu dekodieren
using IronOcr;
public class Program
{
public static void Main()
{
Console.WriteLine("Decoding using advanced features");
var ocrTesseract = new IronTesseract() // Create instance
{
Language = OcrLanguage.EnglishBest, // Configure best English language
Configuration = new TesseractConfiguration()
{
ReadBarCodes = false, // Disable reading barcodes
BlackListCharacters = "`ë|^", // Blacklisted characters
WhiteListCharacters = null, // No whitelist, allow all
PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd,
TesseractVariables = null, // No custom variables used
},
MultiThreaded = false,
};
using var ocrInput = new OcrInput(); // Create a disposible ocr input object
ocrInput.AddImage(@"sample1.png"); // Load the sample image
var ocrResult = ocrTesseract.Read(ocrInput); // Read the text from the image
Console.WriteLine(ocrResult.Text); // Output the text
}
}
using IronOcr;
public class Program
{
public static void Main()
{
Console.WriteLine("Decoding using advanced features");
var ocrTesseract = new IronTesseract() // Create instance
{
Language = OcrLanguage.EnglishBest, // Configure best English language
Configuration = new TesseractConfiguration()
{
ReadBarCodes = false, // Disable reading barcodes
BlackListCharacters = "`ë|^", // Blacklisted characters
WhiteListCharacters = null, // No whitelist, allow all
PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd,
TesseractVariables = null, // No custom variables used
},
MultiThreaded = false,
};
using var ocrInput = new OcrInput(); // Create a disposible ocr input object
ocrInput.AddImage(@"sample1.png"); // Load the sample image
var ocrResult = ocrTesseract.Read(ocrInput); // Read the text from the image
Console.WriteLine(ocrResult.Text); // Output the text
}
}
Imports IronOcr
Public Class Program
Public Shared Sub Main()
Console.WriteLine("Decoding using advanced features")
Dim ocrTesseract = New IronTesseract() With {
.Language = OcrLanguage.EnglishBest,
.Configuration = New TesseractConfiguration() With {
.ReadBarCodes = False,
.BlackListCharacters = "`ë|^",
.WhiteListCharacters = Nothing,
.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd,
.TesseractVariables = Nothing
},
.MultiThreaded = False
}
Dim ocrInput As New OcrInput() ' Create a disposible ocr input object
ocrInput.AddImage("sample1.png") ' Load the sample image
Dim ocrResult = ocrTesseract.Read(ocrInput) ' Read the text from the image
Console.WriteLine(ocrResult.Text) ' Output the text
End Sub
End Class
Code-Erklärung
-
IronOCR Konfiguration: Es wird eine Instanz von IronTesseract (der Hauptklasse von IronOCR ) erstellt und der Variablen
ocrTesseractzugewiesen.Die Konfigurationseinstellungen werden auf
ocrTesseractangewendet:- Sprache: Legt die Sprache für das OCR fest (in diesem Fall Englisch).
- Konfiguration: Ein TesseractConfiguration-Objekt, das weitere Anpassungen ermöglicht:
ReadBarCodes: Deaktiviert das Lesen von Barcodes.BlackListCharacters: Gibt Zeichen an, die auf die Blacklist gesetzt werden sollen (Zeichen, die nicht erkannt werden sollen).WhiteListCharacters: Keine Whitelist angegeben, alle Zeichen sind zulässig.PageSegmentationMode: Legt den Seitensegmentierungsmodus auf "AutoOsd" fest.TesseractVariables: Es wurden keine benutzerdefinierten Variablen verwendet.
MultiThreaded: Deaktiviert Multithreading.
- OCR-Eingabe und Laden von Bildern: Ein
using-Block erzeugt ein EinwegobjektocrInputvom Typ OcrInput. Die Bilddatei "sample1.png" wurde zuocrInputhinzugefügt. - Textextraktion: Die Methode
Readwird fürocrTesseractaufgerufen und übergibtocrInput. Das Ergebnis wird in der VariableocrResultgespeichert. - Ausgabe: Der extrahierte Text wird mit
Console.WriteLine(ocrResult.Text)auf der Konsole ausgegeben.
Ausgabe

Schritt 5: Leistungstuning der IronOCR-Leseoperation.
Bei der Arbeit mit IronOCR stehen Ihnen verschiedene Bildfilter zur Verfügung, die bei der Vorverarbeitung von Bildern vor dem OCR-Einsatz helfen können. Diese Filter optimieren die Bildqualität, verbessern die Sichtbarkeit und reduzieren das Rauschen oder Artefakte. Sie helfen, die Leistung der OCR-Operation zu verbessern.
-
Drehen:
Der Rotationsfilter ermöglicht es Ihnen, Bilder um eine bestimmte Anzahl von Grad im Uhrzeigersinn zu drehen. Für eine Drehung gegen den Uhrzeigersinn verwenden Sie negative Zahlen.
-
Begradigen:
Der Begradigungsfilter korrigiert die Schräglage des Bildes und stellt sicher, dass der Text aufrecht und orthogonal ist. Dies ist besonders nützlich für OCR, da Tesseract am besten mit korrekt ausgerichteten Scans arbeitet.
-
Skalieren:
Der Skalierungsfilter skaliert OCR-Eingabeseiten proportional.
-
Binarisieren:
Der Binärisierungsfilter konvertiert jeden Pixel entweder in Schwarz oder Weiß, ohne einen Mittelwert. Er kann die OCR-Leistung in Fällen sehr schwachen Kontrasts zwischen Text und Hintergrund verbessern.
- In Graustufen konvertieren:
Der Filter "In Graustufen konvertieren" wandelt jeden Pixel in einen Graustufenbereich um. Auch wenn dies die OCR-Genauigkeit vermutlich nicht signifikant verbessert, kann es die Geschwindigkeit erhöhen.
-
Invertieren:
Der Invertierungsfilter kehrt Farben um - Weiß wird zu Schwarz, und Schwarz wird zu Weiß.
Der Rauschunterdrückungsfilter entfernt digitales Rauschen. Verwenden Sie ihn bei erwartetem Rauschen.
Der Farbwechsel-Filter ersetzt eine bestimmte Farbe in einem Bild durch eine andere Farbe unter Berücksichtigung eines gewissen Schwellenwerts.
-
Kontrast:
Der Kontrastfilter erhöht automatisch den Kontrast. Er verbessert oft die OCR-Geschwindigkeit und Genauigkeit bei scans mit geringem Kontrast.
-
Erweitern und Erodieren:
Diese erweiterten Morphologie-Filter manipulieren die Objektgrenzen in einem Bild.
- Das Erweitern fügt den Objektgrenzen Pixel hinzu.
- Das Erodieren entfernt Pixel von den Objektgrenzen.
-
Schärfen:
Der Schärfefilter schärft verschwommene OCR-Dokumente und ebnet Alphakanäle zu Weiß aus.
- Rauschunterdrückung:
Der DeNoise-Filter entfernt digitales Rauschen. Verwenden Sie ihn bei Rauschen.
-
Starke Hintergrundrauschunterdrückung:
Dieser schwere Filter zur Hintergrundrauschunterdrückung sollte nur verwendet werden, wenn starker Dokumenthintergrundrausch bekannt ist. Es kann die OCR-Genauigkeit bei sauberen Dokumenten reduzieren und ist CPU-intensiv.
-
Auflösung verbessern:
Der Auflösungsverbesserungsfilter verbessert die Auflösung von Bildern minderer Qualität. Er wird aufgrund der automatischen Auflösungsbehandlung selten benötigt.
Hier ist ein Beispiel dafür, wie Filter mit IronOCR in C# angewendet werden können:
var ocr = new IronTesseract();
var input = new OcrInput();
input.LoadImage("sample.png");
input.Deskew();
var result = ocr.Read(input);
Console.WriteLine(result.Text);
var ocr = new IronTesseract();
var input = new OcrInput();
input.LoadImage("sample.png");
input.Deskew();
var result = ocr.Read(input);
Console.WriteLine(result.Text);
Dim ocr = New IronTesseract()
Dim input = New OcrInput()
input.LoadImage("sample.png")
input.Deskew()
Dim result = ocr.Read(input)
Console.WriteLine(result.Text)
Häufige OCR-Anwendungen
- Dokumentendigitalisierung: OCR wird häufig verwendet, um gescannte Papierdokumente wie Rechnungen, Quittungen, Formulare und Verträge in digitale Formate umzuwandeln. Dieser Digitalisierungsprozess optimiert die Dokumentenlagerung, -abfrage und -verwaltung, reduziert Papieransammlungen und verbessert die Effizienz.
- Datenextraktion: OCR ermöglicht die Extraktion von Text und Daten aus gescannten Dokumenten, Bildern und PDFs. Diese extrahierten Daten können für die automatisierte Dateneingabe, Inhaltsanalyse, Indizierung und die Integration in Datenbanken oder Geschäftssysteme verwendet werden.
- Texterkennung in Bildern: Die OCR-Technologie ermöglicht die Textextraktion aus gedruckten Dokumenten und Bildern zu Indizierungs- und Suchzwecken. Diese Fähigkeit wird in verschiedenen Anwendungen eingesetzt, darunter erweiterte Realität, bildbasierte Suchmaschinen und Übersetzungsdienste.
- Automatische Nummernschilderkennung (ALPR): ALPR-Systeme nutzen OCR, um Nummernschilder aus Bildern oder Videos zu lesen, die von Kameras in Verkehrskontrollen und Mauterhebung erfasst werden.
- Barrierefreie Lösungen: OCR spielt eine entscheidende Rolle bei der Erstellung von zugänglichen Inhalten für Personen mit Sehbehinderungen. Indem Texte aus Bildern oder Dokumenten in Sprache oder Brailleschrift umgewandelt werden, hilft OCR, Informationen für Menschen mit Behinderungen zugänglich zu machen.
- Identitätsverifizierung: OCR-Technologie wird in Identitätsverifizierungsprozessen eingesetzt, beispielsweise beim Scannen und Verarbeiten von Ausweisdokumenten wie Pässen, Führerscheinen und Ausweisen. Sie hilft bei der Verifizierung der Echtheit von Dokumenten und bei der Extraktion relevanter Informationen für die Identitätsüberprüfung.
- Bankwesen und Finanzen: OCR wird im Bankwesen und in der Finanzbranche bei Aufgaben wie dem Lesen von Schecks, der Bearbeitung von Rechnungen, der Umwandlung bestehender PDF-Dokumente, der Extraktion von Daten aus Finanzberichten und der Automatisierung dokumentenbasierter Arbeitsabläufe verwendet, um die Genauigkeit und Effizienz in Finanzoperationen zu verbessern.
- Automatische Übersetzung: OCR-Technologie wird in Übersetzungswerkzeuge und Sprachlern-Apps integriert, um gedruckte Texte von einer Sprache in eine andere zu konvertieren. Benutzer können Text mit ihren Geräten erfassen, und OCR hilft dabei, ihn in Echtzeit in die gewünschte Sprache zu übersetzen.
- Archivierung und Bewahrung historischer Dokumente: OCR wird zur Digitalisierung von Archivmaterialien und historischen Dokumenten verwendet, um sie in digitalen Formaten für zukünftigen Zugang, Forschung und Analyse zu bewahren und gleichzeitig das wertvolle kulturelle Erbe zu erhalten.
Lizenzanforderungen
IronOCR. Geben Sie die untenstehenden Details an, um den Schlüssel an Ihre E-Mail-Adresse zu erhalten.

Nachdem der Schlüssel durch Kauf oder Testabo erhalten wurde, folgen Sie den Schritten zur Nutzung.
Festlegen Ihres Lizenzschlüssels: Legen Sie Ihren IronOCR Lizenzschlüssel mithilfe des Codes fest. Fügen Sie die folgende Zeile zum Start Ihrer Anwendung hinzu (bevor Sie IronOCR verwenden):
IronOcr.License.LicenseKey = "IRONOCR-MYLICENSE-KEY-1EF01";
IronOcr.License.LicenseKey = "IRONOCR-MYLICENSE-KEY-1EF01";
IronOcr.License.LicenseKey = "IRONOCR-MYLICENSE-KEY-1EF01"
Globaler Anwendungsschlüssel (Web.Config oder App.Config): Um einen Schlüssel global in Ihrer Anwendung anzuwenden, verwenden Sie die Konfigurationsdatei (Web.Config oder App.Config). Fügen Sie den folgenden Schlüssel zu Ihrem appSettings hinzu:
<configuration>
<appSettings>
<add key="IronOcr.LicenseKey" value="IRONOCR-MYLICENSE-KEY-1EF01"/>
</appSettings>
</configuration>
<configuration>
<appSettings>
<add key="IronOcr.LicenseKey" value="IRONOCR-MYLICENSE-KEY-1EF01"/>
</appSettings>
</configuration>
Verwendung von .NET Core appsettings.json: Erstellen Sie for .NET Core Anwendungen eine appsettings.json-Datei im Stammverzeichnis Ihres Projekts. Ersetzen Sie den "IronOcr.LicenseKey"-Schlüssel mit Ihrem Lizenzwert:
{
"IronOcr.LicenseKey": "IRONOCR-MYLICENSE-KEY-1EF01"
}
Testen Ihres Lizenzschlüssels: Überprüfen Sie durch einen Test, ob Ihr Schlüssel korrekt installiert wurde:
bool result = IronOcr.License.IsValidLicense("IRONOCR-MYLICENSE-KEY-1EF01");
bool result = IronOcr.License.IsValidLicense("IRONOCR-MYLICENSE-KEY-1EF01");
Dim result As Boolean = IronOcr.License.IsValidLicense("IRONOCR-MYLICENSE-KEY-1EF01")
Abschluss
Zusammenfassend bietet IronOCR eine robuste Lösung für OCR ab $799. Nutzen Sie die Leistungsfähigkeit von OCR mit IronOCR und erschließen Sie neue Möglichkeiten in Ihren C#-Projekten.
Häufig gestellte Fragen
Wie kann ich die Zeichenerkennung in C# durchführen?
Um die Zeichenerkennung in C# durchzuführen, können Sie IronOCR verwenden. Beginnen Sie mit der Erstellung eines neuen C#-Projekts in Visual Studio und installieren Sie dann die IronOCR .NET-Bibliothek über den NuGet-Paketmanager. Verwenden Sie die Klassen und Methoden von IronOCR, um Text aus Bildern, PDFs oder gescannten Dokumenten zu extrahieren.
Was sind die Vorteile der Verwendung von IronOCR zur Textextraktion?
IronOCR verbessert die Textextraktion, indem es die Genauigkeit und Geschwindigkeit der Tesseract-OCR-Engine verbessert. Es unterstützt über 125 Sprachen, bietet zonenbasierte OCR-Fähigkeiten und stellt Bildvorverarbeitungswerkzeuge zur Verfügung, um OCR-Ergebnisse zu optimieren.
Wie optimiere ich die OCR-Genauigkeit mit IronOCR?
Um die OCR-Genauigkeit mit IronOCR zu optimieren, verwenden Sie Bildvorverarbeitungswerkzeuge wie Drehen, Entzerren und Kontrastanpassung. Sie können auch die Konfiguration mit Sprachwahl, Seitensegmentierung und Zeichen-Whitelisting oder -Blacklisting feinabstimmen.
Was sind häufige Anwendungen für OCR-Technologie?
OCR-Technologie wird häufig zur Dokumentendigitalisierung, Datenextraktion, Texterkennung in Bildern, automatisierten Kennzeichenerkennung und für Barrierefreiheitlösungen eingesetzt. Es spielt auch eine Rolle im Bankwesen, der Identitätsüberprüfung und der Archivdokumentenbewahrung.
Welche Umgebungen können IronOCR unterstützen?
IronOCR ist mit verschiedenen .NET-Umgebungen kompatibel, einschließlich C#, F# und VB.NET. Es unterstützt .NET Versionen 8, 7, 6, Core, Standard und Framework und ist somit vielseitig für zahlreiche Entwicklungsumgebungen geeignet.
Wie gehe ich bei der Lizenzierung von IronOCR vor?
Um die Lizenzierung von IronOCR zu handhaben, geben Sie Ihren Lizenzschlüssel über die IronOcr.License.LicenseKey-Eigenschaft in Ihrem Anwendungsstart an. Alternativ können Sie es global in Ihrer Web.Config oder App.Config-Datei oder in der appsettings.json for .NET Core-Anwendungen konfigurieren.
Welche fortgeschrittenen Funktionen bietet IronOCR?
IronOCR bietet fortgeschrittene Funktionen wie Sprachwahl, Seitensegmentierungsmodus, benutzerdefinierte Tesseract-Variablen und Zeichen-Whitelisting oder -Blacklisting. Diese Funktionen ermöglichen eine detaillierte Anpassung und Optimierung von OCR-Vorgängen.
Kann ich IronOCR für zonenbasierte OCR verwenden?
Ja, IronOCR unterstützt zonenbasierte OCR, wodurch Sie bestimmte Bereiche eines Bildes oder Dokuments zur Textextraktion angeben können. Diese Funktion ist nützlich für die gezielte Datenextraktion aus komplexen Layouts.
Wie kann ich OCR in mein C#-Projekt integrieren?
Um OCR in Ihr C#-Projekt zu integrieren, installieren Sie die IronOCR-Bibliothek von NuGet und referenzieren Sie sie in Ihrem Projekt. Nutzen Sie die Methoden der Bibliothek, um OCR-Funktionalität zu implementieren, sodass Ihre Anwendung Bilder und gescannte Dokumente verarbeiten kann.



