Zum Fußzeileninhalt springen
VERWENDUNG VON IRONOCR

Wie man Identitätsdokumente mit OCR in C# liest

Die optische Zeichenerkennung (OCR) hat sich als unverzichtbares Werkzeug für die Automatisierung der Textextraktion aus Bildern erwiesen, wodurch eine effiziente Datenabfrage und -analyse ermöglicht und menschliche Fehler vermieden werden. Diese Technologie kann genutzt werden, um Führerscheine, Pässe, offizielle Dokumente von Institutionen, Personalausweise, Aufenthaltstitelkarten und Reisedokumente in mehreren Sprachen und aus verschiedenen Ländern bis hin zum genauen Ablaufdatum, Nationalität, Geburtsdatum etc. zu lesen. Alle extrahierten Daten können weiter in maschinelles Lernen und KI-Softwareprodukte eingespeist werden.

In this article, we will explore how to leverage IronOCR, a powerful OCR library in C# from Iron Software, to read and extract information from identity documents. IronOCR bietet eine unkomplizierte und flexible OCR-Lösung in Form von APIs für OCR-Aufgaben, was es zu einer ausgezeichneten Wahl für Entwickler macht, die OCR-Software-Funktionen in ihre Anwendungen integrieren möchten.

IronOCR ermöglicht Computern, Text aus Bildern zu erkennen und zu extrahieren, vorhandene Dokumente zu scannen oder andere visuelle Darstellungen von Text. Zum Extrahieren von Daten erfordert dies eine Reihe komplexer Prozesse, die die Art und Weise nachahmen, wie Menschen Text visuell wahrnehmen und interpretieren. Dieser Prozess umfasst Bildvorverarbeitung, Texterkennung, Zeichensegmentierung, Merkmalsextraktion, Zeichenerkennung und Nachverarbeitung zur Fehlerkorrektur.

Wie man Identitätsdokumente mit OCR in C# liest

  1. Erstellen Sie ein neues C#-Projekt in Visual Studio
  2. Installieren Sie die IronOCR .NET-Bibliothek und fügen Sie sie Ihrem Projekt hinzu.
  3. Lesen Sie Identitätsdokumentbilder mit der IronOCR-Bibliothek.
  4. Lesen Sie Identitätsdokumente aus PDFs.

IronOCR, entwickelt und gepflegt von Iron Software, dient als leistungsstarke Bibliothek für C# Software-Ingenieure, die OCR, Barcode-Scannen und Textextraktion in .NET-Projekten erleichtert.

Schlüsselfunktionen von IronOCR

Vielseitigkeit des Textlesens

Fähig, relevante Daten aus verschiedenen Formaten zu lesen, einschließlich Bilder (JPEG, PNG, GIFF, TIFF, BMP), Streams und PDFs.

Bildverbesserung

Korrigiert minderwertige Scans und Fotos durch eine Reihe von Filtern wie Entzerrung, Rauschunterdrückung, Binarisierung, Auflösungsverbesserung, Dilatation und mehr.

Barcodelesung

Unterstützt das Lesen von Barcodes aus einer breiten Palette von Formaten, beinhalten über 20 Barcode-Typen, mit zusätzlicher QR-Code-Erkennung.

Tesseract OCR-Integration

Verwendet den neuesten Tesseract OCR-Build, der für optimale Leistung bei der Textextraktion aus Bildern fein abgestimmt ist.

Flexible Ausgabeoptionen

Erlaubt den Export von durchsuchbaren PDFs, HTML und Textinhalten aus Bilddateien und bietet Flexibilität im Umgang mit extrahierten Informationen.

Nun lassen Sie uns in die Entwicklung einer Demoanwendung eintauchen, die IronOCR verwendet, um ID-Dokumente zu lesen.

Voraussetzungen

  1. Visual Studio: Stellen Sie sicher, dass Sie Visual Studio oder eine andere C#-Entwicklungsumgebung installiert haben.
  2. NuGet-Paket-Manager: Stellen Sie sicher, dass Sie NuGet verwenden können, um Pakete in Ihrem Projekt zu verwalten.

Schritt 1: Erstellen Sie ein neues C#-Projekt in Visual Studio

Beginnen Sie mit dem Erstellen einer neuen C#-Konsolenanwendung in Visual Studio oder verwenden Sie alternativ ein vorhandenes Projekt. Wählen Sie im Menü "Neues Projekt hinzufügen" und dann unten aus den Vorlagen die Konsolenanwendung aus.

Wie man Identitätsdokumente mit OCR in C# liest: Abbildung 1

Geben Sie einen Projektnamen und einen Speicherort in den unteren Fenstern an.

Wie man Identitätsdokumente mit OCR in C# liest: Abbildung 2

Wählen Sie die erforderliche .NET-Version aus.

Wie man Identitätsdokumente mit OCR in C# liest: Abbildung 3

Klicken Sie auf die Schaltfläche "Erstellen", um das neue Projekt zu erstellen.

Schritt 2: Installieren Sie die IronOCR-Bibliothek und fügen Sie sie Ihrem Projekt hinzu.

IronOCR ist im NuGet-Paketmanager zu finden und kann mit dem Paketmanager-Konsolenskript Befehl installiert werden:

Install-Package IronOcr

IronOCR kann auch mit Visual Studio installiert werden. Öffnen Sie den NuGet-Paket-Manager, suchen Sie nach IronOCR wie unten, und klicken Sie auf Installieren.

Wie man Identitätsdokumente mit OCR in C# liest: Abbildung 5

Sobald installiert, ist die Anwendung bereit, IronOCR zu nutzen, um jedes Identitätsdokument für die Datenextraktion und Identitätsüberprüfung zu lesen, wodurch manuelle Dateneingabearbeit reduziert wird.

Schritt 3: Lesen Sie Identitätsdokumentbilder mit der IronOCR-Bibliothek

Die Verwendung von OCR zur Verarbeitung von Ausweisdokumenten umfasst viele Schritte, die im Folgenden beschrieben werden.

Bild-Vorbearbeitung

Die OCR-Ausweisdokumentverarbeitung beginnt damit, ein Bild zu erwerben, das Text enthält. Dieses Bild kann gescannte Ausweisdokumente, ein Foto von ID-Karten oder eine andere visuelle Darstellung von Text sein. Vorverarbeitungsschritte für Personalausweise können Größenanpassung, Rauschunterdrückung und Verbesserungen zur Verbesserung der Bildqualität und -klarheit umfassen.

Texterkennung

OCR-Algorithmen müssen die spezifischen Datenbereiche innerhalb des Bildes lokalisieren, in denen Text vorhanden ist. Dieser Schritt umfasst das Identifizieren von Textregionen oder Begrenzungsrahmen.

Zeichensegmentierung

Sobald Textregionen oder Datenfelder identifiziert wurden, wird das Bild weiter analysiert, um einzelne Zeichen zu segmentieren. Dieser Schritt ist entscheidend für Sprachen, die separate Zeichen verwenden, wie Englisch oder Chinesisch.

Merkmalsextraktion

OCR-Algorithmen analysieren die segmentierten Zeichen, um Merkmale zu extrahieren, die helfen, zwischen verschiedenen Zeichen zu unterscheiden. Diese Merkmale können Strichmuster, Form und räumliche Beziehungen zwischen den Elementen einschließen.

Zeichenerkennung

Auf Grundlage der extrahierten Merkmale klassifizieren OCR-Algorithmen jedes segmentierte Zeichen und weisen ihm eine entsprechende Textdarstellung zu. Maschinelle Lernmodelle, wie neuronale Netzwerke, werden häufig in diesem Schritt eingesetzt.

Nachverarbeitung

Die erkannten Zeichen können einer Nachverarbeitung unterzogen werden, um Fehler zu korrigieren oder die Genauigkeit zu erhöhen. Dieser Schritt kann auf Wörterbuch-basierte Korrekturen, Kontextanalyse oder Sprachmodellierung umfassen.

Die IronOCR-Bibliothek kümmert sich um alle oben genannten Schritte und ermöglicht es uns, OCR mit nur wenigen Codezeilen durchzuführen, die zeitaufwändige mühselige Aufgaben ersparen.

using IronOcr;

class Program
{
    public static void Main()
    {
        // Configure IronTesseract with language and other settings
        var ocrTesseract = new IronTesseract()
        {
            Language = OcrLanguage.EnglishBest,
            Configuration = new TesseractConfiguration()
            {
                ReadBarCodes = false, // Disable reading of barcodes
                BlackListCharacters = "`ë|^", // Blacklist specific characters
                PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd, // Set page segmentation mode
            }
        };

        // Define the OCR input image
        using var ocrInput = new OcrInput("id1.png");

        // Perform OCR on the input image
        var ocrResult = ocrTesseract.Read(ocrInput);

        // Display the extracted text
        Console.WriteLine(ocrResult.Text);
    }
}
using IronOcr;

class Program
{
    public static void Main()
    {
        // Configure IronTesseract with language and other settings
        var ocrTesseract = new IronTesseract()
        {
            Language = OcrLanguage.EnglishBest,
            Configuration = new TesseractConfiguration()
            {
                ReadBarCodes = false, // Disable reading of barcodes
                BlackListCharacters = "`ë|^", // Blacklist specific characters
                PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd, // Set page segmentation mode
            }
        };

        // Define the OCR input image
        using var ocrInput = new OcrInput("id1.png");

        // Perform OCR on the input image
        var ocrResult = ocrTesseract.Read(ocrInput);

        // Display the extracted text
        Console.WriteLine(ocrResult.Text);
    }
}
Imports IronOcr

Friend Class Program
	Public Shared Sub Main()
		' Configure IronTesseract with language and other settings
		Dim ocrTesseract = New IronTesseract() With {
			.Language = OcrLanguage.EnglishBest,
			.Configuration = New TesseractConfiguration() With {
				.ReadBarCodes = False,
				.BlackListCharacters = "`ë|^",
				.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd
			}
		}

		' Define the OCR input image
		Dim ocrInput As New OcrInput("id1.png")

		' Perform OCR on the input image
		Dim ocrResult = ocrTesseract.Read(ocrInput)

		' Display the extracted text
		Console.WriteLine(ocrResult.Text)
	End Sub
End Class
$vbLabelText   $csharpLabel

Eingabebild

Unten ist ein Beispielbild, das als Eingabe für das Programm verwendet wurde.

Wie man Identitätsdokumente mit OCR in C# liest: Abbildung 6

Ausgabe

Wie man Identitätsdokumente mit OCR in C# liest: Abbildung 7

Code-Erklärung

Der obige Code verwendet die IronOCR-Bibliothek, um alle Textfelder des Personaldokuments auszulesen. Wir verwenden die IronTesseract-Klasse aus der IronOCR-Bibliothek und konfigurieren sie, um die englische Sprache und einige gesperrte Zeichen zu verwenden. Dann deklarieren wir die OCR-Eingabe mit der OcrInput-Klasse und lesen den Text aus dem Bild. Die extrahierten Textfelder sind in der Konsolenausgabe zu sehen.

Schritt 4: Lesen Sie Identitätsdokumente aus PDFs.

Wir können ebenfalls von PDF-Dokumenten lesen. Dafür können wir die IronPDF-Bibliothek von IronSoftware verwenden. Installieren Sie zunächst die Bibliothek wie unten:

Install-Package IronOcr
using IronOcr;
using IronPdf;

class Program
{
    public static void Main()
    {
        // Load the PDF document
        var pdfReader = new PdfDocument("id1.pdf");

        // Initialize IronTesseract for OCR
        var ocrTesseract = new IronTesseract();

        // Create OCR input from the PDF stream
        using var ocrInput = new OcrInput();
        ocrInput.AddPdf(pdfReader.Stream);

        // Perform OCR on the PDF input
        var ocrResult = ocrTesseract.Read(ocrInput);

        // Display the extracted text
        Console.WriteLine(ocrResult.Text);
    }
}
using IronOcr;
using IronPdf;

class Program
{
    public static void Main()
    {
        // Load the PDF document
        var pdfReader = new PdfDocument("id1.pdf");

        // Initialize IronTesseract for OCR
        var ocrTesseract = new IronTesseract();

        // Create OCR input from the PDF stream
        using var ocrInput = new OcrInput();
        ocrInput.AddPdf(pdfReader.Stream);

        // Perform OCR on the PDF input
        var ocrResult = ocrTesseract.Read(ocrInput);

        // Display the extracted text
        Console.WriteLine(ocrResult.Text);
    }
}
Imports IronOcr
Imports IronPdf

Friend Class Program
	Public Shared Sub Main()
		' Load the PDF document
		Dim pdfReader = New PdfDocument("id1.pdf")

		' Initialize IronTesseract for OCR
		Dim ocrTesseract = New IronTesseract()

		' Create OCR input from the PDF stream
		Dim ocrInput As New OcrInput()
		ocrInput.AddPdf(pdfReader.Stream)

		' Perform OCR on the PDF input
		Dim ocrResult = ocrTesseract.Read(ocrInput)

		' Display the extracted text
		Console.WriteLine(ocrResult.Text)
	End Sub
End Class
$vbLabelText   $csharpLabel

Der obige Code verwendet IronPDF, um das id1.pdf-Dokument zu laden, und das PDF wird als Stream an OcrInput und ocrTesseract weitergegeben.

Ausgabe

Wie man Identitätsdokumente mit OCR in C# liest: Abbildung 9

Lizenzierung (Kostenlose Testversion verfügbar)

Um IronOCR zu verwenden, benötigen Sie einen Lizenzschlüssel. Dieser Schlüssel muss in der appsettings.json. abgelegt werden.

{
    "IRONOCR-LICENSE-KEY": "your license key"
}

Geben Sie eine Benutzer-Email-ID an, um eine Testlizenz zu erhalten.

Wie man Identitätsdokumente mit OCR in C# liest: Abbildung 10

Verwendungszwecke

1. Identitätsverifizierung in Finanzdienstleistungen:

  • Verwendungszweck: Banken und Finanzinstitute nutzen OCR, um Identitätsdokumente wie Pässe, Führerscheine und ID-Karten während des Kundenonboardings und des KYC-Prozesses zu lesen.
  • Vorteile: Sorgt für eine präzise und effiziente Identitätsüberprüfung für Kontoeröffnungen, Kreditanträge und andere Finanztransaktionen.

2. Grenzkontrolle und Einwanderung:

  • Verwendungszweck: Einwanderungsbehörden setzen OCR-Technologie ein, um Informationen aus Pässen und Visa an Grenzübergangsstellen zu lesen und zu authentifizieren.
  • Vorteile: Rationalisiert den Einwanderungsprozess, verbessert die Sicherheit und reduziert Fehler bei manueller Dateneingabe.

3. Zugangskontrolle und Sicherheit:

  • Verwendungszweck: OCR wird in Zugangskontrollsystemen verwendet, um Informationen von ID-Karten, Mitarbeiterausweisen oder Gesichtserkennungsscans für sicheren Zutritt zu Gebäuden oder eingeschränkten Bereichen zu lesen.
  • Vorteile: Erhöht die Sicherheit, indem nur autorisierte Personen Zugang erhalten und bietet einen digitalen Aufzeichnung von Eingängen.

4. E-Government-Dienste:

  • Verwendungszweck: Regierungsbehörden nutzen OCR, um ID-Dokumente zu verarbeiten und zu überprüfen, die online für Dienste wie Führerscheinverlängerungen, Steuererklärungen und Antragstellungen eingereicht werden.
  • Vorteile: Verbessert die Effizienz, reduziert Papierarbeit und verbessert das Gesamterlebnis der Bürger.

5. Identitätsverifizierung im Gesundheitswesen:

  • Verwendungszweck: Gesundheitsdienstleister nutzen OCR, um Informationen von Patientenausweisen, Versicherungskarten und anderen Identitätsdokumenten für eine präzise Patientenaktenführung zu lesen.
  • Vorteile: Ermöglicht eine genaue Patientenidentifikation, gewährleistet eine ordnungsgemäße Verwaltung der medizinischen Aufzeichnungen und unterstützt Abrechnungsprozesse.

6. Automatisierter Hotel-Check-in:

  • Verwendungszweck: Hotels implementieren OCR für automatisierte Check-in-Prozesse durch Scannen der Ausweisdokumente der Gäste, wodurch der Registrierungsprozess rationalisiert wird.
  • Vorteile: Verbessert das Gästeerlebnis, verkürzt die Check-in-Zeit und minimiert Fehler bei der Erfassung der Gästeinformationen.

7. Smart Cities und öffentliche Dienste:

  • Verwendungszweck: OCR wird in Smart-City-Initiativen eingesetzt, um Identitätsdokumente für Dienste wie den Zugang zu öffentlichen Verkehrsmitteln, Bibliotheksmitgliedschaften und die Registrierung für Stadtereignisse zu lesen.
  • Vorteile: Verbessert die Effizienz öffentlicher Dienstleistungen, ermöglicht nahtlosen Zugang und verbessert das städtische Lebenserlebnis.

8. Bildungsverwaltung:

  • Verwendungszweck: Bildungseinrichtungen nutzen OCR, um ID-Dokumente während der Studentenaufnahme, Prüfungen und der Ausstellung von akademischen Zeugnissen zu verarbeiten und zu überprüfen.
  • Vorteile: Sorgt für genaue Schüleraufzeichnungen, reduziert den Verwaltungsaufwand und verbessert die Integrität der akademischen Prozesse.

Abschluss

Die Integration von OCR-Technologie in Ihre C#-Anwendung mit IronOCR ermöglicht eine effiziente Extraktion von Informationen aus ID-Dokumenten. Diese umfassende Anleitung bietet die notwendigen Schritte, um Ihr Projekt einzurichten und IronOCR zu verwenden, um Identitätsdokumentbilder zu lesen und zu verarbeiten. Experimentieren Sie mit den Code-Beispielen, um den Extraktionsprozess an Ihre spezifischen Anforderungen anzupassen und eine nahtlose und automatisierte Lösung für die Handhabung von Identitätsdokumentdaten bereitzustellen.

Häufig gestellte Fragen

Wie kann ich Text aus Identitätsdokumenten mit C# extrahieren?

Durch die Verwendung von IronOCR, einer spezialisierten OCR-Bibliothek von IronSoftware, können Sie Text aus verschiedenen Identitätsdokumenten wie Pässen, Ausweisen und Führerscheinen extrahieren. Sie können IronOCR über den NuGet-Paketmanager in Visual Studio installieren und seine Methoden verwenden, um Text aus Bildern und PDFs zu lesen.

Welche Vorteile hat die Verwendung von OCR für Identitätsdokumente?

OCR-Technologie, wie IronOCR von IronSoftware, automatisiert die Textextraktion aus Identitätsdokumenten, reduziert menschliche Fehler und verbessert die Effizienz der Datenabfrage. Es unterstützt mehrere Sprachen und Dokumentformate, was es ideal für Anwendungen in Finanzen, Gesundheitswesen und Grenzkontrolle macht.

Welche Schritte sind erforderlich, um OCR in einem C#-Projekt einzurichten?

Um OCR in einem C#-Projekt einzurichten, müssen Sie ein neues Projekt in Visual Studio erstellen, IronOCR über den NuGet-Paketmanager installieren und dessen API nutzen, um Text aus Dokumenten zu lesen. IronOCR bietet umfassende Dokumentation und Beispiele, um Ihnen bei der Integration von OCR-Funktionen zu helfen.

Wie kann ich die Bildqualität für bessere OCR-Ergebnisse verbessern?

IronOCR umfasst Funktionen wie Deskew, Denoise, Binarize, Verbesserungsauflösung und Dilate, um die Bildqualität zu verbessern. Diese Filter verbessern die Genauigkeit der Texterkennung von Bildern niedriger Qualität und sorgen für zuverlässige Datenextraktion.

Kann die OCR-Technologie Barcodes aus Identitätsdokumenten lesen?

Ja, IronOCR unterstützt die Barcode-Erkennung aus Identitätsdokumenten. Es kann über 20 Arten von Barcodes lesen, einschließlich QR-Codes, was nützlich für Anwendungen ist, die sowohl Text- als auch Barcodedatenerfassung erfordern.

Gibt es bestimmte Anwendungsfälle für OCR in der Identitätsüberprüfung?

OCR wird häufig in der Identitätsüberprüfung für Anwendungen wie automatisierte Check-ins, Zugangskontrolle und E-Government-Dienste verwendet. IronOCR bietet die notwendigen Werkzeuge, um Text aus Identitätsdokumenten zu extrahieren und zu überprüfen, verbessert die Sicherheit und optimiert Prozesse.

Wie kann ich die mehrsprachige Textextraktion mit OCR verwalten?

IronOCR bietet Mehrsprachunterstützung und ermöglicht Ihnen, Text aus Dokumenten in verschiedenen Sprachen zu extrahieren. Diese Funktion ist besonders nützlich für internationale Anwendungen, bei denen Dokumente in verschiedenen Sprachen effizient verarbeitet werden müssen.

Gibt es eine Testversion für OCR-Bibliotheken?

IronOCR von IronSoftware bietet eine kostenlose Testversion an. Sie können einen Testlizenzschlüssel erhalten, indem Sie eine E-Mail-Adresse angeben, die Ihnen ermöglicht, die Funktionen der Bibliothek zu erkunden, bevor Sie sich für einen Kauf entscheiden.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen