IRONOCR VERWENDEN

Passport OCR SDK (Entwickler-Tutorial)

Veröffentlicht 15. Dezember 2024
Teilen Sie:

AReisepassist die Identität einer Person; Wir nutzen Pässe, um zu reisen und wesentliche Aspekte unseres Lebens zu registrieren. Jedoch ist das Passformat nicht immer leicht zu lesen. Stellen Sie sich vor, dass während der Ferienzeit viele Reisende plötzlich für Reisen und Freizeit auftauchen. Wie können die Einwanderungsbeamten diese große Menge an Daten manuell eingeben und die korrekten Informationen manuell abrufen?

Daher wenden sich viele Anwendungen und Unternehmen der optischen Zeichenerkennung zu.(OCR), mit dem Entwickler gedruckten oder handgeschriebenen Text und digitale Bilder schnell extrahieren können.

Ähnlich ist Passport OCR eine Technologie, die verwendetoptische Zeichenerkennung (OCR)Software zur Extraktion sinnvoller Informationen aus Pässen; Es nutzt auch die maschinenlesbare Zone für alle Reisepässe, um Informationen abzurufen, die die Person identifizieren, die schnell die Kontrolle passieren möchte. In Szenarien, in denen Sie Passinformationen schnell erkennen müssen oder in einem Prozess zur Automatisierung der Passdatenextraktion, ist Passport OCR entscheidend und bildet das Fundament für Effizienz und Geschwindigkeit an Flughäfen und Einwanderungsgrenzen.

Obwohl die Passport-OCR-Software und -Technologie im Laufe der Jahre immer weiter entwickelt wurden, gibt es viele Faktoren, die beim Scannen des Dokuments zu berücksichtigen sind. Digitale Bilder mit Rauschen oder Flecken auf dem Reisepass können die Genauigkeit des Reisepasses erheblich beeinträchtigen. Außerdem können OCR-Bibliotheken manchmal verwirrend sein, wenn sie auf einem Reisepass arbeiten, da die maschinenlesbare Zone ein einzigartig strukturiertes Datenset ist. Entwickler könnten in der Lage sein, Daten zu extrahieren, müssen jedoch die Parameter unabhängig sortieren. Jedoch mitIronOCR, spezialisierte Methoden sind zur Erkennung von Pässen optimiert; Seine Ergebnisse ermöglichen es Entwicklern, die Informationen schnell zu erhalten und zu manipulieren, was ideal für hochvolumiges Scannen und Automatisierung ist.

In diesem Artikel werden wir kurz darüber sprechen, wie IronOCR verwendet wird, um Passinformationen zu erhalten und zu bearbeiten, um die Datenerfassung zu automatisieren, und weitere Details dazu geben, wie IronOCR mit dem Pass interagiert.

IronOCR: Eine C# OCR-Bibliothek

Passport OCR SDK(Entwickler-Tutorial): Abbildung 1 - IronOCR: Eine C# OCR-Bibliothek

IronOCRist eine C#-Bibliothek, die benutzerfreundliche Methoden und flexible Funktionen für alle OCR-bezogenen Bedürfnisse bietet. Zusätzlich zu den Standardtechniken ermöglicht IronOCR Entwicklern, eine angepasste Version von Tesseract vollständig zu nutzen und anzupassen, um alle damit verbundenen Aufgaben zu erledigen.

Hier ist eine kurze Übersicht der bemerkenswertesten Funktionen:

  1. Kompatibilität über Plattformen hinweg: IronOCR ist mit den meisten .NET-Plattformen kompatibel, einschließlich .NET 8, 7, 6 und 5, und unterstützt das .NET Framework ab Version 4.6.2. Mit dieser Bibliothek müssen sich Entwickler keine Sorgen um die Kompatibilität zwischen verschiedenen Plattformen machen, da sie alle Betriebssystemformen unterstützt. Von Windows und macOS bis hin zu Azure und sogar Linux:

  2. Flexibilität: OCR-Eingaben kommen in vielen Formaten, daher muss eine Bibliothek alle möglichen Formate verarbeiten können, um wirklich flexibel zu sein. IronOCR akzeptiert alle gängigen Bildformate(jpg, png und gif)während die native „System.Drawings.Objects“ aus C# unterstützt werden, was eine einfachere Integration in bestehende Codebasen ermöglicht.

  3. Unterstützung und Benutzerfreundlichkeit: IronOCR ist gut dokumentiert, mit umfangreicher API und Tutorials, die alle Funktionen aufzeigen. Darüber hinaus gibt es 24/5 Support, der sicherstellt, dass die Entwickler stets unterstützt werden.

    1. Unterstützung für mehrere Sprachen: IronOCR unterstützt bis zu 125 Sprachen und auch benutzerdefinierte Sprachen, was es vielseitig für die internationale Dokumentenverarbeitung macht.

Lesen des Reisepasses mit IronOCR

Lizenzschlüssel

Bitte beachten Sie, dass IronOCR einen Lizenzschlüssel für den Betrieb erfordert. Sie können einen Schlüssel als Teil einer kostenlosen Testversion erhalten, indem Sie diese Seite besuchenlink.

//Replace the license key variable with the trial key you obtained
IronOCr.License.LicenseKey = "REPLACE-WITH-YOUR-KEY";
//Replace the license key variable with the trial key you obtained
IronOCr.License.LicenseKey = "REPLACE-WITH-YOUR-KEY";
'Replace the license key variable with the trial key you obtained
IronOCr.License.LicenseKey = "REPLACE-WITH-YOUR-KEY"
VB   C#

Nachdem Sie einen Testschlüssel erhalten haben, setzen Sie diese Variable in Ihrem Projekt.

Code-Beispiel

Der untenstehende Code zeigt, wie IronOCR ein Passbild aufnimmt und alle relevanten Informationen mit dem Passport-OCR-SDK der Bibliothek extrahiert.

Eingangsbild

Passport OCR SDK(Entwickler-Tutorial): Abbildung 2 - Eingabebild

using IronOcr;
using System;
// Instantiate OCR engine
var ocr = new IronTesseract();
using var inputPassport = new OcrInput();
inputPassport.LoadImage("Passport.jpg");
// Perform OCR
OcrPassportResult result = ocr.ReadPassport(inputPassport);
// Output passport information
Console.WriteLine(result.PassportInfo.GivenNames);
Console.WriteLine(result.PassportInfo.Country);
Console.WriteLine(result.PassportInfo.PassportNumber);
Console.WriteLine(result.PassportInfo.Surname);
Console.WriteLine(result.PassportInfo.DateOfBirth);
Console.WriteLine(result.PassportInfo.DateOfExpiry);
using IronOcr;
using System;
// Instantiate OCR engine
var ocr = new IronTesseract();
using var inputPassport = new OcrInput();
inputPassport.LoadImage("Passport.jpg");
// Perform OCR
OcrPassportResult result = ocr.ReadPassport(inputPassport);
// Output passport information
Console.WriteLine(result.PassportInfo.GivenNames);
Console.WriteLine(result.PassportInfo.Country);
Console.WriteLine(result.PassportInfo.PassportNumber);
Console.WriteLine(result.PassportInfo.Surname);
Console.WriteLine(result.PassportInfo.DateOfBirth);
Console.WriteLine(result.PassportInfo.DateOfExpiry);
Imports IronOcr
Imports System
' Instantiate OCR engine
Private ocr = New IronTesseract()
Private inputPassport = New OcrInput()
inputPassport.LoadImage("Passport.jpg")
' Perform OCR
Dim result As OcrPassportResult = ocr.ReadPassport(inputPassport)
' Output passport information
Console.WriteLine(result.PassportInfo.GivenNames)
Console.WriteLine(result.PassportInfo.Country)
Console.WriteLine(result.PassportInfo.PassportNumber)
Console.WriteLine(result.PassportInfo.Surname)
Console.WriteLine(result.PassportInfo.DateOfBirth)
Console.WriteLine(result.PassportInfo.DateOfExpiry)
VB   C#

Code-Erklärung

  1. Wir importieren zuerst IronOCR in den Code.

  2. Dann erstellen wir ein neues OCrInput und weisen es als inputPassport zu.

  3. Wir lesen dann das Bild, indem wir den Pfad des Bildes angeben.

  4. Wir verwenden dann die spezialisierte Methode zum Auslesen des Reisepasses, `ReadPassport,` und übergeben den eingegebenen Reisepass.

  5. Wir können dann das Ergebnis der extrahierten Daten manipulieren und ausdrucken.

Konsolenausgabe

Passport OCR SDK(Entwickler-Tutorial): Abbildung 3 - Konsolenausgabe

Maschinenlesbare Zone

IronOCR kann die maschinenlesbare Zone extrahieren(MRZ)Informationen aus den unteren beiden Zeilen eines jeden Reisepasses gemäß den Vorgaben der Internationalen Zivilluftfahrt-Organisation(ICAO)Standard. Die MRZ-Daten bestehen aus zwei Zeilen, die jeweils einzigartige Informationen enthalten. Für detaillierte Informationen darüber, wofür jede Position in den Zeilen steht, sowie für Ausnahmen und eindeutige Kennungen konsultieren Sie bitte dasICAODokumentationsstandards.

Hier ist eine kurze Tabelle dazu:

Passport OCR SDK(Entwickler-Tutorial): Abbildung 4 - Tabelle der MDZ

Herausforderungen bei der Reisepass-OCR und Fehlersuche

Bildqualität ist immer ein Problem beim Scannen digitaler Bilder. Eine verzerrte Bildqualität würde die Informationen verschleiern und es schwieriger machen, die Genauigkeit der Daten zu bestätigen. Darüber hinaus müssen Entwickler die Datensicherheit und die Einhaltung von Vorschriften berücksichtigen, wenn sie mit geschäftskritischen Informationen wie einem Reisepass umgehen.

IronOCR bietet auch eine Möglichkeit, kurz zu debuggen und das Konzept für die Interaktionsinformation zu präsentieren. Diese Methoden ermöglichen es Entwicklern, Probleme zu beheben und Vertrauen in die extrahierten Daten zu haben.

Hier ist ein kurzes Beispiel dafür:

using IronOcr;
using System;
// Instantiate OCR engine
var ocr = new IronTesseract();
using var inputPassport = new OcrInput();
inputPassport.LoadImage("Passport.jpg");
// Perform OCR
OcrPassportResult result = ocr.ReadPassport(inputPassport);
// Output Confidence level and raw extracted text
Console.WriteLine(result.Confidence);
Console.WriteLine(result.Text);
using IronOcr;
using System;
// Instantiate OCR engine
var ocr = new IronTesseract();
using var inputPassport = new OcrInput();
inputPassport.LoadImage("Passport.jpg");
// Perform OCR
OcrPassportResult result = ocr.ReadPassport(inputPassport);
// Output Confidence level and raw extracted text
Console.WriteLine(result.Confidence);
Console.WriteLine(result.Text);
Imports IronOcr
Imports System
' Instantiate OCR engine
Private ocr = New IronTesseract()
Private inputPassport = New OcrInput()
inputPassport.LoadImage("Passport.jpg")
' Perform OCR
Dim result As OcrPassportResult = ocr.ReadPassport(inputPassport)
' Output Confidence level and raw extracted text
Console.WriteLine(result.Confidence)
Console.WriteLine(result.Text)
VB   C#

Ähnlich bleibt der Code im obigen Beispiel unverändert; Allerdings unterscheidet sich die Konsolenausgabe, da wir direkt auf die Eigenschaften `Text` und `Confidence` zugreifen, anstatt auf die einzelnen Mitglieder des Reisepasses.

  1. Confidence: Die `Confidence`-Eigenschaft im `OcrPassportResult` ist eine Gleitkommazahl, die das statistische Genauigkeitsvertrauen des OCR darstellt, berechnet als Durchschnitt jedes Zeichens. Ein niedrigerer Wert weist darauf hin, dass das Passbild möglicherweise unscharf ist oder zusätzliche Informationen enthält. Eins steht für das höchste Vertrauensniveau, während 0 das niedrigste darstellt.

  2. Der `Text`-Eigenschaft in dem `OcrPassportResult` enthält den unbearbeiteten Text, der aus dem Passbild extrahiert wurde. Entwickler können es in Unittests verwenden, um den extrahierten Text aus dem Passbild durch Gleichheitsbehauptungen zu validieren.

Schlussfolgerung

Passport OCR SDK(Entwickler-Tutorial): Abbildung 5 - IronOCR

Die Passport OCR-Technologie verbessert die Dokumentenverarbeitung erheblich, indem sie die Datenerfassung automatisiert und die operative Effizienz steigert. Es rationalisiert die Identitätsüberprüfung und KYC-Prozesse und gewährleistet dabei hohe Genauigkeit beim Umgang mit sensiblen persönlichen Informationen. Einwanderungsbehörden und Flughäfen können die Bearbeitungszeit verkürzen und die Effizienz der Arbeitsabläufe verbessern, indem sie IronOCR als ihre Passport OCR API wählen.

IronOCR bietet Entwicklern Flexibilität und Skalierbarkeit durch seine benutzerfreundlichen Methoden. Es ermöglicht Entwicklern, Informationen schnell über das `OcrPassportResult`-Objekt zu sortieren. Des Weiteren bietet IronOCR Debugging-Tools, einschließlich Vertrauensniveaus und unverarbeitetem, ungeparstem Text, die Entwickler in Produkttests verwenden können. IronOCR minimiert auch manuell das digitale Rauschen für fortgeschrittene Anwendungen, indem es das Passbild vor der Verarbeitung durch die Methode bereinigt.

Nutzen Sie gerne die Vorteile von IronOCRskostenlose Testlizenz seite.

< PREVIOUS
OCR-Supermarktquittungen in C# (Entwickler-Tutorial)
NÄCHSTES >
Tesseract OCR für mehrere Sprachen (Entwickler-Tutorial)

Sind Sie bereit, loszulegen? Version: 2024.11 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 2,791,504 Lizenzen anzeigen >