Jak odczytywać dokumenty tożsamości za pomocą OCR w języku C#
Technologia optycznego rozpoznawania znaków (OCR) stała się nieocenionym narzędziem do automatycznego wyodrębniania tekstu z obrazów, umożliwiającym wydajne pozyskiwanie i analizę danych oraz pozwalającym uniknąć błędów ludzkich. Technologia ta może być wykorzystywana do odczytywania praw jazdy, paszportów, oficjalnych dokumentów instytucjonalnych, dowodów osobistych, kart pobytu oraz dokumentów podróży w wielu językach i z różnych krajów, z dokładnością co do daty ważności, narodowości, daty urodzenia itp. Wszystkie wyodrębnione dane mogą być następnie przekazywane do oprogramowania wykorzystującego uczenie maszynowe i sztuczną inteligencję.
W tym artykułe omówimy, jak wykorzystać bibliotekę IronOCR, potężną bibliotekę OCR w języku C# firmy Iron Software, do odczytu i wyodrębniania informacji z dokumentów tożsamości. IronOCR zapewnia proste i elastyczne rozwiązanie OCR w postaci interfejsów API do zadań OCR, co czyni go doskonałym wyborem dla programistów pragnących zintegrować funkcje oprogramowania OCR ze swoimi aplikacjami.
IronOCR umożliwia komputerom rozpoznawanie i wyodrębnianie tekstu z obrazów, skanowanie istniejących dokumentów lub wszelkich innych wizualnych reprezentacji tekstu. Pobieranie danych wymaga szeregu złożonych procesów, które naśladują sposób, w jaki ludzie postrzegają i interpretują tekst wizualnie. Proces ten obejmuje wstępne przetwarzanie obrazu, wykrywanie tekstu, segmentację znaków, ekstrakcję cech, rozpoznawanie znaków oraz przetwarzanie końcowe w celu skorygowania błędów.
Jak odczytywać dokumenty tożsamości za pomocą OCR w języku C
- Utwórz nowy projekt C# w Visual Studio
- Zainstaluj bibliotekę IronOCR .NET i dodaj ją do swojego projektu.
- Odczytuj obrazy dokumentów tożsamości za pomocą biblioteki IronOCR.
- Odczytuj dokumenty tożsamości z plików PDF.
IronOCR, stworzony i utrzymywany przez Iron Software, służy jako potężna biblioteka dla inżynierów oprogramowania C#, ułatwiająca OCR, skanowanie kodów kreskowych i ekstrakcję tekstu w projektach .NET.
Najważniejsze cechy IronOCR
Wszechstronność czytania tekstu
Możliwość odczytu odpowiednich danych z różnych formatów, w tym obrazów (JPEG, PNG, GIF, TIFF, BMP), strumieni i plików PDF.
Poprawa jakości obrazu
Koryguje skany i zdjęcia niskiej jakości za pomocą szeregu filtrów, takich jak Deskew, Denoise, Binarize, Enhance Resolution, Dilate i innych.
Rozpoznawanie BarCode
Obsługuje odczytywanie kodów kreskowych w szerokiej gamie formatów, obejmującej ponad 20 typów kodów kreskowych, z dodatkową funkcją rozpoznawania kodów QR.
Integracja z OCR Tesseract
Wykorzystuje najnowszą wersję Tesseract OCR, precyzyjnie dostrojoną pod kątem optymalnej wydajności podczas wyodrębniania tekstu z obrazów.
Elastyczne opcje wyjściowe
Umożliwia eksportowanie plików PDF z funkcją wyszukiwania, HTML oraz treści tekstowych z plików graficznych, zapewniając elastyczność w zarządzaniu wyodrębnionymi informacjami.
Przejdźmy teraz do tworzenia aplikacji demonstracyjnej, która wykorzystuje IronOCR do odczytu dokumentów tożsamości.
Wymagania wstępne
- Visual Studio: Upewnij się, że masz zainstalowane Visual Studio lub inne środowisko programistyczne C#.
- Menedżer pakietów NuGet: Upewnij się, że możesz używać NuGet do zarządzania pakietami w swoim projekcie.
Krok 1: Utwórz nowy projekt C# w Visual Studio
Zacznij od utworzenia nowej aplikacji konsolowej w języku C# w programie Visual Studio lub skorzystaj z istniejącego projektu. Wybierz "Dodaj nowy projekt" z menu, a następnie wybierz aplikację konsolową z poniższych szablonów.

W poniższych okienkach podaj nazwę projektu i lokalizację.

Wybierz wymagańą wersję .NET.

Kliknij przycisk Utwórz, aby utworzyć nowy projekt.
Krok 2: Zainstaluj bibliotekę IronOCR i dodaj ją do swojego projektu.
IronOCR można znaleźć w menedżerze pakietów NuGet i zainstalować za pomocą konsoli menedżera pakietów, używając następującego polecenia:
Install-Package IronOcr
IronOCR można również zainstalować za pomocą programu Visual Studio. Otwórz menedżera pakietów NuGet, wyszukaj IronOCR w sposób pokazany poniżej i kliknij "Zainstaluj".

Po zainstalowaniu aplikacja jest gotowa do korzystania z IronOCR w celu odczytu dowolnego dokumentu tożsamości w celu ekstrakcji danych i weryfikacji tożsamości, co ogranicza ręczne wprowadzanie danych.
Krok 3: Odczyt obrazów dokumentów tożsamości przy użyciu biblioteki IronOCR
Wykorzystanie OCR do przetwarzania dokumentów tożsamości obejmuje wiele etapów, które zostały szczegółowo opisane poniżej.
Wstępne przetwarzanie obrazów
Przetwarzanie dokumentów tożsamości za pomocą OCR rozpoczyna się od pozyskania obrazu zawierającego tekst. Obrazem tym mogą być zeskanowane dokumenty tożsamości, zdjęcia dowodów osobistych lub inne wizualne przedstawienia tekstu. Etapy wstępnego przetwarzania dowodów osobistych mogą obejmować zmianę rozmiaru, redukcję szumów i poprawę jakości w celu zwiększenia jakości i wyrazistości obrazu.
Wykrywanie tekstu
Algorytmy OCR muszą zlokalizować konkretne obszary danych na obrazie, w których znajduje się tekst. Ten etap obejmuje identyfikację obszarów tekstu lub ramek ograniczających.
Segmentacja znaków
Po zidentyfikowaniu obszarów tekstu lub pól danych obraz jest dalej analizowany w celu wyodrębnienia poszczególnych znaków. Ten krok ma kluczowe znaczenie w przypadku języków, które używają charakterystycznych znaków, takich jak angielski czy chiński.
Wyodrębnianie funkcji
Algorytmy OCR analizują podzielone na segmenty znaki w celu wyodrębnienia cech, które pomagają w rozróżnieniu poszczególnych znaków. Funkcje te mogą obejmować wzory pociągnięć, kształt oraz relacje przestrzenne między elementami.
Rozpoznawanie znaków
Na podstawie wyodrębnionych cech algorytmy OCR klasyfikują każdy posegmentowany znak i przypisują mu odpowiednią reprezentację tekstową. Na tym etapie często wykorzystuje się modele uczenia maszynowego, takie jak sieci neuronowe.
Obróbka końcowa
Rozpoznane znaki mogą zostać poddane obróbce końcowej w celu skorygowania błędów lub zwiększenia dokładności. Ten etap może obejmować poprawki oparte na słownikach, analizę kontekstu lub modelowanie językowe.
Biblioteka IronOCR zajmuje się wszystkimi powyższymi krokami i pozwala nam przeprowadzić OCR za pomocą zaledwie kilku linii kodu, oszczędzając czasochłonne i żmudne zadania.
using IronOcr;
class Program
{
public static void Main()
{
// Configure IronTesseract with language and other settings
var ocrTesseract = new IronTesseract()
{
Language = OcrLanguage.EnglishBest,
Configuration = new TesseractConfiguration()
{
ReadBarCodes = false, // Disable reading of barcodes
BlackListCharacters = "`ë|^", // Blacklist specific characters
PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd, // Set page segmentation mode
}
};
// Define the OCR input image
using var ocrInput = new OcrInput("id1.png");
// Perform OCR on the input image
var ocrResult = ocrTesseract.Read(ocrInput);
// Display the extracted text
Console.WriteLine(ocrResult.Text);
}
}
using IronOcr;
class Program
{
public static void Main()
{
// Configure IronTesseract with language and other settings
var ocrTesseract = new IronTesseract()
{
Language = OcrLanguage.EnglishBest,
Configuration = new TesseractConfiguration()
{
ReadBarCodes = false, // Disable reading of barcodes
BlackListCharacters = "`ë|^", // Blacklist specific characters
PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd, // Set page segmentation mode
}
};
// Define the OCR input image
using var ocrInput = new OcrInput("id1.png");
// Perform OCR on the input image
var ocrResult = ocrTesseract.Read(ocrInput);
// Display the extracted text
Console.WriteLine(ocrResult.Text);
}
}
Imports IronOcr
Friend Class Program
Public Shared Sub Main()
' Configure IronTesseract with language and other settings
Dim ocrTesseract = New IronTesseract() With {
.Language = OcrLanguage.EnglishBest,
.Configuration = New TesseractConfiguration() With {
.ReadBarCodes = False,
.BlackListCharacters = "`ë|^",
.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd
}
}
' Define the OCR input image
Dim ocrInput As New OcrInput("id1.png")
' Perform OCR on the input image
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Display the extracted text
Console.WriteLine(ocrResult.Text)
End Sub
End Class
Obraz wejściowy
Poniżej znajduje się przykładowy obrazek używany jako dane wejściowe dla programu.

Wynik

Wyjaśnienie kodu
Powyższy kod wykorzystuje bibliotekę IronOCR do odczytania wszystkich pól tekstowych z dokumentu tożsamości. Używamy klasy IronTesseract z biblioteki IronOCR i konfigurujemy ją tak, aby używała języka angielskiego oraz uwzględniała niektóre znaki z czarnej listy. Następnie deklarujemy dane wejściowe OCR za pomocą klasy OcrInput i odczytujemy tekst z obrazu. Wyodrębnione pola tekstowe można zobaczyć w wynikach konsoli.
Krok 4: Odczytuj dokumenty tożsamości z plików PDF.
Możemy również odczytywać dane z dokumentów PDF. W tym celu możemy skorzystać z biblioteki IronPDF firmy IronSoftware. Najpierw zainstaluj bibliotekę w następujący sposób:
Install-Package IronOcr
using IronOcr;
using IronPdf;
class Program
{
public static void Main()
{
// Load the PDF document
var pdfReader = new PdfDocument("id1.pdf");
// Initialize IronTesseract for OCR
var ocrTesseract = new IronTesseract();
// Create OCR input from the PDF stream
using var ocrInput = new OcrInput();
ocrInput.AddPdf(pdfReader.Stream);
// Perform OCR on the PDF input
var ocrResult = ocrTesseract.Read(ocrInput);
// Display the extracted text
Console.WriteLine(ocrResult.Text);
}
}
using IronOcr;
using IronPdf;
class Program
{
public static void Main()
{
// Load the PDF document
var pdfReader = new PdfDocument("id1.pdf");
// Initialize IronTesseract for OCR
var ocrTesseract = new IronTesseract();
// Create OCR input from the PDF stream
using var ocrInput = new OcrInput();
ocrInput.AddPdf(pdfReader.Stream);
// Perform OCR on the PDF input
var ocrResult = ocrTesseract.Read(ocrInput);
// Display the extracted text
Console.WriteLine(ocrResult.Text);
}
}
Imports IronOcr
Imports IronPdf
Friend Class Program
Public Shared Sub Main()
' Load the PDF document
Dim pdfReader = New PdfDocument("id1.pdf")
' Initialize IronTesseract for OCR
Dim ocrTesseract = New IronTesseract()
' Create OCR input from the PDF stream
Dim ocrInput As New OcrInput()
ocrInput.AddPdf(pdfReader.Stream)
' Perform OCR on the PDF input
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Display the extracted text
Console.WriteLine(ocrResult.Text)
End Sub
End Class
Powyższy kod wykorzystuje IronPDF do załadowania dokumentu id1.pdf, a plik PDF jest przekazywany jako strumień do OcrInput i ocrTesseract.
Wynik

Licencjonowanie (dostępna bezpłatna wersja próbna)
Aby korzystać z IronOCR, potrzebny jest klucz licencyjny. Ten klucz należy umieścić w pliku appsettings.json.
{
"IRONOCR-LICENSE-KEY": "your license key"
}
Podaj adres e-mail użytkownika, aby otrzymać Licencję Trial.

Przykłady zastosowań
1. Weryfikacja tożsamości w usługach finansowych:
- Przykład zastosowania: Banki i instytucje finansowe wykorzystują OCR do odczytu dokumentów tożsamości, takich jak paszporty, prawa jazdy i dowody osobiste, podczas procesu rejestracji klientów i weryfikacji tożsamości (KYC).
- Korzyści: Zapewnia dokładną i wydajną weryfikację tożsamości podczas tworzenia kont, składania wniosków kredytowych i innych transakcji finansowych.
2. Kontrola graniczna i imigracja:
- Przykład zastosowania: Urzędy imigracyjne wykorzystują technologię OCR do odczytu i weryfikacji informacji z paszportów i wiz w punktach kontroli granicznej.
- Korzyści: usprawnia proces imigracji, zwiększa bezpieczeństwo i ogranicza błędy związane z ręcznym wprowadzaniem danych.
3. Kontrola dostępu i bezpieczeństwo:
- Przykład zastosowania: Technologia OCR jest wykorzystywana w systemach kontroli dostępu do odczytu informacji z kart identyfikacyjnych, identyfikatorów pracowników lub skanów twarzy w celu zapewnienia bezpiecznego wejścia do budynków lub obszarów o ograniczonym dostępie.
- Zalety: Zwiększa bezpieczeństwo, zapewniając dostęp wyłącznie upoważnionym osobom oraz udostępniając cyfrowy rejestr wpisów.
4. Usługi e-administracji:
- Przykład zastosowania: Agencje rządowe wykorzystują OCR do przetwarzania i weryfikacji dokumentów tożsamości przesyłanych online w celu uzyskania takich usług, jak przedłużenie prawa jazdy, składanie zeznań podatkowych i wniosków o zezwolenia.
- Korzyści: Zwiększa wydajność, ogranicza formalności i poprawia ogólne wrażenia obywateli.
5. Weryfikacja tożsamości w służbie zdrowia:
- Przykład zastosowania: Podmioty świadczące usługi opieki zdrowotnej wykorzystują OCR do odczytywania informacji z identyfikatorów pacjentów, kart ubezpieczeniowych i innych dokumentów tożsamości w celu prowadzenia dokładnej dokumentacji pacjentów.
- Korzyści: Ułatwia precyzyjną identyfikację pacjentów, zapewnia właściwe zarządzanie dokumentacją medyczną i wspiera procesy rozliczeniowe.
6. Zautomatyzowana rejestracja w hotelu:
- Przykład zastosowania: Hotele wdrażają OCR do automatyzacji procesów zameldowania poprzez skanowanie dokumentów tożsamości gości, usprawniając proces rejestracji.
- Korzyści: Poprawia komfort gości, skraca czas zameldowania i minimalizuje błędy przy rejestrowaniu danych gości.
7. Inteligentne miasta i usługi publiczne:
- Przykład zastosowania: Technologia OCR jest wykorzystywana w inicjatywach smart city do odczytu dokumentów tożsamości w celu korzystania z usług takich jak transport publiczny, członkostwo w bibliotece oraz rejestracja na wydarzenia miejskie.
- Korzyści: Zwiększa wydajność usług publicznych, ułatwia płynny dostęp i poprawia jakość życia w mieście.
8. Administracja edukacyjna:
- Przykład zastosowania: Instytucje edukacyjne wykorzystują OCR do przetwarzania i weryfikacji dokumentów tożsamości podczas rekrutacji studentów, egzaminów oraz wydawania świadectw akademickich.
- Korzyści: Zapewnia dokładność danych dotyczących studentów, zmniejsza obciążenie administracyjne i zwiększa integralność procesów akademickich.
Wnioski
Włączenie technologii OCR do aplikacji C# za pomocą IronOCR pozwala na wydajne wyciąganie informacji z dokumentów tożsamości. Ten kompleksowy przewodnik zawiera niezbędne instrukcje dotyczące konfiguracji projektu oraz korzystania z IronOCR do odczytu i przetwarzania obrazów dokumentów tożsamości. Wypróbuj przykłady kodu, aby dostosować proces ekstrakcji do swoich konkretnych wymagań, zapewniając płynne i zautomatyzowane rozwiązanie do obsługi danych z dokumentów tożsamości.
Często Zadawane Pytania
Jak wyodrębnić tekst z dokumentów tożsamości przy użyciu języka C#?
Korzystając z biblioteki IronOCR, specjalistycznej biblioteki OCR firmy IronSoftware, można wyodrębniać tekst z różnych dokumentów tożsamości, takich jak paszporty, dowody osobiste i prawa jazdy. IronOCR można zainstalować za pomocą menedżera pakietów NuGet w Visual Studio i wykorzystać jego metody do odczytu tekstu z obrazów i plików PDF.
Jakie są zalety stosowania OCR w przypadku dokumentów tożsamości?
Technologia OCR, taka jak IronOCR firmy IronSoftware, automatyzuje wyodrębnianie tekstu z dokumentów tożsamości, ograniczając ryzyko błędu ludzkiego i zwiększając wydajność pozyskiwania danych. Obsługuje wiele języków i formatów dokumentów, dzięki czemu idealnie nadaje się do zastosowań w finansach, służbie zdrowia i kontroli granicznej.
Jakie kroki należy wykonać, aby skonfigurować OCR w projekcie C#?
Aby skonfigurować OCR w projekcie C#, należy utworzyć nowy projekt w Visual Studio, zainstalować IronOCR za pomocą menedżera pakietów NuGet i wykorzystać jego API do odczytu tekstu z dokumentów. IronOCR zapewnia obszerną dokumentację i przykłady, które pomogą w integracji funkcji OCR.
Jak poprawić jakość obrazu, aby uzyskać lepsze wyniki OCR?
IronOCR zawiera funkcje takie jak Deskew, Denoise, Binarize, Enhance Resolution i Dilate, które służą do poprawy jakości obrazu. Filtry te zwiększają dokładność rozpoznawania tekstu z obrazów o niskiej jakości, zapewniając niezawodne wyodrębnianie danych.
Czy technologia OCR może odczytywać kody kreskowe z dokumentów tożsamości?
Tak, IronOCR obsługuje rozpoznawanie kodów kreskowych z dokumentów tożsamości. Potrafi odczytać ponad 20 rodzajów kodów kreskowych, w tym kody QR, co jest przydatne w aplikacjach wymagających zarówno ekstrakcji danych tekstowych, jak i kodów kreskowych.
Czy istnieją konkretne przypadki zastosowania OCR w weryfikacji tożsamości?
OCR jest szeroko stosowany w weryfikacji tożsamości w takich zastosowaniach, jak automatyczne odprawy, kontrola dostępu i usługi e-administracji. IronOCR zapewnia niezbędne narzędzia do wyodrębniania i weryfikacji tekstu z dokumentów tożsamości, zwiększając bezpieczeństwo i usprawniając procesy.
Jak mogę poradzić sobie z wielojęzycznym wyodrębnianiem tekstu za pomocą OCR?
IronOCR oferuje obsługę wielu języków, umożliwiając wyodrębnianie tekstu z dokumentów w różnych językach. Ta funkcja jest szczególnie przydatna w aplikacjach międzynarodowych, gdzie konieczne jest wydajne przetwarzanie dokumentów w różnych językach.
Czy dostępna jest wersja próbna bibliotek OCR?
IronOCR firmy Iron Software oferuje bezpłatną wersję próbną. Klucz licencji próbnej można uzyskać, podając adres e-mail, co pozwala zapoznać się z funkcjami biblioteki IronOCR przed podjęciem decyzji o zakupie.



