Odczytywanie dokumentów tożsamości za pomocą IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

Dokumenty tożsamości, z założenia, są bardzo trudne do odczytania przez silniki OCR ze względu na zastosowane zabezpieczenia przed kopiowaniem/oszustwami -- hologramy, znaki wodne, zmienny szum cyfrowy itp. -- dodawane do tła karty.

Nie oznacza to jednak, że jest to niemożliwe. Wyniki będą prawdopodobnie zależeć od jakości obrazu. Formaty obrazów z mniejszym szumem cyfrowym, takie jak TIFF lub PNG, są zalecane zamiast stratnych formatów obrazów, takich jak JPEG.

Proszę również wypróbować następujące filtry optymalizacji obrazu:

  • DeNoise(): Usuwa szum cyfrowy. Ten filtr powinien być używany tylko tam, gdzie oczekuje się szumu. Spłaszcza kanały alpha do bieli.
  • DeepCleanBackgroundNoise(): Wykonuje ciężkie usuwanie szumu tła. Używaj tego filtru tylko w przypadkach, gdy znany jest ekstremalny szum tła dokumentów, ponieważ ten filtr może również zmniejszyć dokładność OCR czystych dokumentów i jest bardzo obciążający dla procesora.

Możesz również spróbować prostokątnych przycięć: Przykład prostokątnych przycięć.

Curtis Chau
Autor tekstów technicznych

Curtis Chau posiada tytuł licencjata z informatyki (Uniwersytet Carleton) i specjalizuje się w front-endowym rozwoju, z ekspertką w Node.js, TypeScript, JavaScript i React. Pasjonuje się tworzeniem intuicyjnych i estetycznie przyjemnych interfejsów użytkownika, Curtis cieszy się pracą z nowoczesnymi frameworkami i tworzeniem dobrze zorganizowanych, atrakcyjnych wizualnie podrę...

Czytaj więcej
Gotowy, aby rozpocząć?
Nuget Pliki do pobrania 5,571,678 | Wersja: 2026.4 just released
Still Scrolling Icon

Wciąż przewijasz?

Czy chcesz szybko dowodu? PM > Install-Package IronOcr
uruchom próbkę obserwuj, jak twój obraz staje się tekstem z możliwością wyszukiwania.