Reading Identity Documents with IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

Les documents d'identité sont, par conception, très difficiles à lire pour les moteurs OCR en raison de la protection anti-copie/fraude - hologrammes, images en filigrane, bruit numérique variable, etc.

Cela ne veut pas dire que c'est impossible. Les résultats dépendront probablement de la qualité de l'image. Les formats d'image avec moins de bruit numérique, tels que TIFF ou PNG, sont recommandés par rapport aux formats d'image lossy, tels que JPEG.

Veuillez également essayer les filtres d'optimisation d'image suivants :

  • DeNoise() : Supprime le bruit numérique. Ce filtre ne doit être utilisé que lorsque du bruit est attendu. Il aplatit les canaux Alpha en blanc.
  • DeepCleanBackgroundNoise() : Supprime les bruits de fond importants. N'utilisez ce filtre que dans les cas où un bruit de fond extrême est connu, car ce filtre risque également de réduire la précision de l'OCR des documents propres et est très coûteux pour l'unité centrale.

Vous pouvez également essayer de recadrer les rectangles : Exemple de recadrage de rectangles.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Prêt à commencer?
Nuget Téléchargements 5,044,537 | Version : 2025.11 vient de sortir