Reconnaissance de texte sur documents d'identité avec le logiciel OCR IronOCR
Les documents d'identité sont, de par leur conception, très difficiles à convertir image en texte pour les moteurs OCR en raison des protections anti-copie/anti-fraude — hologrammes, images en filigrane, bruit numérique variable, etc. — ajoutées à l'arrière-plan de la carte.
Cela ne veut pas dire que c'est impossible. Les résultats dépendront probablement de la qualité de l'image. Les formats d'image présentant moins de bruit numérique, tels que TIFF ou PNG, sont recommandés de préférence aux formats d'image à perte, tels que JPEG.
Veuillez également essayer les filtres d'optimisation d'image suivants :
- DeNoise () : Supprime le bruit numérique. Ce filtre ne doit être utilisé que lorsque du bruit est attendu. Il aplatit les canaux alpha en blanc.
- DeepCleanBackgroundNoise (): Effectue une suppression importante du bruit de fond. N'utilisez ce filtre que dans les cas où le bruit de fond du document est extrême, car il risque également de réduire la précision de la reconnaissance optique de caractères (OCR) des documents propres et consomme beaucoup de ressources processeur.
Vous pouvez également essayer les rectangles de recadrage : Exemple de rectangles de recadrage .

