Traitement des CAPTCHA avec IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR lit-il les codes captcha ?

C'est possible, mais pas garanti.

La plupart des générateurs de CAPTCHA sont délibérément conçus pour tromper les logiciels de reconnaissance optique des caractères (OCR) et certains utilisent même l'expression "Échec de la lecture par un logiciel OCR", comme Tesseract, en tant que test unitaire.

Les codes Captcha sont par définition très difficiles à lire pour les moteurs OCR. La résolution est très faible et chaque personnage est organisé de manière spécifique, avec des angles et des écarts différents par rapport aux autres, ainsi que l'inclusion d'un bruit de fond variable.

Les images en niveaux de gris, débarrassées du bruit de fond, donnent de meilleurs résultats que les images en couleur, mais peuvent encore poser problème :