Manejo de CAPTCHAs con IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

¿IronOCR lee los códigos captcha?

Esto es posible, pero no está garantizado.

La mayoría de los generadores de CAPTCHA están diseñados deliberadamente para engañar al software OCR y algunos incluso utilizan "Failing to be read by OCR Software" como Tesseract como prueba unitaria.

Los códigos captcha son, por definición, muy difíciles de leer para los motores de OCR. La resolución es muy baja y cada personaje está organizado de forma específica con ángulos y separaciones diferentes de los demás, junto con la inclusión de ruido de fondo variable.

Las imágenes en escala de grises con ruido de fondo eliminado tienen más éxito que las imágenes en color, pero aún así pueden resultar un reto:

-OcrInput.DeNoise() oOcrInput.DeepCleanBackgroundNoise() Filtro

-OcrInput.ToGrayScale() Filtro