IronOCR 이용한 CAPTCHA 처리

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR 캡차 코드를 읽을 수 있나요?

가능성은 있지만 보장할 수는 없습니다.

대부분의 CAPTCHA 생성기는 OCR 소프트웨어를 속이도록 의도적으로 설계되었으며, 일부는 Tesseract와 같은 OCR 소프트웨어에서 읽히지 않는 것을 단위 테스트로 사용하기도 합니다.

캡차 코드는 본질적으로 OCR 엔진이 읽기 매우 어렵습니다. 해상도가 매우 낮고, 각 문자는 다른 문자들과 서로 다른 각도와 간격을 두고 배치되어 있으며, 가변적인 배경 노이즈도 포함되어 있습니다.

배경 노이즈가 제거된 회색조 이미지는 컬러 이미지보다 더 나은 결과를 보여주지만, 여전히 어려움이 있을 수 있습니다.

다음은 OCR 결과 향상을 위해 CAPTCHA 이미지에서 노이즈를 제거하고 회색조로 변환하는 C# 코드 예시입니다.

using IronOcr;

class CaptchaReader
{
    static void Main(string[] args)
    {
        // Initialize the IronOCR engine
        var Ocr = new IronTesseract();

        // Create an OCR input object
        var Input = new OcrInput("captcha-image.jpg");

        // Apply noise reduction to improve OCR accuracy
        // This removes background noise while preserving text
        Input.DeNoise();

        // Optionally apply a deep clean for more aggressive noise removal
        Input.DeepCleanBackgroundNoise();

        // Convert the image to grayscale 
        // OCR works better on grayscale images compared to colored ones
        Input.ToGrayScale();

        // Perform OCR to extract text from the image
        var Result = Ocr.Read(Input);

        // Output the recognized text to the console
        Console.WriteLine(Result.Text);
    }
}
using IronOcr;

class CaptchaReader
{
    static void Main(string[] args)
    {
        // Initialize the IronOCR engine
        var Ocr = new IronTesseract();

        // Create an OCR input object
        var Input = new OcrInput("captcha-image.jpg");

        // Apply noise reduction to improve OCR accuracy
        // This removes background noise while preserving text
        Input.DeNoise();

        // Optionally apply a deep clean for more aggressive noise removal
        Input.DeepCleanBackgroundNoise();

        // Convert the image to grayscale 
        // OCR works better on grayscale images compared to colored ones
        Input.ToGrayScale();

        // Perform OCR to extract text from the image
        var Result = Ocr.Read(Input);

        // Output the recognized text to the console
        Console.WriteLine(Result.Text);
    }
}
$vbLabelText   $csharpLabel

설명:

  • IronOcr: 이 라이브러리는 이미지에서 텍스트를 읽는 데 사용됩니다.
  • OcrInput: 이 클래스는 OCR 처리에 사용되는 이미지 입력을 나타냅니다.
  • DeNoise: 이 메서드는 이미지의 배경 노이즈를 줄이는 데 사용됩니다.
  • DeepCleanBackgroundNoise: 기본 DeNoise이(가) 충분하지 않은 경우 더 공격적인 노이즈 감소를 위해 이 메서드를 사용합니다.
  • ToGrayScale: 이미지를 회색조로 변환하여 인식 정확성을 향상시킵니다.
  • Read: 이 메서드는 전처리된 이미지에서 텍스트를 추출하는 데 호출됩니다.
커티스 차우
기술 문서 작성자

커티스 차우는 칼턴 대학교에서 컴퓨터 과학 학사 학위를 취득했으며, Node.js, TypeScript, JavaScript, React를 전문으로 하는 프론트엔드 개발자입니다. 직관적이고 미적으로 뛰어난 사용자 인터페이스를 만드는 데 열정을 가진 그는 최신 프레임워크를 활용하고, 잘 구성되고 시각적으로 매력적인 매뉴얼을 제작하는 것을 즐깁니다.

커티스는 개발 분야 외에도 사물 인터넷(IoT)에 깊은 관심을 가지고 있으며, 하드웨어와 소프트웨어를 통합하는 혁신적인 방법을 연구합니다. 여가 시간에는 게임을 즐기거나 디스코드 봇을 만들면서 기술에 대한 애정과 창의성을 결합합니다.

시작할 준비 되셨나요?
Nuget 다운로드 5,525,971 | 버전: 2026.3 방금 출시되었습니다
Still Scrolling Icon

아직도 스크롤하고 계신가요?

빠른 증거를 원하시나요? PM > Install-Package IronOcr
샘플을 실행하세요 이미지가 검색 가능한 텍스트로 바뀌는 것을 확인해 보세요.