푸터 콘텐츠로 바로가기
IRONOCR 사용

C#으로 OCR 소프트웨어 데모를 만드는 방법

광학 문자 인식(OCR)은 스캔된 종이 문서, PDF, 디지털 파일 또는 디지털 카메라로 촬영한 인쇄 텍스트의 이미지를 포함한 다양한 문서 형식을 편집 가능하고 검색 가능한 기계로 인코딩된 텍스트 데이터로 변환하는 기술입니다.

IronOCR은 강력한 OCR 기능을 개발자에게 제공하는 훌륭한 OCR 엔진 라이브러리입니다. 이 기사에서는 OCR 소프트웨어 데모와 함께 IronOCR를 사용하여 OCR을 수행하는 방법을 코드 예제와 함께 탐색할 것입니다.

IronOCR이란 무엇입니까?

IronOCR는 C# 및 VB.NET 애플리케이션에서 광학 문자 인식을 용이하게 하기 위해 설계된 강력한 .NET 라이브러리입니다. 고급 알고리즘과 기계 학습 기술을 활용하여 IronOCR는 스캔된 PDF 파일, 이미지, PDF에서 텍스트와 콘텐츠를 정확하게 추출하여 프로그래밍 방식으로 이러한 파일을 처리하고 검색하고 분석하기 쉽게 합니다.

간단한 API와 광범위한 기능을 통해 개발자는 데이터를 자동으로 추출하고 문서 처리, 데이터 입력 및 콘텐츠 관리 작업을 자동화할 수 있도록 애플리케이션에 OCR 기능을 매끄럽게 통합할 수 있습니다. 비즈니스, 송장, 보고서, 자동 데이터 추출, 검색 가능한 PDF 또는 기타 텍스트가 풍부한 문서 작업이든 상관없이 IronOCR는 OCR 요구 사항을 효율적으로 처리할 수 있는 신뢰할 수 있는 솔루션을 제공합니다.

IronOCR 시작하기

코드 예제를 살펴보기 전에 NuGet 패키지 관리자를 통해 IronOCR을 설치해야 합니다. 패키지 관리자 콘솔에서 다음 명령을 실행하여 IronOCR을 설치할 수 있습니다:

Install-Package IronOcr

IronOCR로 OCR 수행

기본 텍스트 인식

IronOCR을 사용하여 기본 텍스트 인식을 수행하려면 다음 코드 조각을 사용할 수 있습니다:

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using (var ocrInput = new OcrInput("ocr.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);
            string recognizedText = ocrResult.Text;
            Console.WriteLine(recognizedText);
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using (var ocrInput = new OcrInput("ocr.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);
            string recognizedText = ocrResult.Text;
            Console.WriteLine(recognizedText);
        }
    }
}
$vbLabelText   $csharpLabel

이 코드는 IronOCR을 사용하여 'ocr.png'이라는 이미지 파일에서 광학 문자 인식 (OCR)을 수행합니다. 이를 초기화하는 IronTesseract 객체와 이미지 파일의 텍스트 레이어를 읽어오는 OcrInput 객체입니다.

그런 다음 OCR 결과를 recognizedText로 가져와 콘솔에 출력합니다.

출력
- LOGO SHOP
- LOREM IPSUM
- DOLOR SITAMET CONSECTETUR
- ADIPISCING ELIT
- 1 LOREM IPSUM $3.20
- 2 ORNARE MALESUADA $9.50
- 3 PORTA FERMENTUM $5.90
- 4 SODALES ARCU $6.00
- 5 ELEIFEND $9.00
- 6 SEMNISIMASSA $0.50
- 7 DUIS FAMES DIS $7.60
- 8 FACILISIRISUS $810
- TOTAL AMOUNT $49.80
- CASH $50.00

고급 OCR 옵션

IronOCR은 이미지 파일과 요구 사항에 따라 OCR 프로세스를 사용자 정의할 수 있는 다양한 옵션을 제공합니다. 예를 들어, OCR 언어를 지정하거나 이미지 전처리 설정을 조정하거나 텍스트 정리를 활성화할 수 있습니다. 다음은 이러한 고급 옵션 중 일부를 보여주는 예입니다:

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\image.png");

        // Set OCR language to English
        ocr.Language = OcrLanguage.English;

        // Enable text cleaning and enhance the resolution
        ocrInput.DeNoise();
        ocrInput.EnhanceResolution(225);

        var result = ocr.Read(ocrInput);
        if (!string.IsNullOrEmpty(result.Text))
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\image.png");

        // Set OCR language to English
        ocr.Language = OcrLanguage.English;

        // Enable text cleaning and enhance the resolution
        ocrInput.DeNoise();
        ocrInput.EnhanceResolution(225);

        var result = ocr.Read(ocrInput);
        if (!string.IsNullOrEmpty(result.Text))
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
$vbLabelText   $csharpLabel

코드는 'images' 폴더에 있는 'image.png'라는 이미지 파일에서 IronOCR을 사용하여 OCR을 수행합니다. OCR 언어를 영어로 설정하고 이미지 노이즈를 제거하며 해상도를 향상시킵니다. 이미지에서 인식된 텍스트가 추출되어 콘솔에 출력됩니다.

 C#에서 OCR 소프트웨어 데모 만들기: 그림 1

바코드 읽기

IronOCR은 바코드 읽기도 지원하여 이미지에서 바코드 정보를 추출할 수 있는 소프트웨어를 만들 수 있습니다. 다음은 IronOCR을 사용하여 바코드를 읽는 방법을 보여주는 코드 예제입니다:

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        ocrTesseract.Configuration.ReadBarCodes = true;

        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\imageWithBarcode.png");

        var ocrResult = ocrTesseract.Read(ocrInput);
        foreach (var barcode in ocrResult.Barcodes)
        {
            Console.WriteLine(barcode.Value);
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        ocrTesseract.Configuration.ReadBarCodes = true;

        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\imageWithBarcode.png");

        var ocrResult = ocrTesseract.Read(ocrInput);
        foreach (var barcode in ocrResult.Barcodes)
        {
            Console.WriteLine(barcode.Value);
        }
    }
}
$vbLabelText   $csharpLabel

'images' 폴더에 있는 'imageWithBarcode.png'라는 이미지 파일에서 IronOCR을 사용하여 바코드를 감지하고 읽습니다. IronOCR에서 ReadBarCodes를 true로 설정하여 바코드 읽기를 가능하게 합니다. 감지된 바코드 값이 콘솔에 출력됩니다.

 C#에서 OCR 소프트웨어 데모 만들기: 그림 2

PDF 텍스트 추출

IronOCR은 PDF 및 스캔된 문서에서도 텍스트를 추출할 수 있습니다. 다음은 IronOCR을 사용하여 PDF 파일에서 텍스트를 추출하는 방법을 보여주는 코드 예제입니다:

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using var ocrInput = new OcrInput();

        // OCR entire document
        ocrInput.LoadPdf("Email_Report.pdf");

        // Alternatively OCR selected page numbers
        int[] pages = { 1, 2, 3, 4, 5 };
        ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");

        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using var ocrInput = new OcrInput();

        // OCR entire document
        ocrInput.LoadPdf("Email_Report.pdf");

        // Alternatively OCR selected page numbers
        int[] pages = { 1, 2, 3, 4, 5 };
        ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");

        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
}
$vbLabelText   $csharpLabel

코드는 'Email_Report.pdf'라는 PDF 문서에서 IronOCR을 사용하여 OCR 처리를 수행합니다. 이를 통해 전체 문서를 LoadPdf를 사용하여 OCR 할 수 있으며, 'example.pdf'의 특정 페이지는 비밀번호와 함께 LoadPdfPages를 사용하여 가능합니다. OCR 작업에서 인식된 텍스트가 콘솔에 출력됩니다.

 C#에서 OCR 소프트웨어 데모 만들기: 그림 3

결론

IronOCR은 개발자가 응용 프로그램에서 OCR 작업을 쉽게 수행할 수 있도록 고급 OCR 소프트웨어 기능을 제공하는 강력한 .NET 라이브러리입니다. 이 글에서는 IronOCR을 사용하여 기본 및 고급 OCR 소프트웨어 데모를 어떻게 수행하는지 코드 예제와 함께 살펴보았습니다.

.NET 프로젝트를 진행 중이고 OCR 기능을 통합해야 한다면 IronOCR은 여러 OCR 엔진을 고려할 때 Definitely 고려할 가치가 있습니다. 사용의 용이성, 속도, 유연성 및 방대한 문서화 덕분에 개발자들 사이에서 OCR 자동화 작업에 인기 있는 선택입니다.

왜 IronOCR을 시도해보지 않고 자신의 OCR 프로젝트 개발 프로세스를 어떻게 단순화할 수 있는지 보지 않으시겠습니까? 해당 프로젝트에 가장 적합한 OCR 엔진일 수 있습니다.

IronOCR는 무료 체험판 라이선스를 제공하고, $799 USD부터 시작하여 프로젝트에서 IronOCR을 최대한 활용할 수 있습니다.

IronOCR에 대해 더 알고 싶으시다면 여기를 방문하세요.

자주 묻는 질문

C#에서 OCR을 어떻게 수행할 수 있나요?

IronOCR 라이브러리를 사용하면 C#에서 OCR을 수행할 수 있습니다. 먼저 NuGet 패키지 관리자에서 Install-Package IronOcr 명령어를 사용하여 IronOCR을 설치합니다. 그런 다음 IronTesseract 객체를 사용하여 이미지나 PDF에서 텍스트를 읽어 편집 가능한 텍스트로 변환할 수 있습니다.

C#을 사용하여 이미지에서 텍스트를 추출하는 데에는 어떤 단계가 포함되나요?

C#에서 이미지에서 텍스트를 추출하려면 IronOCR 사용합니다. IronTesseract 객체의 인스턴스를 생성한 다음, 'ocr.png'와 같은 이미지를 불러와 Read() 메서드를 호출하여 이미지를 처리하고 텍스트를 추출합니다.

IronOCR 에서 OCR 프로세스를 사용자 지정할 수 있나요?

네, IronOCR 사용하면 OCR 언어 설정, 노이즈 감소를 위한 이미지 전처리 활성화, 정확도 향상을 위한 해상도 조정 등 다양한 옵션을 설정하여 OCR 프로세스를 사용자 지정할 수 있습니다.

IronOCR 로 바코드를 읽을 수 있습니까?

네, IronOCR 바코드 읽기를 지원합니다. OCR 설정에서 바코드 읽기 기능을 활성화하면 이미지에서 바코드 정보를 감지하고 추출하도록 구성할 수 있습니다.

C#을 사용하여 PDF에서 텍스트를 추출하는 방법은 무엇인가요?

IronOCR 사용하면 C#에서 PDF 파일에서 텍스트를 추출할 수 있습니다. PDF 파일을 IronTesseract에 로드하고 Read() 메서드를 사용하여 텍스트를 추출함으로써 전체 문서 또는 특정 페이지만 OCR 처리할 수 있습니다.

IronOCR 개발자에게 추천할 만한 선택인 이유는 무엇일까요?

IronOCR 포괄적인 OCR 기능, 사용 편의성, 빠른 처리 속도 및 유연성 덕분에 개발자에게 추천할 만한 도구입니다. .NET 프로젝트에 완벽하게 통합되어 OCR 작업을 효율적으로 자동화할 수 있습니다.

IronOCR 에 사용할 수 있는 라이선스 옵션이 있습니까?

IronOCR 무료 평가판을 포함하여 다양한 라이선스 옵션을 제공합니다. 개발자는 IronOCR의 모든 기능을 애플리케이션에서 계속 사용하기 위해 다양한 라이선스 중에서 선택할 수 있습니다.

IronOCR 사용 예제 코드는 어디에서 찾을 수 있나요?

IronOCR 사용 예제 코드는 'C#으로 구현한 OCR 소프트웨어 데모(개발자 튜토리얼)' 문서에서 확인할 수 있습니다. 이 예제들은 기본적인 텍스트 인식, 고급 OCR 옵션, 바코드 읽기 기능을 보여줍니다.

칸나오팟 우돈판트
소프트웨어 엔지니어
카나팟은 소프트웨어 엔지니어가 되기 전 일본 홋카이도 대학교에서 환경 자원학 박사 학위를 취득했습니다. 학위 과정 중에는 생물생산공학과 소속 차량 로봇 연구실에서 활동하기도 했습니다. 2022년에는 C# 기술을 활용하여 Iron Software의 엔지니어링 팀에 합류했고, 현재 IronPDF 개발에 집중하고 있습니다. 카나팟은 IronPDF에 사용되는 대부분의 코드를 직접 작성하는 개발자로부터 배울 수 있다는 점에 만족하며, 동료들과의 소통을 통해 배우는 것 외에도 Iron Software에서 일하는 즐거움을 누리고 있습니다. 코딩이나 문서 작업을 하지 않을 때는 주로 PS5로 게임을 하거나 The Last of Us를 다시 시청하는 것을 즐깁니다.

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me