푸터 콘텐츠로 바로가기
다른 구성 요소와 비교

IronOCR 과 Asprise OCR 비교

OCR에 대해 말할 때, 그 의미는 광학 문자 인식을 말합니다. 이 용어는 종종 비즈니스 세계에서 이미지 또는 텍스트 기반 문서(예: 스캔하거나 팩스한 페이지)를 편집 가능한 워드 형식이나 텍스트 검색 가능한 문서 형식으로 변환하기 위한 프로세스를 의미합니다.

OCR은 Optical Character Recognition(광학 문자 인식)의 약자로, 이 목적을 위해 특별히 설계된 컴퓨터 소프트웨어가 수행하는 작업입니다. 이 유형의 소프트웨어는 페이지를 스캔하고 거기에 있는 텍스트 정보를 인식하여 디지털 형식으로 변환하여 품질 손실 없이 디지털로 편집 및 재생산할 수 있도록 합니다.

OCR에는 많은 응용 프로그램이 있지만, 가장 인기있는 사용 사례는 스캔된 문서를 데이터베이스에 포맷하고 인덱싱하며 분석할 수 있는 디지털 파일로 변환하는 것입니다.

이 기사에서는 OCR 및 PDF 문서 이미지를 위한 가장 일반적인 라이브러리와 애플리케이션 둘을 비교할 예정입니다. 다음과 같습니다:

  • Asprise OCR
  • IronOCR

1.0 서론

1.1 Asprise OCR 소개 및 기능

Asprise C# .NET OCR(광학 문자 인식) 및 바코드 인식 SDK는 C# .NET 애플리케이션(Windows 애플리케이션, Silverlight, ASP.NET 웹 서비스 애플리케이션, ActiveX 컨트롤 등)에서 스캔된 문서에서 텍스트 및 바코드 정보를 추출하는 기능을 부여하기 위한 고성능 API 라이브러리를 제공합니다.

이미지(JPEG, PNG, TIFF, PDF 등 다양한 형식)를 편집 가능한 문서 형식(워드, XML, 검색 가능한 PDF 등)으로 변환할 수 있습니다. Asprise 이미지 스캐닝 SDK(스캐너에서 문서를 캡처하는)를 비롯한 다른 제공 제품과 함께 전체 문서 관리 솔루션을 쉽게 구현할 수 있습니다.

Asprise OCR의 기능

정확한 텍스트 인식 향상된 이미지 처리 및 텍스트 감지 알고리즘 덕분에 Asprise OCR은 이미지 품질이 나쁜 어려운 문서도 쉽게 인식할 수 있습니다. 정확성을 속도보다 약간 우선시하도록 매개변수를 사용할 수 있습니다.

고속 OCR 엔진 Asprise OCR은 최적화된 OCR 엔진을 사용하여 짧은 시간 내에 우수한 인식을 수행합니다. 멀티 스레딩 및 선택적인 GPU 가속을 통해 속도를 더욱 향상시킬 수 있습니다.

20개 이상의 언어 지원 Asprise OCR은 영어, 스페인어, 프랑스어, 독일어, 이탈리아어, 헝가리어, 핀란드어, 스웨덴어, 루마니아어, 폴란드어, 말레이어, 아랍어, 인도네시아어, 러시아어 등 20개 이상의 언어를 인식합니다.

모든 인기 있는 바코드 형식 모든 인기 있는 바코드 형식을 지원합니다: EAN-8, EAN-13, UPC-A, UPC-E, ISBN-10, ISBN-13, Interleaved 2 of 5, Code 39, Code 128, PDF417, 및 QR 코드.

이미지를 검색 가능한 PDF로 몇 줄의 코드로 JPEG, PNG, TIFF, PDF 등의 다양한 형식의 이미지를 검색 가능한 PDF 파일로 변환할 수 있습니다.

쉽게 배포 소프트웨어 보호 동글이나 라이선스 서버가 필요하지 않습니다. Asprise OCR SDK의 배포는 개발하는 것만큼 간단합니다.

예산 친화적이며, 로열티 프리 로열티 프리란 개발 라이선스를 주문할 때만 요금을 지불하면 되며, 소프트웨어를 수천 대의 서버나 엔드 유저에게 배포할 때 추가 요금을 지불할 필요가 없다는 것을 의미합니다.

수상 경력의 지원 그들의 팀은 친절할 뿐만 아니라, 일류 기술 지원을 제공할 역량도 갖추고 있습니다.

1.2 IronOCR — 소개 및 기능

IronOCR는 .NET 애플리케이션 및 웹사이트에서 .NET용 IronOCR을 사용하여 사진 및 PDF에서 텍스트 내용을 읽는 소프트웨어를 엔지니어에게 제공합니다. 이 프로그램은 사진의 텍스트 및 바코드를 스캔하며 다양한 전 세계 언어를 지원합니다; 그런 다음 출력은 평문 텍스트 또는 구조화된 데이터로 제공할 수 있습니다. Iron Software의 OCR 라이브러리는 MVC, 웹, 콘솔 및 데스크톱 .NET 애플리케이션에서 사용할 수 있습니다. 상업적 배포를 위해 개발 팀의 직접적인 지원하에 라이선스가 제공됩니다.

  • 최신 Tesseract 5 엔진을 사용하여, IronOCR는 모든 사진이나 PDF 형식에서 텍스트, 바코드 및 QR 코드를 읽어들입니다. 이 라이브러리는 데스크톱, 콘솔 및 웹 애플리케이션에 OCR을 빠르게 추가합니다.
  • IronOCR는 125개의 국제 언어를 지원합니다. 또한 맞춤 언어 및 단어 목록을 지원합니다.
  • IronOCR는 20개 이상의 바코드 형식 및 QR 코드를 읽을 수 있습니다.
  • IronOCR는 다중 페이지 GIF 및 TIFF 이미지 포맷을 지원합니다.
  • IronOCR는 저품질 스캔 이미지에 대한 보정을 제공합니다.
  • IronOCR는 멀티스레딩을 지원합니다 — 하나 이상의 프로세스를 동시에 실행합니다.
  • IronOCR는 페이지, 단락, 줄, 단어, 문자 등의 구조화된 데이터 출력을 제공합니다.
  • IronOCR는 Windows, Linux, macOS 등 다양한 운영 체제를 지원합니다.

2.0 Visual Studio에서 새로운 프로젝트 생성하기

Visual Studio 소프트웨어를 열고 '파일 메뉴'로 이동하세요. '새 프로젝트'를 선택한 다음 '콘솔 응용 프로그램'을 선택하세요.

Abbyy Finereader Ocr Alternatives 1 related to 2.0 Visual Studio에서 새로운 프로젝트 생성하기

프로젝트 이름을 입력하고 적절한 텍스트 상자에서 파일 경로를 선택합니다. 그런 다음, 생성 버튼을 클릭하고 아래 스크린샷처럼 필요한 .NET Framework를 선택하세요.

Abbyy Finereader Ocr Alternatives 2 related to 2.0 Visual Studio에서 새로운 프로젝트 생성하기

Visual Studio 프로젝트가 이제 선택한 애플리케이션의 구조를 생성합니다. 콘솔, Windows, 웹 애플리케이션을 선택한 경우에는 Program.cs 파일이 열리며, 여기서 코드를 입력하고 애플리케이션을 빌드/실행할 수 있습니다.

Abbyy Finereader Ocr Alternatives 3 related to 2.0 Visual Studio에서 새로운 프로젝트 생성하기

다음으로, 코드를 테스트하기 위해 라이브러리를 추가할 수 있습니다.

3.0 설치

3.1 Asprise OCR 설치

We can download the Asprise OCR here.

There are two options: install using NuGet or manually download the SDK from asprise.com.

옵션 1: NuGet PM> Install-Package asprise-ocr-api

먼저 새로운 Visual C#/Visual Basic Windows Form Application 프로젝트를 생성하거나 기존 프로젝트를 사용합니다. With this solution opened, open the NuGet Package Manager Console and type the following command:

Install-Package asprise-ocr-api

완료되면 다음 코드를 Program.cs에 복사하여 OCR 데모 폼을 불러올 수 있습니다 (C#용):

using System;
using System.Windows.Forms;
using asprise_ocr_api;

static class Program
{
    // Main application entry point
    [STAThread]
    static void Main()
    {
        // Enable visual styles and set text rendering mode
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);

        // Launch the OCR sample form
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
using System;
using System.Windows.Forms;
using asprise_ocr_api;

static class Program
{
    // Main application entry point
    [STAThread]
    static void Main()
    {
        // Enable visual styles and set text rendering mode
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);

        // Launch the OCR sample form
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
$vbLabelText   $csharpLabel

옵션 2: Asprise.com에서 OCR SDK 다운로드하기

Download a copy of the Asprise OCR SDK from www.asprise.com/product/ocr. 빈 폴더에 압축을 해제하면 됩니다.

Asprise OCR SDK 배포의 파일 구조는 다음과 같습니다:

OCR SDK
|--- aocr.dll, aocr_x64.dll [필수 DLL]
|--- sample-projects        [.NET API 및 샘플 프로젝트]
+--- images                 [샘플 이미지]

sample-projects 폴더로 이동하여 솔루션을 엽니다: ocr-samples-vs.sln. 두 개의 프로젝트가 있습니다:

  • asprise-ocr-api: .NET OCR API
  • asprise-ocr-api-sample: 데모 프로그램

asprise-ocr-api-sample 프로젝트를 마우스 오른쪽 버튼으로 클릭하고 "시작 프로젝트로 설정"을 선택한 후, '시작' 버튼을 누르거나 F5를 눌러 동일한 UI를 확인합니다.

3.2 IronOCR 설치

IronOCR 라이브러리는 네 가지 방법으로 다운로드 및 설치할 수 있습니다.

다음과 같습니다:

  • Visual Studio 사용하기
  • Visual Studio 명령줄 사용하기
  • NuGet 웹사이트에서 직접 다운로드
  • IronPDF 웹사이트에서 직접 다운로드

3.2.1 Visual Studio 사용하기

Visual Studio 소프트웨어는 솔루션에 패키지를 직접 설치하기 위한 NuGet 패키지 관리자 옵션을 제공합니다. 아래 스크린샷은 NuGet 패키지 관리자를 여는 방법을 보여줍니다.

Abbyy Finereader Ocr Alternatives 6 related to 3.2.1 Visual Studio 사용하기

NuGet 웹사이트의 패키지 목록을 표시하기 위한 검색 상자를 제공합니다. 패키지 관리자에서 아래 스크린샷처럼 IronOCR 키워드를 검색해야 합니다:

Abbyy Finereader Ocr Alternatives 7 related to 3.2.1 Visual Studio 사용하기

위 이미지에서 관련 검색 항목 목록을 얻을 수 있습니다. 솔루션에 패키지를 설치하기 위해 필요한 옵션을 선택해야 합니다.

3.2.2 Visual Studio 명령줄 사용하기

Visual Studio에서 도구 -> NuGet 패키지 관리자 -> 패키지 관리자 콘솔로 이동합니다

패키지 관리자 콘솔 탭에 다음 줄을 입력하세요:

Install-Package IronOcr

다음으로, 패키지가 현재 프로젝트에 다운로드/설치되어 사용할 준비가 됩니다.

3.2.3 NuGet 웹사이트에서 직접 다운로드

세 번째 방법은 웹사이트에서 NuGet 패키지를 직접 다운로드하는 것입니다.

  • Navigate to the Link.
  • 오른쪽 메뉴에서 다운로드 패키지 옵션을 선택합니다.
  • 다운로드된 패키지를 더블 클릭합니다. 자동으로 설치됩니다.
  • 다음, 솔루션을 다시 로드하고 프로젝트에서 사용을 시작합니다.

3.2.4 IronOCR 웹사이트에서 직접 다운로드

Click the link here to download the latest package direct from the website. Once downloaded, follow the steps below to add the package to the project.

  • 솔루션 창에서 프로젝트를 마우스 오른쪽 버튼으로 클릭합니다.
  • 그런 다음 참조 옵션을 선택하고 다운로드된 참조의 위치를 찾아 봅니다.
  • 다음, 확인을 클릭하여 참조를 추가합니다.

4.0 OCR 이미지

IronOCR와 Asprise OCR 모두 이미지를 텍스트로 변환하는 OCR 기술을 가지고 있습니다.

4.1 Asprise 사용하기

다음 코드는 Asprise OCR의 기본 사용법을 보여줍니다.

using System;
using asprise_ocr_api;

class Example
{
    static void Main()
    {
        // Set up OCR engine
        AspriseOCR.SetUp();
        AspriseOCR ocr = new AspriseOCR();
        ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);

        // Recognize text from the given image
        string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, 
            AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);

        // Output the recognized text to the console
        Console.WriteLine("OCR Result: " + s);

        // Stop the OCR engine
        ocr.StopEngine();
    }
}
using System;
using asprise_ocr_api;

class Example
{
    static void Main()
    {
        // Set up OCR engine
        AspriseOCR.SetUp();
        AspriseOCR ocr = new AspriseOCR();
        ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);

        // Recognize text from the given image
        string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, 
            AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);

        // Output the recognized text to the console
        Console.WriteLine("OCR Result: " + s);

        // Stop the OCR engine
        ocr.StopEngine();
    }
}
$vbLabelText   $csharpLabel

Asprise OCR은 GIF, PNG, JPEG, TIFF 및 PDF 이미지 포맷을 지원합니다. 위 섹션의 샘플 OCR 코드의 입력은 다음과 같습니다:

Asprise Ocr Alternatives 6 related to 4.1 Asprise 사용하기

OCR 출력은 일반 텍스트 형식으로 제공됩니다:

Asprise OCR 및 바코드 인식

Windows에서 고성능, 로열티 무료 OCR 및 바코드 인식
...
ISBN-13, Interleaved 2 of 5, Code 39, Code 128, PDF417, 및 QR 코드.

[[QR-Code: www.asprise.com]]
[[CODE-128: Asprise]].

마지막 두 줄은 바코드 정보 추출을 나타냅니다. 참고: 바코드의 형식과 내용 모두 '[[ ]]' 쌍으로 둘러싸여 있습니다.

4.2 IronOCR 사용하기

using System;
using IronOcr;

class Example
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();
        Ocr.Language = OcrLanguage.EnglishBest;

        // Specify to use Tesseract 5 engine
        Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

        // Create OcrInput to hold the images
        using (var Input = new OcrInput())
        {
            // Add an image to the OcrInput
            Input.AddImage(@"3.png");

            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Output the recognized text to the console
            Console.WriteLine(Result.Text);
            Console.ReadKey();
        }
    }
}
using System;
using IronOcr;

class Example
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();
        Ocr.Language = OcrLanguage.EnglishBest;

        // Specify to use Tesseract 5 engine
        Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

        // Create OcrInput to hold the images
        using (var Input = new OcrInput())
        {
            // Add an image to the OcrInput
            Input.AddImage(@"3.png");

            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Output the recognized text to the console
            Console.WriteLine(Result.Text);
            Console.ReadKey();
        }
    }
}
$vbLabelText   $csharpLabel

이미지 파일을 텍스트로 변환할 수 있는 Tesseract 5 API가 위에 설명되어 있습니다. 위 코드 줄에서 Iron Tesseract에 대한 객체를 만들고 있습니다. 하나 이상의 이미지 파일을 추가할 수 있는 OcrInput 객체를 만들고 있습니다. OcrInput 객체 메서드 add를 사용할 때 코드 내에 사용 가능한 이미지 경로를 제공해야 할 수도 있습니다. 얼마든지 많은 이미지를 추가할 수 있습니다. 우리가 이전에 구성한 객체 IronTesseract의 함수 Read을 사용하여 이미지 파일을 분석하고 결과를 OCR 결과에 추출할 수 있습니다. 사진에서 텍스트를 추출하여 문자열로 변환할 수 있습니다.

우리는 또한 다중 프레임 이미지를 추가하기 위해 Tesseract를 사용할 수 있습니다. "AddMultiFrameTiff"는 이 작업을 위한 다른 메소드입니다. Tesseract 라이브러리는 이미지의 각 프레임을 읽으며, 각 프레임은 개별 페이지로 처리됩니다. 이 프로세스는 이미지의 첫 번째 프레임을 읽고 다음 프레임으로 진행하며, 이미지의 모든 프레임이 스캔될 때까지 계속됩니다. 이 메서드는 TIFF 이미지 형식만 지원합니다.

Asprise Ocr Alternatives 7 related to 4.2 IronOCR 사용하기

위의 이미지는 IronOCR 결과의 출력이며, 데이터가 정확히 변경 가능한 텍스트로 변환되었습니다.

5.0 OCR PDF 파일

IronOCR와 Asprise OCR은 PDF 파일을 변경 가능한 텍스트로 변환합니다. Asprise OCR은 페이지 저장, 이미지 편집, 페이지 인식 등 사용자에게 다양한 옵션을 제공합니다. 또한 텍스트, 문서, HTML 포맷 등으로 저장 옵션을 제공합니다. IronOCR도 변환된 OCR 파일을 HTML, 텍스트, PDF 등으로 저장할 수 있습니다.

5.1 Asprise OCR 사용하기

출력 형식을 OUTPUT_FORMAT_PDF로 설정한 경우, 대상 PDF 출력 파일을 다음과 같이 지정해야 합니다:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf|PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf|PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
$vbLabelText   $csharpLabel

위 코드에서 속성은 으로 구분된 단일 문자열로 지정됩니다.|(with key and value separated by =). 대안으로, 속성을 쌍으로 별도로 지정할 수 있습니다:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
$vbLabelText   $csharpLabel

텍스트를 보이지 않거나 투명하게 만들려면 PROP_PDF_OUTPUT_TEXT_VISIBLE을 "false"로 설정하면 됩니다. 일반 PDF와 PDF/A 모두 지원됩니다. Asprise OCR 속성 요약을 참조하십시오. 출력 형식을 OUTPUT_FORMAT_RTF로 설정합니다. 그 후 대부분의 워드 프로세서(Microsoft Word, Libre Office, TextEdit 등)에서 편집할 수 있는 .rtf 파일을 출력할 수 있습니다.

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
$vbLabelText   $csharpLabel

OCR이 완료되면 워드 프로세서로 RTF 파일을 보거나 편집할 수 있습니다:

Asprise Ocr Alternatives 8 related to 5.1 Asprise OCR 사용하기

다음 방법을 사용하여 PDF 입력 파일에서 OCR을 수행하십시오:

Asprise Ocr Alternatives 9 related to 5.1 Asprise OCR 사용하기

5.2 IronOCR 사용하기

우리는 또한 OCRInput을 사용하여 PDF 파일을 관리할 수 있습니다. 모든 문서의 페이지는 Iron Tesseract 클래스에 의해 읽힙니다. 그 후에 텍스트가 페이지에서 추출됩니다. PDF 파일을 문서 목록에 추가할 수 있는 AddPdf라는 두 번째 기능을 사용하여 보호된 문서를 열 수도 있습니다 (비밀번호가 있을 경우). 다음 코드는 비밀번호로 보호된 PDF 문서를 여는 방법을 보여줍니다:

using IronOcr;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Add a password protected PDF
    Input.AddPdf("example.pdf", "password");

    // Read the PDF document
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Add a password protected PDF
    Input.AddPdf("example.pdf", "password");

    // Read the PDF document
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

우리는 PDF 문서의 단일 페이지에서 내용을 읽고 추출할 수 있습니다 AddpdfPage을 사용하여. 텍스트를 추출하려는 페이지 번호만 지정하면 됩니다. AddPdfPage은 우리가 지정한 여러 페이지에서 텍스트를 추출할 수 있도록 합니다. IEnumerable<int>에서 우리는 여러 페이지를 쉽게 지정할 수 있습니다. 파일 위치와 파일 확장을 포함해야 합니다. 이는 다음 코드 예제에서 보여집니다:

using IronOcr;
using System.Collections.Generic;

IEnumerable<int> numbers = new List<int> {2, 8, 10};
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Extract single page
    Input.AddPdfPage("example.pdf", 10);

    // Extract multiple pages
    Input.AddPdfPages("example.pdf", numbers);

    // Read the pages and extract content
    var Result = Ocr.Read(Input);

    // Output the recognized text and save to a text file
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
using IronOcr;
using System.Collections.Generic;

IEnumerable<int> numbers = new List<int> {2, 8, 10};
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Extract single page
    Input.AddPdfPage("example.pdf", 10);

    // Extract multiple pages
    Input.AddPdfPages("example.pdf", numbers);

    // Read the pages and extract content
    var Result = Ocr.Read(Input);

    // Output the recognized text and save to a text file
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
$vbLabelText   $csharpLabel

SaveAsTextFile 기능을 사용하여 결과를 텍스트 파일로 저장할 수 있으며, 이를 출력 디렉토리 경로에 파일을 다운로드할 수 있습니다. 또한 SaveAsHocrFile을 사용하여 파일을 HTML 파일로 저장할 수 있습니다.

6.0 기타 기능

6.1 Asprise OCR 사용

Asprise OCR은 Draw Text Area, Draw Picture Area, Draw Table Area, Draw Recognize Area 등과 같은 추가 옵션을 제공합니다. 이러한 기능은 모두 사용자가 OCR 성능을 향상시키는 데 도움이 됩니다. 애플리케이션은 OCR을 수행할 뿐만 아니라 PDF 병합, PDF 분할, PDF 편집 등과 같은 작업도 수행할 수 있습니다.

6.2 IronOCR 사용하기

IronOCR는 스캔된 문서에서 바코드와 QR 코드를 읽을 수 있는 독창적인 기능을 가지고 있습니다. 아래 코드는 주어진 이미지 또는 문서에서 바코드를 읽는 방법을 보여줍니다.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    // Add an image containing a barcode
    Input.AddImage("barcode.gif");

    // Read the image to recognize text and barcodes
    var Result = Ocr.Read(Input);

    // Loop through barcodes and output the value
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    // Add an image containing a barcode
    Input.AddImage("barcode.gif");

    // Read the image to recognize text and barcodes
    var Result = Ocr.Read(Input);

    // Loop through barcodes and output the value
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
$vbLabelText   $csharpLabel

위는 주어진 이미지나 PDF 문서에서 바코드를 읽는 데 도움이 되는 코드입니다. 페이지/이미지에서 하나 이상의 바코드를 읽을 수 있습니다. 바코드를 읽기 위해 IronOCR에는 바코드를 읽는 데 도움이 되는 독특한 설정 Ocr.Configuration.ReadBarCodes이 있습니다. 기본값은 false로 설정되어 있습니다.

입력을 읽은 후, 데이터는 OCRResult라는 객체에 저장됩니다. 이 객체에는 Barcodes라는 속성이 있으며, 모든 사용 가능한 바코드 데이터를 목록으로 가집니다. for-each 루프를 사용하여 모든 바코드 정보를 하나씩 얻을 수 있습니다. 또한 바코드를 스캔하고 바코드의 값을 읽습니다 — 하나의 프로세스에서 두 가지 작업이 완료됩니다.

스레딩 옵션도 지원합니다. 우리는 한 번에 여러 OCR 프로세스를 수행할 수 있습니다. IronOCR은 또한 지정된 영역에서 특정 영역을 인식할 수 있습니다.

using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Define the area to recognize text
    var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };

    // Add the document with the specified content area
    Input.Add("document.png", ContentArea);

    // Perform OCR on the specified region
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
} 
using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Define the area to recognize text
    var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };

    // Add the document with the specified content area
    Input.Add("document.png", ContentArea);

    // Perform OCR on the specified region
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
} 
$vbLabelText   $csharpLabel

위의 것은 특정 영역에서 OCR을 수행하는 샘플 코드입니다. 이미지나 PDF에서 직사각형 영역만 지정하면 됩니다. IronOCR의 Tesseract 엔진은 텍스트를 인식하는 데 도움을 줍니다.

7.0 IronOCR 및 Asprise OCR 라이선스 모델 및 가격

IronOCR 라이선스 모델 및 가격

30일 환불 보장: 라이선스를 구매하면 에. 30일 간 환불받을 수 있습니다 라이선스가 작동하지 않는 경우.

쉬운 통합: IronOCR의 프로젝트 및 환경에의 통합은 매우 쉬워서 한 줄의 코드만 작성하고 NuGet 패키지에서 추가하면 됩니다. 또는 웹에서 다운로드하여 환경에 통합할 수도 있습니다.

영구 라이선스: 각 라이선스는 한 번 구매되고 갱신이 필요하지 않습니다.

무료 지원 및 제품 업데이트: 모든 라이선스에는 제품 개발 팀의 지원 및 제품 업데이트 1년 무상 지원이 포함됩니다. 확장 기능은 언제든지 구매할 수 있습니다. 확장 기능은 확인할 수 있습니다.

즉시 라이선스: 등록된 라이선스 키는 결제가 완료되면 즉시 발송됩니다.

모든 라이선스는 영구적이며 개발, 스테이징, 프로덕션에 적용됩니다.

라이트 라이선스:

  • 1명의 개발자
  • 1개의 장소
  • 1개의 프로젝트
  • 영구 라이선스

이 패키지는 조직의 단일 소프트웨어 개발자가 한 장소에서 Iron Software를 사용할 수 있도록 합니다. Iron Software는 단일 웹 애플리케이션, 인트라넷 애플리케이션 또는 데스크톱 소프트웨어 프로그램에서 사용할 수 있습니다. 라이선스는 양도 불가능하며, 조직 외부 또는 에이전시/고객 관계 외부에서 공유할 수 없습니다. 이 라이선스 유형은 다른 모든 라이선스 유형과 같이 OEM 재배포를 제외하고 추가적인 특정 보장 없이 SaaS로 Iron Software를 사용하지 않는 한 계약에 명시적으로 부여되지 않은 모든 권리를 명시적으로 제외합니다.

가격: 연 $799부터 시작합니다.

프로페셔널 라이선스:

  • 10명의 개발자
  • 10개의 장소
  • 10개의 프로젝트
  • 영구 라이선스

이 패키지는 조직의 소프트웨어 개발자 수는 미리 정해진 수로 아무리 많아도 열 명까지 단일 장소에서 Iron Software를 사용할 수 있도록 합니다. Iron Software는 원하는 만큼의 웹사이트, 인트라넷 애플리케이션 또는 데스크톱 소프트웨어 애플리케이션에서 사용할 수 있습니다. 라이선스는 양도할 수 없으며 조직 외부 또는 에이전시/클라이언트 관계 외부에서 공유할 수 없습니다. 이 라이선스 유형은 모든 다른 라이선스 유형과 같이 OEM 재배포와 추가 범위가 구매되지 않는 이상 Iron Software를 SaaS로 사용하는 것을 포함하지 않는 명시되지 않은 모든 권리를 명시적으로 제외합니다. 이 라이선스는 최대 10개의 프로젝트에 통합될 수 있습니다.

가격: $999, 시작 매년.

무제한 라이선스:

  • 무제한 개발자
  • 무제한 장소
  • 무제한 프로젝트
  • 영구 라이선스

이 라이선스는 조직 내 무제한 수의 소프트웨어 개발자가 무제한 수의 장소에서 Iron Software를 사용할 수 있도록 허용합니다. Iron Software는 원하는 만큼의 웹사이트, 인트라넷 애플리케이션 또는 데스크톱 소프트웨어 애플리케이션에서 사용할 수 있습니다. 라이선스는 양도할 수 없으며 조직 외부 또는 에이전시/클라이언트 관계 외부에서 공유할 수 없습니다. 이 라이선스 유형은 모든 다른 라이선스 유형과 같이 OEM 재배포와 추가 범위가 구매되지 않는 이상 Iron Software를 SaaS로 사용하는 것을 포함하지 않는 명시되지 않은 모든 권리를 명시적으로 제외합니다.

가격: $2,999, 시작 매년.

로열티-프리 재배포: 이는 기본 라이선스로 포함된 프로젝트 수에 따라 Iron Software를 다양한 패키지의 상업용 제품으로 배포할 수 있게 해줍니다 (로열티를 지불할 필요 없음). 기본 라이선스로 포함된 프로젝트 수를 기반으로 SaaS 소프트웨어 서비스 내에서 Iron Software의 배포를 허용합니다.

가격: $1,599, 시작 매년.

Asprise Ocr Alternatives 10 related to IronOCR 라이선스 모델 및 가격

Asprise OCR 라이선스 모델 및 가격

라이트 라이선스:

  • 무제한 엔드유저
  • 텍스트 인식
  • 1D 바코드 읽기: UPC, EAN, Code39, Code128
  • 텍스트, XML, PDF 출력
  • 쉬운 배포
  • 2 OS만 지원
  • 1석
  • 지원: 없음

가격: 연 $7998부터 시작합니다.

기본 라이선스:

  • 무제한 엔드유저
  • BMP, GIF, PNG, JPEG, TIFF, 및 PDF 입력.
  • 텍스트 인식
  • 1D 바코드 읽기: UPC, EAN, Code39, Code128
  • 2D에서 읽기: QR 및 Data Matrix만
  • 텍스트, XML, PDF 출력
  • 쉬운 배포
  • 지원: 없음

가격: 연간 $7,998에서 시작.

Enterprise 라이선스:

  • 무제한 엔드유저
  • BMP, GIF, PNG, JPEG, TIFF, 및 PDF 입력.
  • 텍스트 인식
  • 1D 바코드 읽기: UPC, EAN, Code39, Code128
  • 2D: QR, PDF 417, 데이터 매트릭스 및 아즈텍
  • 텍스트, XML, PDF 출력
  • 쉬운 배포
  • 멀티스레딩, 멀티프로세싱

가격: $12,998에서 시작.

Asprise Ocr Alternatives 11 related to Asprise OCR 라이선스 모델 및 가격

IronOCR Lite에는 1년 지원이 포함된 1개 개발자 패키지가 약 $799이며, Asprise Lite의 1개 개발자 패키지는 기술 지원 없이 $7998이며, 유료 기술 지원이 포함된 $6,296입니다. IronOCR 전문 라이선스는 1년의 기술 지원이 포함된 10인 개발자 패키지를 $999에서 제공합니다. Asprise의 동등한 라이선스는 기술 지원 없이 연간 $37,998, 유료 기술 릴리스 및 업데이트와 1년 지원을 포함하여 $46,999.00입니다.

IronOCR LiteProfessional 패키지는 SaaS 서비스 또는 OEM과 5년 지원 옵션을 제공합니다. Lite 버전은 5년 지원과 SaaS 및 OEM 서비스를 포함하여 $2897USD이며, Asprise는 SaaS 또는 OEM 서비스와 맞춤형 지원 옵션을 제공합니다. IronOCR 전문 버전에는 유료 지원 1년과 SaaS 및 OEM 서비스가 포함된 10인 개발자 패키지가 $3397, Asprise 버전은 1년 지원 없이 SaaS 및 OEM 서비스와 함께 10인 개발자 패키지로 $59,996입니다.

8.0 결론

.NET Framework 컨텍스트의 IronOCR는 간단하고 사용하기 쉬운 Tesseract를 제공합니다. 이는 사진과 PDF 문서를 다양한 방식으로 지원합니다. 이는 Tesseract OCR 라이브러리의 성능을 향상시키기 위한 여러 설정을 제공합니다. 다양한 언어를 지원하며, 단일 작업에서 여러 언어를 사용할 수 있습니다. Tesseract OCR에 대해 더 알아보려면 그들의 웹사이트를 방문하세요.

Asprise는 이미지와 PDF 문서를 인식하기 위해 인공지능 엔진을 사용하는 소프트웨어 애플리케이션입니다. 또한, OCR 프로세스의 성능을 향상시키기 위한 다양한 설정을 제공합니다. 더 나아가 여러 언어를 선택할 수 있는 옵션을 제공합니다. Asprise는 페이지 변환 사용에 대한 몇 가지 제한이 있습니다. 또한 운영 체제별로 다른 가격을 가지고 있습니다.

IronOCR 패키지는 Asprise에 비해 더 나은 라이선스지원을 제공합니다. Asprise OCR은 맞춤형 및 고정 패키지가 있으며 더 비쌉니다. IronOCR은 $799부터 시작하는 반면, Asprise OCR은 연 $7994부터 시작합니다. 따라서 우리의 제품은 더욱 비용 효율적이며 Asprise보다 더 많은 기능을 제공합니다. 또한 단일 가격에 여러 플랫폼을 지원합니다.

그래서, 무엇을 기다리시나요? 무료 체험판은 모든 분께 열려 있습니다. You can obtain the License here and begin straightaway.

참고해 주세요Aspose는 해당 소유자의 등록 상표입니다. 본 사이트는 Aspose와 제휴, 보증 또는 후원 관계가 없습니다. 모든 제품명, 로고 및 브랜드는 해당 소유자의 자산입니다. 비교는 정보 제공 목적으로만 사용되며, 작성 시점에 공개적으로 이용 가능한 정보를 반영합니다.

자주 묻는 질문

광학 문자 인식(OCR)이란 무엇인가요?

광학 문자 인식(OCR)은 스캔한 종이 문서, PDF 파일, 디지털 카메라로 촬영한 이미지 등 다양한 유형의 문서를 편집 및 검색 가능한 데이터로 변환하는 데 사용되는 기술입니다. IronOCR 과 같은 도구는 텍스트 이미지를 실제 텍스트 데이터로 변환하여 OCR을 수행합니다.

C#을 사용하여 이미지를 텍스트로 변환하는 방법은 무엇인가요?

IronOCR C#에서 이미지를 텍스트로 변환하는 강력한 솔루션을 제공합니다. Tesseract 5 엔진을 사용하여 저품질 이미지에서도 강력한 OCR 기능을 통해 이미지 파일을 처리하고 텍스트를 추출할 수 있습니다.

IronOCR OCR 작업에 어떤 형식을 지원하나요?

IronOCR JPEG, PNG, GIF, BMP, TIFF, PDF를 포함한 다양한 OCR 형식을 지원합니다. 또한 여러 페이지로 구성된 문서와 암호로 보호된 PDF 파일도 처리할 수 있습니다.

C# 프로젝트에 IronOCR 어떻게 설치하나요?

Visual Studio의 NuGet 패키지 관리자를 사용하여 C# 프로젝트에 IronOCR 설치할 수 있습니다. 또는 명령줄에서 Install-Package IronOCR 명령어를 사용하거나 IronOCR 웹사이트에서 직접 다운로드할 수도 있습니다.

IronOCR 다른 OCR 라이브러리에 비해 사용할 때의 장점은 무엇인가요?

IronOCR 광범위한 언어 지원, 저화질 이미지에서도 뛰어난 성능, 바코드 및 QR 코드 인식과 같은 기능을 제공합니다. 또한 비용 효율적인 라이선스를 제공하고 단일 가격으로 여러 플랫폼을 지원하므로 개발자에게 다재다능한 선택입니다.

IronOCR 여러 페이지로 구성된 문서를 처리할 수 있습니까?

네, IronOCR TIFF 및 PDF를 포함한 여러 페이지로 구성된 문서를 처리하여 각 페이지에서 효율적으로 텍스트를 추출할 수 있습니다. 이는 대용량 문서 처리 또는 일괄 처리에 특히 유용합니다.

IronOCR에 사용할 수 있는 라이선스 옵션은 무엇인가요?

IronOCR Lite, Professional, Unlimited 라이선스를 포함한 유연하고 영구적인 라이선스 옵션을 제공합니다. 이러한 라이선스는 로열티가 없으며 SaaS 및 OEM 서비스를 지원하므로 다양한 배포 시나리오에 적합합니다.

IronOCR 저화질 이미지에서 텍스트를 어떻게 추출하나요?

IronOCR 고급 전처리 기술을 활용하여 OCR을 수행하기 전에 이미지 품질을 향상시켜 저품질 이미지에서 텍스트를 추출하는 데 탁월합니다. 이를 통해 텍스트 인식 정확도가 크게 향상됩니다.

칸나오팟 우돈판트
소프트웨어 엔지니어
카나팟은 소프트웨어 엔지니어가 되기 전 일본 홋카이도 대학교에서 환경 자원학 박사 학위를 취득했습니다. 학위 과정 중에는 생물생산공학과 소속 차량 로봇 연구실에서 활동하기도 했습니다. 2022년에는 C# 기술을 활용하여 Iron Software의 엔지니어링 팀에 합류했고, 현재 IronPDF 개발에 집중하고 있습니다. 카나팟은 IronPDF에 사용되는 대부분의 코드를 직접 작성하는 개발자로부터 배울 수 있다는 점에 만족하며, 동료들과의 소통을 통해 배우는 것 외에도 Iron Software에서 일하는 즐거움을 누리고 있습니다. 코딩이나 문서 작업을 하지 않을 때는 주로 PS5로 게임을 하거나 The Last of Us를 다시 시청하는 것을 즐깁니다.

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me