푸터 콘텐츠로 바로가기
다른 구성 요소와 비교

IronOCR 과 AWS Textract OCR 비교

OCR이란 무엇입니까?

텍스트 이미지를 기계 판독 가능한 텍스트 형식으로 변환하는 절차를 Optical Character Recognition (OCR)이라고 합니다. 예를 들어, 양식, 인보이스 또는 영수증을 스캔하면 컴퓨터는 스캔을 이미지 파일로 저장합니다. 이미지 파일의 데이터는 텍스트 편집기를 사용하여 편집, 검색 또는 계산할 수 없습니다. 그러나 OCR 솔루션을 사용하여 이미지 파일을 텍스트 데이터로 저장된 텍스트 문서로 변환할 수 있습니다.

이 현대 시대에는 대부분의 비즈니스 워크플로우가 인쇄 매체에서 정보를 받는 것을 포함합니다. 종이 양식, 인보이스, 스캔된 법률 문서, 테이블 추출, 인쇄된 텍스트 또는 계약과 같은 다양한 문서가 모두 비즈니스 프로세스를 구성합니다. 게다가, 이러한 문서 내용을 디지털화하면 그 안에 숨겨진 텍스트가 있는 이미지를 생성합니다. 이미지 안에 있는 텍스트는 워드 프로세싱 도구로 텍스트 문서와 같은 방식으로 처리할 수 없습니다. OCR 기술은 텍스트 이미지를 다른 비즈니스 소프트웨어에서 분석 가능한 텍스트 데이터로 변환하여 문제를 해결합니다.

OCR은 어떻게 작동합니까?

OCR 엔진은 다음 단계로 작동합니다:

이미지 획득

이 과정에서 스캐너는 문서를 읽고 이를 이진 데이터로 변환합니다. OCR 소프트웨어는 스캔된 이미지를 식별하고 밝은 영역을 배경으로, 어두운 영역을 텍스트로 분류합니다.

전처리

OCR 소프트웨어는 먼저 이미지를 정리하고 오류를 제거하여 데이터를 읽을 준비를 합니다.

텍스트 인식

텍스트 인식을 위한 두 가지 주요 OCR 알고리즘은 패턴 매칭과 특징 추출입니다.

패턴 매칭

패턴 매칭 과정 전체에서 문자 그림 또는 글리프가 고립되고 이전에 기록된 글리프와 비교됩니다.

특징 추출

특징 추출 과정을 통해 글리프는 선, 폐쇄 고리, 선 방향, 선 접합점과 같은 특징으로 나뉩니다.

후처리

기술은 분석 후 복구된 텍스트 데이터를 디지털 파일로 변환합니다. 일부 OCR 시스템은 스캔된 문서의 전후 버전을 포함한 주석이 있는 PDF 문서를 생성할 수 있습니다.

이 기사에서는 두 가지의 가장 흔한 애플리케이션과 문서 라이브러리를 비교할 것입니다:

  • IronOCR
  • AWS OCR Textract

IronOCR 라이브러리

IronOCR는 스캔, 검색, 이미지 및 PDF 읽기를 제공하는 C# .NET 라이브러리입니다. 125개 이상의 글로벌 언어 팩이 포함되어 있습니다. 텍스트, 구조화된 데이터, 또는 검색 가능한 PDF로 출력이 생성됩니다. .NET 버전 6, 5, Core, Standard, 및 Framework과 같은 버전을 지원합니다.

IronOCR는 불완전하게 스캔된 이미지와 문서에서 데이터를 자동으로 감지하고 추출하는 독특한 기능을 가지고 있습니다. 'IronTesseract' 클래스는 가장 간단한 API를 제공합니다. 모든 플랫폼에서 속도, 정확성, 네이티브 DLL 및 API가 향상된 Tesseract의 가장 발전된 빌드를 제공합니다.

IronOCR는 모든 이미지 형식의 바코드 및 QR 코드를 스캔할 수 있으며, 최신 Tesseract 5 엔진을 사용하여 텍스트를 읽고 PDF 스캐닝을 수행합니다.

기능

  • 순수하게 .NET 애플리케이션을 위해 만들어졌습니다.
  • 125가지 다른 언어를 지원합니다. Arabic, Chinese, English, Finnish, French, German, Japanese 및 많은 다른 언어들은 IronOCR에 의해 지원됩니다.
  • 기울어진 이미지의 위치를 정확히 맞추고 이미지에서 노이즈를 제거하여 정확한 출력을 제공합니다.
  • 낮은 DPI의 저해상도 이미지에서 뛰어난 성능을 발휘합니다.
  • 여러 종류의 QR 코드 및 바코드를 읽을 수 있습니다.
  • 또한 Gif와 Tiff 형식을 지원합니다.
  • 동시에 여러 스레드를 허용합니다. 이것은 다른 OCR 라이브러리에는 없는 뛰어난 기능입니다. 프로세스를 더 매끄럽게 만듭니다.
  • 쉽게 PDF 파일에서 OCR을 수행하고 검색 가능한 PDF 문서를 OCR로 내보낼 수 있습니다.

이제 AWS OCR을 살펴보겠습니다.

AWS OCR Textract

Amazon의 AWS Textract는 스캔된 문서에서 텍스트와 데이터를 자동으로 추출하는 기계 학습(ML) 서비스입니다. 단순한 광학 문자 인식(OCR)을 넘어 딥 러닝 기술을 사용하여 양식 및 테이블에서 데이터를 식별, 이해 및 추출합니다.

AWS OCR Textract는 기계 학습을 사용하여 모든 종류의 문서를 읽고 처리하며, 수동 노력 없이 텍스트, 표 형식 데이터 및 기타 데이터를 정확하게 추출합니다. 데이터를 추출하는 데 몇 시간 또는 며칠 걸리는 대신, Textract는 이를 신속하게 수행할 수 있습니다. 또한, Amazon Augmented Artificial Intelligence (AI)를 통해 인간 검토를 추가하여 모델을 감독하고 민감한 데이터를 점검할 수 있습니다.

기능

  • 금융 보고서, 의료 기록, 표, 세금 양식 등의 다양한 문서에서 텍스트를 감지합니다.
  • Document Analysis API를 사용하여 구조화된 데이터가 있는 문서에서 텍스트, 양식, 표 데이터를 추출합니다.
  • Analyze Document API에서 Queries 기능을 사용하여 문서에서 정보를 지정하고 추출합니다.
  • Analyze Expense API를 사용하여 송장 및 영수증을 처리합니다.
  • 미국 정부에서 발급한 운전 면허증 및 여권과 같은 ID 문서를 처리합니다, Analyze ID API를 사용하여.
  • 결정 속도를 가속화할 수 있는 확장 가능한 문서 분석입니다.

기사의 나머지 부분은 다음과 같습니다.

  1. Visual Studio 프로젝트 만들기
  2. IronOCR 설치하기
  3. AWS OCR Textract 설치하기
  4. PDF를 텍스트로 변환
  5. 이미지를 텍스트로 변환
  6. 바코드와 QR 코드를 텍스트로 변환
  7. 라이선싱
  8. 결론

1. Visual Studio 프로젝트 만들기

이 튜토리얼에서는 Visual Studio 2022 버전을 사용할 것이므로, 설치되어 있어야 합니다.

  • Visual Studio 2022를 엽니다.
  • 새로운 .NET Core 프로젝트를 생성한 후 콘솔 앱을 선택합니다.
Aws Ocr Alternatives 1 related to 1. Visual Studio 프로젝트 만들기

콘솔 애플리케이션

  • 프로젝트에 이름을 지정합니다. 예: TextReader.
  • 최신의 안정적인 .NET framework 버전은 6.0입니다. 이를 사용할 것입니다.

    .NET Framework

  • 생성 버튼을 클릭하면 프로젝트가 생성됩니다.

다음으로, 각 라이브러리를 하나씩 설치할 것입니다.

2. IronOCR 설치하기

IronOCR 라이브러리는 네 가지 방법으로 다운로드 및 설치할 수 있습니다. 다음과 같습니다:

  1. Visual Studio NuGet 패키지 관리자를 사용합니다.
  2. NuGet 웹사이트를 통한 직접 다운로드.
  3. IronOCR 웹페이지를 통한 직접 다운로드.
  4. Visual Studio에서 명령 줄 사용.

2.1. Visual Studio NuGet 관리자 사용

Visual Studio NuGet 패키지 관리자를 사용하여 C# 프로젝트에 IronOCR을 통합할 수 있습니다.

  1. 도구 확장 또는 솔루션 탐색기 마우스 오른쪽 클릭.
  2. NuGet 패키지 관리자를 확장.
  3. 솔루션에 대한 NuGet 패키지 관리 클릭 또는 솔루션 탐색기에서 NuGet 패키지 관리 클릭.
Manage NuGet Package

NuGet 패키지 관리

이후, 검색 창에 IronOCR을 입력하면 새 창이 열릴 것입니다. 오른쪽의 프로젝트 박스를 체크하고 설치 버튼 클릭.

IronOCR 검색

IronOCR 검색

이 방법을 사용하면 개발자는 IronOCR 라이브러리와 개발자가 선택한 모든 언어 팩을 설치할 수 있습니다.

2.2. NuGet 웹사이트를 통한 직접 다운로드

IronOCR은 다음 지침을 따라 직접 NuGet 웹사이트에서 다운로드할 수 있습니다:

  1. 링크로 이동 "https://www.nuget.org/packages/IronOcr/".
  2. 오른쪽 메뉴에서 다운로드 패키지 옵션 선택.
  3. 다운로드 패키지를 더블 클릭. 자동으로 설치됩니다.
  4. 다음으로, 솔루션을 다시 로드하고 프로젝트에서 사용 시작.

2.3. IronOCR 웹페이지를 통한 직접 다운로드

개발자는 링크를 사용하여 웹사이트에서 IronOCR 라이브러리를 직접 다운로드할 수 있습니다.

  1. 솔루션 창에서 프로젝트를 마우스 오른쪽 버튼으로 클릭하십시오.
  2. 그런 다음, 참조 옵션을 선택하고 다운로드된 참조의 위치를 찾아봅니다.
  3. 다음, 참조 추가를 위해 확인 버튼 클릭.

2.4. Visual Studio에서 명령 줄 사용

  1. Visual Studio에서 Tools-> NuGet 패키지 관리자 -> 패키지 관리자 콘솔로 이동.
  2. 패키지 관리자 콘솔 탭에 다음 줄 입력:
Install-Package IronOcr

패키지는 현재 프로젝트에 다운로드/설치되며 사용 준비가 완료되었습니다.

Package Manager Console

콘솔 애플리케이션

Install IronOCR

콘솔 애플리케이션

명령을 입력한 후 Enter 키를 누르면 설치됩니다.

2.5. IronOCR 네임스페이스 추가

IronOCR을 사용하기 위해 프로그램에 다음 코드를 포함하십시오:

using IronOcr;
using IronOcr;
$vbLabelText   $csharpLabel

이제 AWS Textract를 설치해 보겠습니다.

3. AWS Textract OCR 설치

Amazon Textract를 처음 사용하기 전에 다음 작업을 완료하십시오:

  1. AWS 서비스에 가입.
  2. IAM 사용자 생성.

계정 가입에 성공하고 IAM 사용자를 생성한 후에는 C#을 사용하여 프로그래밍 방식으로 API에 액세스하기 위해 AWS 콘솔에서 액세스 키를 설정할 수 있습니다. 당신이 필요로 할 것:

  • AccessKeyId
  • SecretAccessKey
  • RegionEndPoint (당신의 액세스 지역) - 이 예제의 경우: AFSouth1

3.1. NuGet 패키지 관리자 사용

  • NuGet 패키지 관리자에서 AWS Textract SDK를 다운로드하고 설치할 수 있습니다.
NuGet 패키지 관리자

NuGet 패키지 관리자

  • 탐색 클릭 후 AWS Textract 검색:
AWS Textract

AWS Textract

3.2. AWS OCR 네임스페이스 추가

AWS Textract를 사용하려면 다음 네임스페이스를 포함하십시오:

using Amazon.Textract;
using Amazon.Textract.Model;
using Amazon.Textract;
using Amazon.Textract.Model;
$vbLabelText   $csharpLabel

4. PDF 파일을 텍스트로

두 라이브러리 모두 PDF 파일에서 텍스트를 추출할 수 있습니다. 코드를 하나씩 살펴보겠습니다.

4.1. IronOCR 사용

IronOCR은 고급 Tesseract를 사용하여 PDF 문서 형식에서 텍스트를 인식하고 읽을 수 있습니다. 다음 간단한 코드는 정보를 추출하는 데 사용됩니다:

var Ocr = new IronTesseract();
using (var input = new OcrInput())
{
    input.AddPdf("example.pdf", "password");
    // We can also select specific PDF page numbers to OCR
    var Result = Ocr.Read(input);
    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages");
    // Read every page of the PDF
}
var Ocr = new IronTesseract();
using (var input = new OcrInput())
{
    input.AddPdf("example.pdf", "password");
    // We can also select specific PDF page numbers to OCR
    var Result = Ocr.Read(input);
    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages");
    // Read every page of the PDF
}
$vbLabelText   $csharpLabel

코드는 간단하고 깔끔하며 이해하고 사용하기 매우 쉽습니다.

입력 PDF 파일

예제 PDF

예제 PDF

산출

IronOCR 출력

IronOCR 출력

4.2. AWS Textract

Amazon Textract를 사용하면 문서 텍스트 감지 및 분석을 애플리케이션에 쉽게 추가할 수 있습니다. 다음 코드는 PDF를 읽는 데 사용되며 동일한 PDF가 전달됩니다:

public static async void ReturnResult()
{
    AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1);
    var request = new StartDocumentTextDetectionRequest();
    request.DocumentLocation = new DocumentLocation
    {
        S3Object = new S3Object
        {
            Bucket = "your_bucket_name",
            Name = "your_bucket_key"
        }
    };
    var id = await client.StartDocumentTextDetectionAsync(request);
    var jobId = id.JobId;
    var response = client.GetDocumentTextDetectionAsync(new GetDocumentTextDetectionRequest{
        JobId = jobId
    });
    response.Wait();
    if (response.Result.JobStatus.Equals("SUCCEEDED"))
    {
        foreach (var block in response.Result.Blocks)
        {
            if (block.BlockType == "WORD" || block.BlockType == "PAGE" || block.BlockType == "LINE")
            {
                Console.WriteLine(block.Text);
            }
        }
    }
}

static void Main(String[] args)
{
    ReturnResult();
}
public static async void ReturnResult()
{
    AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1);
    var request = new StartDocumentTextDetectionRequest();
    request.DocumentLocation = new DocumentLocation
    {
        S3Object = new S3Object
        {
            Bucket = "your_bucket_name",
            Name = "your_bucket_key"
        }
    };
    var id = await client.StartDocumentTextDetectionAsync(request);
    var jobId = id.JobId;
    var response = client.GetDocumentTextDetectionAsync(new GetDocumentTextDetectionRequest{
        JobId = jobId
    });
    response.Wait();
    if (response.Result.JobStatus.Equals("SUCCEEDED"))
    {
        foreach (var block in response.Result.Blocks)
        {
            if (block.BlockType == "WORD" || block.BlockType == "PAGE" || block.BlockType == "LINE")
            {
                Console.WriteLine(block.Text);
            }
        }
    }
}

static void Main(String[] args)
{
    ReturnResult();
}
$vbLabelText   $csharpLabel

코드는 약간 까다롭고 길며 객체를 전달하고 검색할 때 주의가 필요합니다. 우선, AmazonTextractClient 객체를 AccessKeyId, SecretAccessKey, Region 이렇게 3개의 매개변수를 사용하여 생성해야 합니다. 그런 다음 StartDocumentTextDetectionRequest() 메소드를 사용하여 요청을 시작해야 합니다. 그 요청 객체는 버킷 이름과 키를 사용하여 DocumentLocation을 설정합니다. 이 요청은 StartDocumentTextDetectionAsync() 메소드에 전달됩니다. 비동기 메소드이므로 await 키워드를 사용하고 ReturnResult 함수를 비동기로 만들어야 합니다. 성공 시 결과가 반환되고 jobId가 저장됩니다. jobId는 GetDocumentTextDetectionAsync() 메소드에 전달되고 SUCCEEDED 응답을 기다립니다. foreach 루프는 각 블록을 순회하며 그것이 "WORD", "PAGE" 또는 "LINE" 인지 확인하고, 그런 다음 텍스트 인식을 출력합니다. 마지막으로, 이 메소드를 문서 처리를 위해 Main 메소드에서 호출합니다.

산출

출력은 IronOCR과 매우 유사합니다.

AWS Textract 출력

AWS Textract 출력

5. 이미지에서 텍스트로

이미지에서 데이터를 읽는 것은 까다로우며 이미지 품질이 정보를 추출하는 데 중요한 역할을 합니다. 두 라이브러리 모두 텍스트를 추출할 수 있는 기능을 제공합니다. 여기에서는 png 파일을 사용할 것입니다.

5.1. IronOCR 사용

코드는 이전 코드와 거의 유사합니다. 여기서, AddPDF 메소드는 AddImage 메소드로 대체됩니다.

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    Input.AddImage("test-files/redacted-employmentapp.png");
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    Input.AddImage("test-files/redacted-employmentapp.png");
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

입력 이미지

편집된 직원 데이터

편집된 직원 데이터

산출

출력은 깔끔하고 원본 이미지와 일치하며 몇 줄의 코드로 기술적 어려움 없이 완벽한 출력을 제공합니다.

이미지 출력

이미지 출력

5.2. AWS Textract 사용

다음 코드는 이미지에서 텍스트를 감지하는 데 도움이 됩니다:

public static async void ReturnResult()
{
    AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1);
    var request = new DetectDocumentTextRequest();
    request.Document = new Document
    {
        Bytes = new MemoryStream(File.ReadAllBytes(@"test-files/redacted-employmentapp.png"))
    };    
    var result = await client.DetectDocumentTextAsync(request);
    foreach (var block in result.Blocks)
    {
        if (block.BlockType == "WORD")
        {
            Console.WriteLine(block.Text);
        }
    }
}

static void Main(String[] args)
{
    ReturnResult();
}
public static async void ReturnResult()
{
    AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1);
    var request = new DetectDocumentTextRequest();
    request.Document = new Document
    {
        Bytes = new MemoryStream(File.ReadAllBytes(@"test-files/redacted-employmentapp.png"))
    };    
    var result = await client.DetectDocumentTextAsync(request);
    foreach (var block in result.Blocks)
    {
        if (block.BlockType == "WORD")
        {
            Console.WriteLine(block.Text);
        }
    }
}

static void Main(String[] args)
{
    ReturnResult();
}
$vbLabelText   $csharpLabel

다시 말하지만, 코드는 이전 것과 거의 유사합니다. 여기서, DetectDocumentTextRequest() 메소드를 사용하여 요청을 시작해야 합니다. 그런 다음 요청 객체가 모든 바이트를 읽어 문서를 설정합니다. 이 요청은 DetectDocumentTextAsync() 메소드에 전달됩니다. 비동기 메소드이므로 await 키워드를 사용하고 ReturnResult 함수를 비동기로 만들어야 합니다. 성공 시 결과는 블록으로 반환됩니다. foreach 루프는 각 블록을 순회하며 그것이 "WORD" 인지 확인하고, 그런 다음 텍스트 인식을 출력합니다. 마지막으로, 이 메소드를 문서 처리를 위해 Main 메소드에서 호출합니다.

출력은 IronOCR과 유사하지만 첨부 파일을 AWS 버킷에 업로드해야 합니다.

6. 바코드 및 QR 코드에서 텍스트로

IronOCR의 독특한 기능 중 하나는 텍스트를 스캔하는 동시에 문서에서 바코드와 QR 코드를 읽을 수 있다는 점입니다. OcrResult.OcrBarcode 클래스의 인스턴스는 개발자에게 각 스캔된 바코드에 대한 자세한 정보를 제공합니다. AWS Textract는 이 기능을 제공하지 않습니다.

IronOCR에 대한 코드는 아래와 같습니다:

var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
    input.AddImage("test-files/Barcode.png");
    var Result = Ocr.Read(input);
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // type and location properties also exposed
    }
}
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
    input.AddImage("test-files/Barcode.png");
    var Result = Ocr.Read(input);
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // type and location properties also exposed
    }
}
$vbLabelText   $csharpLabel

코드는 자기 설명적이며 이해하기 쉽습니다.

7. 라이선싱

IronOCR은 개발자 라이센스를 무료로 제공하는 라이브러리입니다. 또한 별개의 가격 구조를 가지고 있습니다; Lite 번들은 $799에서 숨겨진 수수료 없이 시작됩니다. SaaS 및 OEM 제품의 재배포도 가능합니다. 모든 라이센스는 30일 환불 보장, 1년의 소프트웨어 지원 및 업그레이드, 개발/스테이징/프로덕션 유효성, 영구 라이센스(한 번 구매)를 포함합니다. IronOCR의 전체 가격 구조와 라이선스 세부 정보를 보려면 여기에서 확인하세요.

IronOCR 가격 계획

IronOCR 가격 계획

SaaS 및 OEM 제품의 재배포를 저작권료 없는 서비스로 단일 구매로 이용할 수 있습니다.

SAAS 서비스

SAAS 서비스

AWS Textract API는 개발자에게 AWS Free Tier 서비스를 제공합니다. 무료로 Amazon Textract를 시작할 수 있습니다. 무료 티어는 3개월 동안 지속되며 아래에 가격이 표시됩니다.

가격 목록

가격 목록

가격 목록

You can have a look at the pricing details from this link. 가격 계산기를 사용하여 필요에 따라 가격을 조정할 수도 있습니다.

8. 결론

IronOCR는 C# 개발자에게 우리가 아는 모든 플랫폼에서 가장 진보된 Tesseract API를 제공합니다. IronOCR는 Windows, Linux, Mac, Azure, AWS, Lambda에 배포할 수 있으며, .NET Framework 프로젝트뿐만 아니라 .NET Standard.NET Core도 지원합니다. 우리는 또한 OCR 스캔에서 바코드를 읽고, 우리의 OCR을 HTML 및 검색 가능한 PDF로 내보낼 수도 있습니다.

Amazon Textract를 사용하면 문서 텍스트 감지 및 분석을 애플리케이션에 쉽게 추가할 수 있습니다. Amazon Textract는 매일 수십억 개의 이미지와 비디오를 분석하기 위해 아마존의 컴퓨터 비전 과학자들이 개발한 입증되고 고도로 확장 가능한 딥러닝 기술을 기반으로 합니다. 이를 사용하기 위해 기계 학습 전문 지식이 필요하지 않습니다. Amazon Textract는 이미지 파일과 PDF 파일을 분석할 수 있는 간단하고 사용하기 쉬운 API를 포함합니다. Amazon Textract는 항상 새로운 데이터에서 학습하며, 아마존은 계속하여 서비스에 새로운 기능을 추가하고 있습니다.

IronOCR 라이선스는 개발자 기반이며, 이 제품을 사용할 개발자 수에 따라 항상 라이선스를 구매해야 합니다. AWS Textract 라이선스는 정보를 추출하고 데이터를 분석할 문서의 페이지 수에 기반합니다. 라이선스는 월 단위로 제공되며, 페이지 수가 많은 경우 IronOCR 라이선스에 비해 가격이 매우 높아집니다. 게다가 IronOCR 라이선스는 단일 구매로 평생 사용할 수 있으며 OME 및 SaaS 배포를 지원합니다.

전반적인 비교에서 IronOCR와 AWS OCR 모두 문서나 이미지에서 텍스트를 감지할 수 있는 기계 학습 기능을 가지고 있습니다. IronOCR는 AWS OCR보다 빠르고 시간을 절약하는데 약간의 이점이 있습니다. 코드는 간단하고, 문서에서 텍스트를 감지할 때 직관적입니다. 작업은 몇 가지 방법으로 수행됩니다. 반면에 AWS Textract는 같은 작업을 달성하기 위해 여러 방법을 사용합니다. 이는 서버 응답을 증가시키고 때로는 시간이 많이 걸릴 수 있습니다. IronOCR에 불완전한 문서를 입력해도 약 99%의 통계적인 정확도로 내용을 정확히 읽을 수 있다는 것을 볼 수 있습니다. 문서가 잘못 형식화되었고, 기울어졌으며 디지털 소음이 있더라도 IronOCR는 성능 조정이나 입력 이미지의 심한 수정 없이 바로 작동합니다. 속도는 놀랍습니다: IronOCR.2020+는 이전 빌드보다 최대 10배 빠르고 250% 이상 오류가 적습니다.

더 나아가 Iron Software는 현재 두 개의 가격으로 다섯 가지 도구 패키지를 제공합니다. Iron Suite에 포함된 도구는 다음과 같습니다:

  • IronBarcode
    • IronXL
    • IronOCR
    • IronPDF
    • IronWebScraper

IRONSUITE를 탐색하려면 이 링크를 방문하세요.

자주 묻는 질문

광학 문자 인식(OCR)이란 무엇인가요?

광학 문자 인식(OCR)은 스캔한 종이 문서, PDF 파일, 디지털 카메라로 촬영한 이미지 등 다양한 유형의 문서를 편집 및 검색 가능한 데이터로 변환하는 기술입니다. IronOCR 고급 알고리즘을 사용하여 이 프로세스를 향상시키는 강력한 C# .NET 라이브러리입니다.

C#을 사용하여 텍스트 이미지를 기계가 읽을 수 있는 텍스트로 변환하려면 어떻게 해야 할까요?

IronOCR C# .NET 라이브러리로, 텍스트 이미지를 기계가 읽을 수 있는 텍스트로 변환하는 데 사용할 수 있습니다. 이 라이브러리는 고급 OCR 알고리즘을 통해 이미지를 처리하고, 인식된 텍스트를 프로그래밍 방식으로 쉽게 조작할 수 있는 형식으로 출력합니다.

IronOCR 스캔 상태가 완벽하지 않은 이미지를 어떻게 처리하나요?

IronOCR 스캔 상태가 완벽하지 않은 이미지도 효과적으로 관리하고 처리하도록 설계되었습니다. 이미지 기울기를 보정하고, 텍스트 대비를 향상시키며, 이미지 품질을 개선하여 OCR 정확도를 높이는 전처리 기능을 포함하고 있습니다.

IronOCR 멀티스레드 처리에 사용할 수 있나요?

네, IronOCR 멀티스레딩을 지원하여 여러 문서를 동시에 처리할 수 있으므로 문서 처리량이 많은 애플리케이션에서 성능과 처리량을 크게 향상시킵니다.

IronOCR OCR 작업에 어떤 언어를 지원하나요?

IronOCR 125개 이상의 언어를 지원하므로 여러 언어로 작성된 문서를 처리하고 텍스트로 변환해야 하는 글로벌 애플리케이션에 적합한 다목적 도구입니다.

Visual Studio 프로젝트에 IronOCR 설치하는 방법은 무엇인가요?

IronOCR NuGet 패키지 관리자를 통해 Visual Studio 프로젝트에 설치할 수 있습니다. NuGet 콘솔에서 ' IronOCR '을 검색하여 설치하면 .NET 애플리케이션에 OCR 기능을 통합할 수 있습니다.

IronOCR 의 가격 모델은 무엇인가요?

IronOCR 일회성 라이선스 모델을 제공합니다. 여기에는 30일 환불 보증이 포함된 영구 라이선스가 포함되어 개발자에게 유연성과 안심을 제공합니다.

AWS Textract는 기술적인 측면에서 IronOCR 과 어떻게 다른가요?

AWS Textract는 머신러닝 및 딥러닝 기술을 사용하여 텍스트와 데이터를 추출하고 문서 콘텐츠에 대한 상세한 분석을 제공합니다. 이와 대조적으로 IronOCR .NET 프로젝트와의 손쉬운 사용 및 통합에 중점을 두고 있으며, 포괄적인 언어 지원을 제공하는 강력한 OCR 솔루션을 제공합니다.

IronOCR 바코드와 QR 코드를 읽고 처리할 수 있습니까?

네, IronOCR 바코드와 QR 코드를 모두 읽고 처리할 수 있습니다. 각 코드에 대한 자세한 정보를 추출하는 동시에 텍스트를 스캔하므로 문서 처리를 위한 종합적인 도구입니다.

IronOCR 지원하는 플랫폼 및 환경은 무엇입니까?

IronOCR Windows, Linux, Mac, Azure, AWS, Lambda를 포함한 다양한 환경과 호환됩니다. .NET Framework, .NET Standard, .NET Core 프로젝트를 지원하여 다양한 개발 환경에서 유연성을 제공합니다.

칸나오팟 우돈판트
소프트웨어 엔지니어
카나팟은 소프트웨어 엔지니어가 되기 전 일본 홋카이도 대학교에서 환경 자원학 박사 학위를 취득했습니다. 학위 과정 중에는 생물생산공학과 소속 차량 로봇 연구실에서 활동하기도 했습니다. 2022년에는 C# 기술을 활용하여 Iron Software의 엔지니어링 팀에 합류했고, 현재 IronPDF 개발에 집중하고 있습니다. 카나팟은 IronPDF에 사용되는 대부분의 코드를 직접 작성하는 개발자로부터 배울 수 있다는 점에 만족하며, 동료들과의 소통을 통해 배우는 것 외에도 Iron Software에서 일하는 즐거움을 누리고 있습니다. 코딩이나 문서 작업을 하지 않을 때는 주로 PS5로 게임을 하거나 The Last of Us를 다시 시청하는 것을 즐깁니다.

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me