푸터 콘텐츠로 바로가기
IRONOCR 사용

C#을 이용한 OCR 송장 처리 (개발자 튜토리얼)

송장 데이터 처리는 공급자나 벤더로부터 송장을 수신, 관리, 검증하고 지불이 정확하고 제 시간에 이루어지도록 하는 것을 말합니다. 정확성, 규정 준수, 효율성을 보장하기 위해 설계된 단계가 포함되어 있으며, 종이 송장은 피합니다. 자동화된 송장 처리는 수작업의 데이터 입력 오류를 크게 줄이고 효율성을 향상시킬 수 있습니다. IronOCR는 강력한 광학 문자 인식(OCR) 소프트웨어 라이브러리로, 디지털 파일로부터 송장 데이터나 텍스트를 추출하여 C# 애플리케이션에서 송장 OCR 처리를 자동화하는 데 뛰어난 도구입니다.

IronOCR와 같은 OCR 소프트웨어를 사용하여 송장 데이터를 처리하는 방법

  1. Visual Studio 프로젝트를 생성합니다.
  2. IronOCR C# 라이브러리를 설치합니다.
  3. 샘플 입력 송장 이미지.
  4. Tesseract를 활용하여 영수증 이미지에서 데이터를 추출합니다.
  5. 이미지의 일부 영역만 읽습니다.

광학 문자 인식 (OCR)

광학 문자 인식은 다양한 문서, PDF, 또는 텍스트 이미지 형태를 편집 가능하고 검색 가능한 데이터로 변환할 수 있도록 하는 기술입니다. OCR 기술은 텍스트 이미지의 문자들을 추출하여 기계가 읽을 수 있게 만듭니다. 고급 OCR 송장 소프트웨어 시스템은 재무 관리 도구와 송장 자동화에 도움을 줍니다.

OCR에 대한 주요 요점

  • 기능: OCR 소프트웨어는 이미지나 텍스트(예: 사진 또는 스캔된 문서)를 스캔하여 문자를 디지털 텍스트로 변환하여 편집, 검색, 저장할 수 있도록 합니다.
  • 응용: OCR은 인쇄된 문서의 디지털화, 송장 처리, 양식 데이터 추출, 자동 번호판 인식(ANPR), 계정 지불 워크플로우, 도서 스캔 등 다양한 산업에서 널리 사용됩니다.
  • 기술: OCR은 문자를 해석하기 위해 빛과 어둠의 패턴을 식별하는 알고리즘을 사용합니다. 현대 OCR 시스템은 정확성을 높이기 위해 기계 학습과 인공지능을 사용하기도 합니다.
  • 장점: OCR은 데이터 입력을 자동화하여 생산성을 향상시키고 오류를 줄이며 데이터 검색과 검색을 용이하게 합니다. 또한 문서 보관을 지원하고 기업이 종이 없는 워크플로우를 관리하도록 도와줍니다.

OCR 기술은 크게 발전하여 문서와 송장 데이터 추출을 처리하는 데 매우 정확하고 유용하게 되었으며, 다양한 송장 형식에서 수작업 데이터 입력을 줄이고 수동 송장 처리를 제거하며 데이터 보안을 강화하는 데 도움이 됩니다.

IronOCR

IronOCR는 .NET (C#)용 강력한 광학 문자 인식(OCR) 라이브러리로, 개발자가 이미지, PDF 및 기타 문서 형식에서 텍스트를 추출하고, OCR 송장 소프트웨어를 개발하고, 계정 지불 워크플로우를 구현할 수 있습니다. 계정 지불 시스템 또는 회계 시스템에 OCR 기능을 통합하기 위한 사용하기 쉬운 API를 제공합니다.

IronOCR 의 주요 기능

  • 텍스트 추출: PNG, JPG, TIFF 등 다양한 이미지 형식과 PDF, 멀티 페이지 PDF(회계 소프트웨어 포함)에서 텍스트를 추출할 수 있습니다.
  • 정확성: IronOCR는 선진화된 알고리즘과 기계 학습 기술을 사용하여 계정 지불 프로세스 및 조기 결제 할인을 위한 텍스트 인식에서 높은 정확도를 제공합니다, 심지어 노이즈가 많거나 품질이 낮은 이미지에도 정확합니다.
  • 언어 지원: 이 라이브러리는 영어, 스페인어, 프랑스어 등 여러 언어를 지원하여, 다양한 언어의 텍스트를 인식하는 데 도움을 줍니다.
  • 사용 용이성: IronOCR는 개발자가 OCR 기술에 대한 깊은 기술적 지식 없이도 애플리케이션에 OCR 기능을 빠르게 통합할 수 있는 간단한 API를 제공합니다.
  • 바코드 및 QR 코드 인식: 표준 텍스트 인식 외에도 IronOCR는 이미지에서 바코드 및 QR 코드를 감지하고 추출할 수 있습니다.
  • PDF 지원: 스캔된 PDF에서 텍스트를 읽고 추출할 수 있어 송장, 영수증 및 기타 비즈니스 문서를 처리하는 데 유용합니다.
  • 커스터마이제이션: 이 라이브러리는 특정 요구에 따라 OCR 설정을 조정하거나 다른 이미지 해상도를 처리할 수 있는 커스터마이징을 허용합니다.

필수 조건

시작하기 전에 다음을 확인하세요:

  • Visual Studio가 컴퓨터에 설치되어 있습니다.
  • C# 프로그래밍의 기본적 이해가 있습니다.
  • 프로젝트에 IronOCR NuGet 패키지가 설치되어 있습니다.

1단계: Visual Studio 프로젝트 생성

Visual Studio를 열고 새 프로젝트 만들기를 클릭하세요.

C#에서의 OCR 청구서 처리(개발자 튜토리얼): 그림 1 - 새로운 프로젝트

옵션에서 콘솔 앱을 선택합니다.

C#에서의 OCR 청구서 처리(개발자 튜토리얼): 그림 2 - 콘솔 앱

프로젝트 이름과 경로를 제공합니다.

C#에서의 OCR 청구서 처리(개발자 튜토리얼): 그림 3 - 프로젝트 구성

.NET 버전 유형을 선택합니다.

C#에서의 OCR 청구서 처리(개발자 튜토리얼): 그림 4 - 타겟 프레임워크

2단계: IronOCR C# 라이브러리 설치

Visual Studio의 프로젝트에서 도구 > NuGet 패키지 관리자 > 솔루션에 대한 NuGet 패키지 관리로 이동합니다. 찾기 탭을 클릭하고 IronOCR를 검색합니다. IronOCR를 선택하고 설치를 클릭합니다.

C#에서의 OCR 청구서 처리(개발자 튜토리얼): 그림 5 - IronOCR

다른 옵션은 콘솔과 아래 명령을 사용하는 것입니다.

dotnet add package IronOcr --version 2024.12.2

3단계: 샘플 입력 송장 이미지

견본 디지털 송장 이미지 및 송장 번호.

C#에서의 OCR 청구서 처리(개발자 튜토리얼): 그림 6 - 샘플 입력

4단계: Tesseract 사용 및 영수증 이미지로부터 데이터 추출

이제 아래 코드를 사용하여 OCR 송장 처리용으로 송장에서 데이터를 추출하세요.

using IronOcr;

// Set the license key
License.LicenseKey = "Your License";
string filePath = "sample1.jpg"; // Path to the invoice image

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Load the image for OCR
using (var ocrInput = new OcrInput())
{
    ocrInput.LoadImage(filePath);

    // Optionally apply filters if needed 
    ocrInput.Deskew();
    // ocrInput.DeNoise();

    // Perform OCR to extract text
    var ocrResult = ocr.Read(ocrInput);

    // Output the extracted text
    Console.WriteLine("Extracted Text:");
    Console.WriteLine(ocrResult.Text);

    // Next steps would involve processing the extracted text
}
using IronOcr;

// Set the license key
License.LicenseKey = "Your License";
string filePath = "sample1.jpg"; // Path to the invoice image

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Load the image for OCR
using (var ocrInput = new OcrInput())
{
    ocrInput.LoadImage(filePath);

    // Optionally apply filters if needed 
    ocrInput.Deskew();
    // ocrInput.DeNoise();

    // Perform OCR to extract text
    var ocrResult = ocr.Read(ocrInput);

    // Output the extracted text
    Console.WriteLine("Extracted Text:");
    Console.WriteLine(ocrResult.Text);

    // Next steps would involve processing the extracted text
}
$vbLabelText   $csharpLabel

코드 설명

제공된 코드는 C#에서 IronOCR 라이브러리를 사용하여 이미지(예: 송장)에서 OCR(광학 문자 인식)로 텍스트를 추출하는 방법을 보여줍니다. 다음은 코드의 각 부분에 대한 설명입니다.

  1. 라이선스 키 설정:

    • 코드는 IronOCR의 라이선스 키를 설정하는 것으로 시작합니다. 이 키는 라이브러리의 모든 기능을 사용하기 위해 필요합니다. 유효한 라이선스가 있다면 'Your License'를 실제 라이선스 키로 교체하세요.
  2. 입력 파일 지정:

    • filePath 변수는 청구서 이미지를 포함하는 위치(이 경우, 'sample1.jpg')를 저장합니다. 이 파일이 텍스트 추출을 위해 처리될 것입니다.
  3. OCR 인스턴스 생성:

    • IronTesseract의 인스턴스가 생성됩니다. IronTesseract은(는) 입력 데이터에 대해 OCR 작업을 수행하는 클래스입니다.
  4. 이미지 로딩:

    • 코드는 OcrInput 객체를 생성하고, filePath에 명시된 이미지를 LoadImage 방법을 사용해 로드합니다.
  5. 이미지 필터 적용:

    • 코드는 옵션으로 Deskew()와 같은 필터를 적용하여 왜곡된 이미지를 수정하고 OCR 정확성을 향상시킵니다.
  6. OCR 수행:

    • ocr.Read() 방법은 로드된 이미지에서 텍스트를 추출하고, 추출된 텍스트를 포함하는 OcrResult을 반환합니다.
  7. 추출한 텍스트 표시:
    • 추출된 텍스트는 콘솔에 출력됩니다. 이 텍스트는 IronOCR이 이미지에서 인식한 것으로, 추가 처리에 사용할 수 있습니다.

출력

C#에서의 OCR 청구서 처리(개발자 튜토리얼): 그림 7 - 청구서 번호가 포함된 OCR 출력

5단계: 이미지의 특정 영역만 읽기

효율성을 높이기 위해 이미지의 일부분만 추출 처리할 수 있습니다.

using IronOcr;
using IronSoftware.Drawing;

// Set the license key
License.LicenseKey = "Your Key";
string filePath = "sample1.jpg"; // Path to the invoice image

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Load the image for OCR
using (var ocrInput = new OcrInput())
{
    // Define the region of interest
    var ContentArea = new Rectangle(x: 0, y: 0, width: 1000, height: 250);
    ocrInput.LoadImage(filePath, ContentArea);

    // Optionally apply filters if needed 
    ocrInput.Deskew();
    // ocrInput.DeNoise();

    // Perform OCR to extract text
    var ocrResult = ocr.Read(ocrInput);

    // Output the extracted text
    Console.WriteLine("Extracted Text:");
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using IronSoftware.Drawing;

// Set the license key
License.LicenseKey = "Your Key";
string filePath = "sample1.jpg"; // Path to the invoice image

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Load the image for OCR
using (var ocrInput = new OcrInput())
{
    // Define the region of interest
    var ContentArea = new Rectangle(x: 0, y: 0, width: 1000, height: 250);
    ocrInput.LoadImage(filePath, ContentArea);

    // Optionally apply filters if needed 
    ocrInput.Deskew();
    // ocrInput.DeNoise();

    // Perform OCR to extract text
    var ocrResult = ocr.Read(ocrInput);

    // Output the extracted text
    Console.WriteLine("Extracted Text:");
    Console.WriteLine(ocrResult.Text);
}
$vbLabelText   $csharpLabel

코드 설명

이 코드는 IronOCR을 사용하여 이미지 필터 옵션으로 특정 영역의 이미지에서 텍스트를 추출합니다. 여기 각 부분의 설명이 있습니다:

  1. 라이선스 설정:

    • IronOCR의 라이선스 키를 설정합니다. 이는 라이브러리의 OCR 기능을 사용하기 위해 필요합니다. 'Your Key'를 유효한 라이선스 키로 교체하세요.
  2. 이미지 파일 경로 정의:

    • 텍스트 추출을 위한 콘텐츠를 포함하는 송장 이미지의 파일 경로를 지정합니다.
  3. OCR 인스턴스 생성:

    • OCR 작업을 수행하기 위해 IronTesseract의 인스턴스가 생성됩니다.
  4. 처리할 영역 정의:

    • 이미지 내의 사각형 영역을 지정하여 관련 섹션에 OCR 프로세스를 집중시킴으로써 효율성을 높입니다.
  5. 이미지 로딩:

    • 파일에서 이미지의 지정된 콘텐츠 영역을 로드합니다. 이는 이미지의 특정 부분으로 OCR 처리를 제한합니다.
  6. 필터 적용:

    • Deskew()와 같은 필터를 적용하여 이미지 정렬을 향상시키고, 필요시 DeNoise()를 적용하여 이미지를 정리하고 OCR 정확성을 향상시킵니다.
  7. 텍스트 추출:

    • 정의된 영역에서 텍스트를 읽고 이를 OcrResult에 저장합니다.
  8. 추출된 텍스트 출력:
    • 추가 사용을 위해 OCR 처리된 텍스트를 콘솔에 출력합니다.

출력

C#에서의 OCR 청구서 처리(개발자 튜토리얼): 그림 8 - 추출된 출력

라이선스 (체험판 이용 가능)

IronOCR은 송장에서 데이터를 추출하기 위해 키가 필요합니다. 라이선스 페이지에서 개발자 체험판 키를 받으십시오.

using IronOcr; 
License.LicenseKey = "Your Key";
using IronOcr; 
License.LicenseKey = "Your Key";
$vbLabelText   $csharpLabel

결론

이 기사는 IronOCR을 사용한 송장 처리의 기본 예제를 제공했습니다. 필요한 요구에 맞춘 맞춤화 및 확장이 가능합니다.

IronOCR는 이미지와 PDF에서 텍스트를 추출하는 효율적이고 쉽게 통합할 수 있는 솔루션을 제공하여 송장 처리에 이상적입니다. C# 문자열 조작이나 정규 표현식과 함께 IronOCR를 사용하면 송장에서 중요한 데이터를 신속하게 처리하고 추출할 수 있습니다.

이것은 송장 처리의 기본적인 예이며, 더 고급 구성(예: 언어 인식, 다중 페이지 PDF 처리 등)을 통해 특정 사용 사례에 대한 정확도를 높이기 위해 OCR 결과를 미세 조정할 수 있습니다.

IronOCR의 API는 유연하며 송장 처리를 넘어 영수증 스캔, 문서 변환, 데이터 입력 자동화 등의 다양한 OCR 작업에 사용할 수 있습니다.

자주 묻는 질문

C#에서 송장 데이터 처리를 자동화하려면 어떻게 해야 할까요?

IronOCR 사용하여 디지털 송장 파일에서 텍스트와 데이터를 추출함으로써 C#에서 송장 데이터 처리를 자동화할 수 있습니다. 이를 통해 수동 데이터 입력 오류를 줄이고 송장 처리 효율성을 향상시킬 수 있습니다.

송장 처리를 위한 OCR 설정에는 어떤 단계가 포함되나요?

송장 처리를 위한 OCR을 설정하려면 먼저 Visual Studio 프로젝트를 생성하고 IronOCR 라이브러리를 설치한 다음 샘플 송장 이미지를 사용하세요. 그러면 IronOCR의 기능을 활용하여 송장 데이터를 추출하고 처리할 수 있습니다.

OCR을 사용하여 송장의 특정 영역에서 데이터를 추출하는 방법은 무엇입니까?

IronOCR 사용하면 사각형 영역을 설정하여 이미지의 특정 영역을 OCR 처리 대상으로 지정할 수 있습니다. 이 기능을 통해 송장에서 필요한 부분만 선택적으로 처리함으로써 효율성과 정확성을 높일 수 있습니다.

IronOCR 에서 테서랙트의 역할은 무엇인가요?

Tesseract는 IronOCR 의 구성 요소이며 이미지에서 텍스트를 추출하는 데 중요한 역할을 합니다. 텍스트가 포함된 이미지를 기계가 읽을 수 있는 데이터로 변환하는 데 도움을 주며, 이는 C# 애플리케이션에서 송장 처리를 자동화하는 데 필수적입니다.

OCR 소프트웨어는 여러 언어로 된 텍스트를 인식할 수 있습니까?

네, IronOCR 다국어를 지원하여 영어, 스페인어, 프랑스어 등 다양한 언어로 된 텍스트를 인식하고 처리할 수 있으므로 글로벌 송장 처리에 있어 활용도가 높습니다.

IronOCR 송장 처리에 사용하면 어떤 이점이 있습니까?

IronOCR 송장 처리에 사용하면 텍스트 추출 정확도 향상, 다국어 지원, 바코드 인식 및 PDF 처리 기능과 같은 이점을 누릴 수 있으며, 이 모든 기능은 회계 부서의 지급 업무 흐름을 간소화합니다.

송장 처리 요구 사항에 맞게 OCR 설정을 사용자 지정하려면 어떻게 해야 합니까?

IronOCR 개발자가 OCR 설정을 사용자 지정할 수 있는 간단한 API를 제공합니다. 이러한 유연성을 통해 다양한 송장 형식이나 언어 처리와 같은 특정 송장 처리 요구 사항에 맞는 맞춤형 솔루션을 구현할 수 있습니다.

디지털 송장 관리에서 OCR의 중요성은 무엇일까요?

OCR은 디지털 송장 관리에서 매우 중요한 역할을 합니다. 송장에서 데이터를 자동으로 추출하여 수작업량을 줄이고 오류를 최소화하며 효율적이고 정확한 금융 거래 처리를 보장하기 때문입니다.

IronOCR 기능을 테스트해 볼 수 있는 평가판이 있나요?

네, IronOCR 라이선스 페이지에서 개발자 평가판 키를 제공하므로 구매 전에 소프트웨어의 모든 기능을 테스트해 볼 수 있습니다.

IronOCR 문서 변환 및 데이터 입력 자동화를 어떻게 개선합니까?

IronOCR 다양한 형식의 문서에서 높은 정확도로 텍스트를 추출하여 문서 변환 및 데이터 입력 자동화를 향상시키고, C# 애플리케이션에 원활하게 통합하여 자동 데이터 처리를 가능하게 합니다.

칸나오팟 우돈판트
소프트웨어 엔지니어
카나팟은 소프트웨어 엔지니어가 되기 전 일본 홋카이도 대학교에서 환경 자원학 박사 학위를 취득했습니다. 학위 과정 중에는 생물생산공학과 소속 차량 로봇 연구실에서 활동하기도 했습니다. 2022년에는 C# 기술을 활용하여 Iron Software의 엔지니어링 팀에 합류했고, 현재 IronPDF 개발에 집중하고 있습니다. 카나팟은 IronPDF에 사용되는 대부분의 코드를 직접 작성하는 개발자로부터 배울 수 있다는 점에 만족하며, 동료들과의 소통을 통해 배우는 것 외에도 Iron Software에서 일하는 즐거움을 누리고 있습니다. 코딩이나 문서 작업을 하지 않을 때는 주로 PS5로 게임을 하거나 The Last of Us를 다시 시청하는 것을 즐깁니다.

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me