푸터 콘텐츠로 바로가기
IRONOCR 사용
HTML을 PDF로 변환: C# .NET 을 이용한 빠른 튜토리얼

IronOCR 사용하여 스캔 이미지에서 표 데이터 추출하기: 라이브 데모 요약

스캔된 이미지에서 데이터를 추출하는 것은 특히 테이블과 같은 구조화된 데이터가 포함된 경우 일반적인 도전 과제입니다. IronOCR의 고급 머신러닝 기능을 통해 셀 값 및 위치를 포함한 표 데이터를 원활하게 추출할 수 있습니다. 이 데모에서는 Shadman Majid, Software Sales Engineer가 단계별로 코드 구현을 안내하고, Anne Lazarakis, Sales and Marketing Director가 Iron Software 고객의 실제 사용 사례를 공유합니다.

실제 사용 사례

Ironocr Extract Table Data 4 related to 실제 사용 사례

Anne Lazarakis, Sales and Marketing Director에 의해 설명됨*

보험 청구 프로세싱 (Opyn Market)

미국의 엄격한 규제를 받는 의료 보험업계에서 Opyn Market과 같은 회사는 여전히 많은 문서를 팩스로 받습니다. 이러한 스캔된 문서에는 종종 내부 시스템에 정확히 추출하고 입력해야 하는 테이블 데이터가 포함되어 있습니다. IronOCR를 사용함으로써 이들은 이 과정을 자동화하여 수작업을 줄이고 인간 오류의 가능성을 없애고 있습니다.

물류 및 식품 유통 (iPAP)

iPAP, 미국 최대 치즈 유통업체는 IronOCR를 사용하여 200개 이상의 고객 주문을 관리합니다. 이들의 송장은 다양한 형식으로 오며 일관되지 않은 표 레이아웃을 가지고 있습니다. IronOCR는 문서의 다양한 형식에도 불구하고 이들이 스캔된 문서에서 구매 주문 번호, 배송 날짜, 항목 세부 정보를 효율적으로 추출할 수 있도록 도와줍니다. 이 자동화는 연간 $40,000에서 $45,000를 절약했습니다.

Ironocr Extract Table Data 2 related to 물류 및 식품 유통 (iPAP)


기술 개요

Ironocr Extract Table Data 5 related to 기술 개요

소프트웨어 영업 엔지니어* Shadman Majid와의 라이브 코딩 세션

IronOCR는 독점적인 기계 학습 모델을 사용하여 스캔된 문서에서 표 데이터를 감지하고 추출합니다. 이 기능은 다음을 지원합니다:

  • 표 셀 및 좌표의 추출
  • 스캔 이미지 및 다중 프레임 PDF의 OCR
  • C#, VB.NET, .NET Standard, .NET Framework, .NET Core와의 호환성

Ironocr Extract Table Data 3 related to 기술 개요

이 기능에 접근하려면 다음이 필요합니다:

이 패키지는 표 구조 감지 및 정확한 OCR에 필요한 학습된 ML 모델을 포함합니다.

표 추출 예제 코드

다음은 IronOCR를 사용하여 이미지에서 표 데이터를 추출하는 방법을 보여주는 C# 코드 예제입니다:

// Import the necessary IronOCR namespaces
using IronOcr;

// Initialize the IronTesseract to handle OCR processes
var Ocr = new IronTesseract();

// Load the image containing the table
using (var input = new OcrInput("invoice.jpg"))
{
    // Perform OCR and extract text data including tables
    var result = Ocr.Read(input);

    // Iterate through each page in the document
    foreach (var page in result.Pages)
    {
        // Iterate through each table found on the page
        foreach (var table in page.Tables)
        {
            Console.WriteLine("Table found:");
            // Iterate through each row in the table
            foreach (var row in table.Rows)
            {
                // Convert the row of cells to a comma-separated string
                var cells = string.Join(", ", row.Cells.Select(cell => cell.Text));
                Console.WriteLine(cells);
            }
        }
    }
}
// Import the necessary IronOCR namespaces
using IronOcr;

// Initialize the IronTesseract to handle OCR processes
var Ocr = new IronTesseract();

// Load the image containing the table
using (var input = new OcrInput("invoice.jpg"))
{
    // Perform OCR and extract text data including tables
    var result = Ocr.Read(input);

    // Iterate through each page in the document
    foreach (var page in result.Pages)
    {
        // Iterate through each table found on the page
        foreach (var table in page.Tables)
        {
            Console.WriteLine("Table found:");
            // Iterate through each row in the table
            foreach (var row in table.Rows)
            {
                // Convert the row of cells to a comma-separated string
                var cells = string.Join(", ", row.Cells.Select(cell => cell.Text));
                Console.WriteLine(cells);
            }
        }
    }
}
$vbLabelText   $csharpLabel
  • 이미지 로딩: 스크립트는 IronTesseract 엔진을 초기화하고 처리하려는 invoice.jpg이라는 이미지 파일을 로딩하는 것으로 시작합니다.
  • OCR 실행: 입력에 대해 텍스트 데이터를 추출하기 위한 OCR을 수행하며, 특히 표에 중점을 둡니다.
  • 표 추출: 스크립트는 감지된 각 표와 그 행을 반복하며 셀 내용을 구조화된 방식으로 출력합니다.

이 스크립트를 실행하기 전에 IronOCR에 필요한 NuGet 패키지를 설치했는지 확인하세요.


결론

IronOCR는 스캔된 문서에서 복잡한 표 데이터를 자동으로 추출하는 것을 쉽게 만듭니다. 의료, 물류, 금융, 제조 등 어느 분야에 있든 이 솔루션은 신뢰성, 정확성, 비용 절감 효율성을 제공합니다. 몇 줄의 코드만으로 수동 데이터 입력을 제거하고 인간 오류를 줄일 수 있습니다.

실제로 보고 싶으신가요? 저희 엔지니어 중 한 명과의 라이브 데모를 여기서 예약하세요.

자주 묻는 질문

C#을 사용하여 스캔한 이미지에서 테이블 데이터를 추출하는 방법은 무엇인가요?

IronOCR의 고급 머신러닝 기능을 사용하여 스캔한 이미지에서 표 데이터를 추출할 수 있습니다. 이 과정은 IronTesseract 엔진을 사용하여 이미지에 OCR을 적용하고 셀 값 및 좌표를 포함한 정보를 추출하는 방식으로 진행됩니다.

스캔한 문서에서 표 데이터를 추출하는 것의 실제 응용 사례는 무엇일까요?

실제 적용 사례로는 팩스 문서에서 표 형식 데이터를 추출하여 보험금 청구 처리를 자동화하는 것과, Opyn Market 및 iPAP와 같은 회사에서 보여준 것처럼 다양한 형식과 일관되지 않은 표 레이아웃을 가진 송장이 제공되는 물류 분야의 고객 주문 관리 등이 있습니다.

IronOCR 테이블 데이터 추출을 위해 어떤 기술적 기능을 제공합니까?

IronOCR 테이블 셀 및 좌표 추출, 스캔 이미지 및 다중 프레임 PDF의 OCR, C#, VB .NET, .NET Standard, .NET Framework 및 .NET Core 와의 호환성과 같은 기능을 제공합니다.

IronOCR 사용하여 테이블 데이터를 추출하는 코드에는 어떤 단계가 포함되나요?

이 과정에는 IronTesseract 엔진 초기화, 이미지 로드, OCR을 수행하여 텍스트 데이터 추출, 그리고 감지된 각 테이블과 해당 행을 순회하여 셀 내용을 출력하는 단계가 포함됩니다.

IronOCR 사용하여 테이블 데이터를 추출하는 데 필요한 패키지는 무엇입니까?

테이블 감지 및 정확한 OCR에 필요한 학습된 머신러닝 모델을 사용하려면 IronOCR NuGet 패키지와 IronOcr.Extensions.AdvancedScanning 패키지가 필요합니다.

IronOCR 의료 및 물류 산업의 효율성을 어떻게 향상시키나요?

IronOCR 스캔한 문서에서 복잡한 표 데이터를 자동으로 추출하여 수작업과 인적 오류를 줄여주므로 의료 및 물류와 같은 산업 분야에서 상당한 효율성과 비용 절감을 제공합니다.

IronOCR의 기능을 직접 시연해 볼 수 있을까요?

네, Iron Software의 엔지니어와 함께하는 라이브 데모를 예약하시면 IronOCR 작동 방식을 직접 확인하고 테이블 데이터 추출 기능에 대해 자세히 알아볼 수 있습니다.

칸나오팟 우돈판트
소프트웨어 엔지니어
카나팟은 소프트웨어 엔지니어가 되기 전 일본 홋카이도 대학교에서 환경 자원학 박사 학위를 취득했습니다. 학위 과정 중에는 생물생산공학과 소속 차량 로봇 연구실에서 활동하기도 했습니다. 2022년에는 C# 기술을 활용하여 Iron Software의 엔지니어링 팀에 합류했고, 현재 IronPDF 개발에 집중하고 있습니다. 카나팟은 IronPDF에 사용되는 대부분의 코드를 직접 작성하는 개발자로부터 배울 수 있다는 점에 만족하며, 동료들과의 소통을 통해 배우는 것 외에도 Iron Software에서 일하는 즐거움을 누리고 있습니다. 코딩이나 문서 작업을 하지 않을 때는 주로 PS5로 게임을 하거나 The Last of Us를 다시 시청하는 것을 즐깁니다.

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me