IRONOCR 사용

컴퓨터 비전을 활용한 OCR이 텍스트 인식 정확도를 향상시키는 방법

Q: 컴퓨터 비전은 OCR 정확도를 어떻게 향상시키나요?

컴퓨터 비전 기술은 OCR 인식 전에 이미지 전처리를 적용하여 정확도를 향상시킵니다. 기울기 보정, 노이즈 제거, 이진화, 해상도 향상과 같은 기술은 OCR 엔진이 문자를 잘못 읽거나 건너뛰게 만드는 물리적 이미지 캡처 결함을 수정합니다. 신경망 모델은 글꼴, 필기체 스타일, 손상된 이미지 등 다양한 환경에서 텍스트 패턴을 인식하도록 학습하여 정확도를 더욱 향상시킵니다.

Q: IronOCR 어떤 전처리 필터를 지원하나요?

IronOCR OcrInput API를 통해 기울기 보정, 노이즈 제거, 이진화, 해상도 향상 및 여러 추가 필터를 지원합니다. 한 번의 처리 과정에서 여러 필터를 연결할 수 있으며, OcrInputFilterWizard를 사용하여 특정 문서 유형에 가장 적합한 필터 조합을 자동으로 찾을 수 있습니다.

Q: IronOCR 어떤 딥러닝 모델을 사용하나요?

IronOCR LSTM(장단기 메모리) 신경망 아키텍처를 사용하는 Tesseract 5로 구동됩니다. 이 CRNN 모델은 컨볼루션 특징 추출과 결합하여 기존 템플릿 기반 OCR 시스템보다 글꼴 변형, 부분 가림, 이미지 손상 등을 더욱 효과적으로 처리합니다.

Q: IronOCR 사용하여 영역 기반 OCR을 수행하는 방법은 무엇입니까?

OcrInput 객체의 AddRegion 메서드에 픽셀 단위로 대상 영역의 x, y, 너비 및 높이를 정의하는 CropRectangle 매개변수를 사용하십시오. 그러면 IronOCR 해당 영역으로 인식 범위를 제한하여 양식이나 송장과 같은 구조화된 문서의 속도와 정확도를 모두 향상시킵니다.

Q: IronOCR 스캔한 문서에서 검색 가능한 PDF를 생성할 수 있습니까?

예. OcrInput 객체에서 Read 메서드를 호출한 후, OcrResult 객체에서 SaveAsSearchablePdf 메서드를 호출하십시오. 이렇게 하면 인식된 텍스트가 원본 스캔 이미지 아래에 숨겨진 레이어로 포함된 PDF 파일이 생성되어 문서의 시각적 모양을 유지하면서 전체 텍스트 검색이 가능해집니다.

Q: IronOCR 몇 개의 언어를 지원하나요?

IronOCR 125개 이상의 언어를 지원합니다. 각 언어는 NuGet 패키지로 배포되는 전용 Tesseract LSTM 모델을 통해 지원됩니다. 두 개 이상의 언어가 혼합된 문서의 경우 여러 언어를 동시에 지정할 수 있습니다.

Q: 전처리 필터는 어떤 순서로 적용해야 할까요?

일반적으로 이미지 정렬을 먼저 수행하여 후속 필터가 올바르게 정렬된 이미지에서 작동하도록 합니다. 노이즈 제거 후 이진화를 수행하여 흑백 변환 과정에서 발생하는 아티팩트가 영구적으로 저장되는 것을 방지합니다. 원본 이미지가 저해상도인 경우, 노이즈 제거 전에 업스케일링을 수행하면 압축 아티팩트가 증폭되는 것을 방지할 수 있으므로 해상도 향상을 초기에 적용합니다.

Q: IronOCR 에서 신뢰도 점수는 어떻게 작동하나요?

IronOCR OcrResult에서 인식된 각 단어에 대해 0에서 1 사이의 신뢰도 점수를 반환합니다. 일반적으로 비즈니스 문서의 경우 0.85 이상의 점수가 신뢰할 수 있는 것으로 간주됩니다. 사용자가 설정한 임계값 미만의 단어는 수동 검토를 위해 표시하거나 2차 인식 과정을 거치도록 할 수 있습니다.

칸나팟 우돈판트

업데이트됨:3월 1, 2026

이미지에서 텍스트를 추출하는 것은 문서가 비뚤어지거나, 희미하거나, 조명이 나쁜 경우까지 간단해 보입니다. 이것은 컴퓨터 비전이 광학 문자 인식을 취약한 프로세스에서 신뢰할 수 있는 것으로 변환하는 곳입니다. 지능형 이미지 분석을 데이터 추출 전에 적용하여, OCR 시스템은 그렇지 않으면 손상된 결과를 낼 스캔된 문서 전반에 걸쳐 인간 수준의 성능에 근접한 인식 정확도를 달성할 수 있습니다.

컴퓨터 비전을 사용한 OCR는 디지털 변환 이니셔티브의 기초 기술이 되었으며, 다양한 문서 유형에서 수동 데이터 입력을 제거합니다. 이 가이드는 이 기술들이 어떻게 통합되어 .NET 애플리케이션의 텍스트 인식을 극적으로 향상시키는지 탐색합니다. 품질이 좋지 않은 스캔을 수정하는 전처리 필터부터 최신 OCR 엔진을 구동하는 신경망 아키텍처에 이르기까지 이러한 개념을 이해하면 현실 세계의 입력 이미지를 우아하게 처리하는 문서 처리 시스템을 구축할 수 있습니다.

아래의 코드 예제를 따라하려면 NuGet을 통해 IronOCR를 설치하세요:

dotnet add package IronOcr

dotnet add package IronOcr

SHELL

또는 NuGet 패키지 관리자 콘솔을 사용하세요:

Install-Package IronOcr

Install-Package IronOcr

SHELL

IronOCR NuGet 패키지 페이지를 방문하여 설치하기 전에 최신 버전을 확인하세요.

컴퓨터 비전과 OCR의 관계는 무엇입니까?

컴퓨터 비전은 기계가 시각적 정보를 해석하도록 가르치는 광범위한 분야를 포괄하며, OCR은 이미지 파일 내의 인쇄된 텍스트 또는 손글씨를 기계로 인코딩된 텍스트로 변환하는 데 중점을 둡니다. 광학 문자 인식은 이미지 분석 및 패턴 인식을 위한 동일한 기본 기술의 많은 부분을 활용하여 컴퓨터 비전 내의 특화된 응용 프로그램으로 작동합니다.

현대 OCR 파이프라인은 상호 연결된 세 가지 단계로 구성됩니다. 텍스트 감지는 스캔된 이미지 내에서 개별 문자를 포함하는 텍스트 영역을 식별하고, 이러한 영역을 배경, 그래픽 및 기타 시각적 요소로부터 분리합니다. 이미지 전처리는 감지된 영역을 강화하여 왜곡을 수정하고 대비를 개선하여 문자 이미지를 더 구별할 수 있게 합니다. 마지막으로, 문자 인식은 패턴 매칭 및 신경망 추론을 적용하여 저장된 각 글리프의 시각적 표현을 해당 디지털 텍스트로 변환합니다.

전통적인 OCR 기술은 이러한 단계 중 어느 하나라도 불완전한 입력을 받을 때 어려움을 겪었습니다. 약간 회전된 스캔은 완전한 엉뚱한 결과를 초래할 수 있으며, 저해상도 입력 이미지나 배경 패턴이 있는 인쇄된 문서는 종종 완전히 실패했습니다. 컴퓨터 비전 기술은 각 파이프라인 단계를 더 적응 가능하고 탄력적으로 만들어 이러한 한계를 해결하여 비즈니스 문서, 은행 명세서, 심지어 손으로 쓴 메모까지 성공적으로 인식할 수 있게 합니다.

.NET 프로젝트에서 OCR을 작동시키는 가장 빠른 방법은 기본 인식 패스를 실행하는 것입니다.

using IronOcr;

// Initialize the optical character reader
var ocr = new IronTesseract();

// Load scanned document or image file
using var input = new OcrInput();
input.LoadImage("document.png");

// Perform text recognition and data extraction
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);

using IronOcr;

// Initialize the optical character reader
var ocr = new IronTesseract();

// Load scanned document or image file
using var input = new OcrInput();
input.LoadImage("document.png");

// Perform text recognition and data extraction
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);

Imports IronOcr

' Initialize the optical character reader
Dim ocr As New IronTesseract()

' Load scanned document or image file
Using input As New OcrInput()
    input.LoadImage("document.png")

    ' Perform text recognition and data extraction
    Dim result As OcrResult = ocr.Read(input)
    Console.WriteLine(result.Text)
End Using

$vbLabelText $csharpLabel

위의 코드는 OCR 워크플로우의 가장 간단한 예제를 보여주며 IronOCR를 사용합니다. IronTesseract 클래스는 Tesseract 5 엔진 주변에서 관리되는 래퍼를 제공하며, OcrInput는 이미지 파일 로딩과 포맷 변환을 처리합니다. 깨끗하고 잘 정리된 텍스트 문서의 경우, 이 기본 광학 문자 인식 접근법이 종종 충분합니다. 하지만 실제 세계에서 스캔된 문서는 원형 그대로 도착하는 경우가 드물고, 이러한 경우 전처리가 정확한 텍스트 추출에 필수적입니다.

입력

IronOCR를 사용한 컴퓨터 비전의 OCR이 텍스트 인식 정확도를 향상시키는 방법: 이미지 1 - 샘플 입력 이미지

산출

IronOCR를 사용한 컴퓨터 비전의 OCR이 텍스트 인식 정확도를 향상시키는 방법: 이미지 2 - 콘솔 출력

이미지 전처리가 텍스트 인식을 어떻게 개선합니까?

이미지 전처리는 OCR 엔진이 분석하기 전에 입력 품질을 향상시키기 위해 컴퓨터 비전 작업을 적용합니다. 이러한 변환은 OCR 실패의 가장 일반적인 원인인 회전, 잡음, 저조도, 해상도 부족을 해결합니다. 각 전처리 기술은 특정 이미지 결함을 대상으로 하며, 이를 전략적으로 결합함으로써 그렇지 않으면 읽을 수 없는 인쇄 문서 및 스캔 이미지를 복구할 수 있습니다.

기울기 보정은 문서가 각도로 스캔될 때 발생하는 회전 불일치를 수정합니다. 약간의 회전이라도 OCR 정확도에 크게 영향을 미치는데, 이는 광학 문자 인식 소프트웨어가 텍스트 라인이 수평으로 이어지기를 기대하기 때문입니다. 기울기 보정 작업은 텍스트 라인 각도를 분석하고 내용을 정렬하기 위해 보정 회전을 적용합니다.

잡음 감소는 개별 문자로 오해될 수 있는 디지털 아티팩트, 스페클 및 스캐너 도입 왜곡을 제거합니다. 배경 패턴, 먼지 자국, 압축 아티팩트는 모두 원본 이미지에서 정확한 문자 세분화를 방해하는 잡음을 만들어냅니다.

이진화는 이미지를 순수한 흑백으로 변환하여 색 정보 및 그레이스케일 그라데이션을 제거합니다. 이 단순화는 인식 엔진이 배경과 인쇄된 텍스트를 더 확실하게 구별할 수 있도록 도와주며, 특히 색이 있는 종이나 색이 바랜 인쇄물에서는 문자 식별이 어려워질 수 있습니다.

해상도 향상은 품질이 낮은 스캔이나 사진의 픽셀 밀도를 증가시킵니다. 더 높은 해상도는 OCR 소프트웨어가 분석할 더 많은 세부 사항을 제공하며, 유사한 문자들 사이를 구분하는 능력을 향상시켜 손상된 입력에서도 성공적인 인식을 가능하게 합니다.

using IronOcr;

var ocr = new IronTesseract();

// Load poor quality scan for document processing
using var input = new OcrInput();
input.LoadImage("low-quality-scan.jpg");

// Apply preprocessing filters for improved accuracy
input.Deskew();                   // Correct rotational skew in scanned image
input.DeNoise();                  // Remove digital artifacts from input
input.Binarize();                 // Convert to black and white for text extraction
input.EnhanceResolution(300);     // Boost to 300 DPI for single character clarity

OcrResult result = ocr.Read(input);
Console.WriteLine($"Extracted: {result.Text}");

using IronOcr;

var ocr = new IronTesseract();

// Load poor quality scan for document processing
using var input = new OcrInput();
input.LoadImage("low-quality-scan.jpg");

// Apply preprocessing filters for improved accuracy
input.Deskew();                   // Correct rotational skew in scanned image
input.DeNoise();                  // Remove digital artifacts from input
input.Binarize();                 // Convert to black and white for text extraction
input.EnhanceResolution(300);     // Boost to 300 DPI for single character clarity

OcrResult result = ocr.Read(input);
Console.WriteLine($"Extracted: {result.Text}");

Imports IronOcr

Dim ocr As New IronTesseract()

' Load poor quality scan for document processing
Using input As New OcrInput()
    input.LoadImage("low-quality-scan.jpg")

    ' Apply preprocessing filters for improved accuracy
    input.Deskew()                   ' Correct rotational skew in scanned image
    input.DeNoise()                  ' Remove digital artifacts from input
    input.Binarize()                 ' Convert to black and white for text extraction
    input.EnhanceResolution(300)     ' Boost to 300 DPI for single character clarity

    Dim result As OcrResult = ocr.Read(input)
    Console.WriteLine($"Extracted: {result.Text}")
End Using

$vbLabelText $csharpLabel

이 예제는 여러 전처리 필터를 체인화한 다음 OCR을 수행합니다. Deskew() 메소드는 문서를 분석하고 회전 교정을 적용합니다. DeNoise()는 텍스트 이미지에서 얼룩과 잡티를 제거합니다. Binarize() 호출은 스캔된 이미지를 보다 깨끗한 텍스트 추출을 위해 순수한 흑백으로 변환하고, EnhanceResolution()은 이미지를 300 DPI로 증폭시켜 정확한 문자 인식을 위한 최소 권장값으로 합니다.

필터 적용 순서가 중요합니다. 보통 기울기 보정은 체인의 초기에 발생해야 하며, 이후 필터들은 적절히 정렬된 이미지에서 더 잘 작동합니다. 잡음 감소를 이진화 이전에 수행하면, 잡음이 흑백 변환에 영구적으로 인코딩되는 것을 방지할 수 있습니다. 특정 문서 유형에 대한 필터 조합을 실험함으로써 OCR 응용 프로그램이 송장, 영수증, 환자 기록, 스캔된 계약서를 처리할 때 주어진 사용 사례에 대한 최적의 순서를 찾을 수 있습니다.

올바른 전처리 필터 조합을 어떻게 선택합니까?

올바른 필터 조합을 선택하는 것은 입력 문서의 본질에 따라 다릅니다. 원근 왜곡이 있는 카메라 촬영 이미지는 기울기 보정 후 잡음 제거가 유리합니다. 팩스나 복사된 문서는 종종 문자 주위의 회색 후광을 잘라내기 위해 적극적인 이진화가 필요합니다. 저해상도 스캔은 다른 필터보다 해상도 향상이 필요한데, 이는 잡음 제거 전에 업스케일링을 통해 압축 아티팩트 증폭을 피하기 때문입니다.

실용적인 접근 방식은 문서 소스 -- 스캐너, 카메라, 팩스, PDF 래스터화 -- 를 분류하고 각각에 맞는 필터 체인을 적용하는 것입니다. IronOCR는 하나의 OcrInput 패스에서 필요한 만큼의 필터를 연결 지원하므로 인식 논리를 다시 작성하지 않고 런타임에 적용할 수 있도록 소스별 프로파일을 설정에서 정의할 수 있습니다.

어떤 딥러닝 모델이 현대 OCR을 지원합니까?

현대의 OCR 엔진은 텍스트 인식 정확도를 혁신적으로 변화시킨 딥러닝 아키텍처에 의존합니다. 정의된 템플릿에 문자를 일치시키던 전통적인 접근법과 달리, 신경망 기반의 OCR 모델은 방대한 훈련 데이터 세트에서 텍스트 패턴을 학습하여 글꼴 변형, 필체 스타일 및 손상된 이미지를 훨씬 효과적으로 처리할 수 있습니다. 이 머신 러닝 접근법은 오늘날 가장 강력한 OCR 솔루션을 가능하게 합니다.

인식 파이프라인은 일반적으로 두 가지 신경망 유형을 결합합니다. 합성곱 신경망(CNN)은 이미지로부터 특징을 추출하는 데 탁월합니다. 이 네트워크는 점진적으로 점점 복잡한 패턴을 식별하는 여러 레이어를 통해 입력 이미지를 처리합니다 -- 기본적인 가장자리와 곡선부터 완전한 문자 형상까지. CNN은 텍스트 영역의 시각적 특성을 인코딩하는 특징 맵을 생성하며, 인쇄된 텍스트와 손으로 쓴 텍스트 모두를 개선된 정확도로 처리합니다.

롱 숏-텀 메모리(LSTM) 네트워크는 이 특징을 순서대로 처리하여 디지털 텍스트가 특정 순서로 흐른다는 것을 인식합니다. LSTM은 이전 입력의 메모리를 유지하여 맥락을 이해하고 언어의 순차적 특성을 처리할 수 있습니다. 이 조합은 종종 CRNN(Convolutional Recurrent Neural Network) 이라고 불리며, 현대 OCR의 정확성의 중추를 형성하고 여러 언어에서 지능형 문자 인식을 가능하게 합니다.

IronOCR를 지원하는 Tesseract 5 엔진은 이전에 전통적인 패턴 인식에만 의존하던 버전보다 크게 발전된 LSTM 기반 아키텍처를 구현합니다. 신경망 접근법은 템플릿 기반 OCR 시스템을 압도하는 특정 글꼴, 부분 폐색 및 이미지 열화를 처리합니다.

using IronOcr;

var ocr = new IronTesseract();

// Configure OCR engine for multilingual text recognition
ocr.Language = OcrLanguage.English;  // IronOCR supports 125+ languages

// Process PDF with mixed handwriting styles and printed text
using var input = new OcrInput("web-report.pdf");
input.Deskew();

OcrResult result = ocr.Read(input);

// Access detailed recognition data including text regions
foreach (var page in result.Pages)
{
    Console.WriteLine($"Page {page.PageNumber}: {page.Text}");
}

using IronOcr;

var ocr = new IronTesseract();

// Configure OCR engine for multilingual text recognition
ocr.Language = OcrLanguage.English;  // IronOCR supports 125+ languages

// Process PDF with mixed handwriting styles and printed text
using var input = new OcrInput("web-report.pdf");
input.Deskew();

OcrResult result = ocr.Read(input);

// Access detailed recognition data including text regions
foreach (var page in result.Pages)
{
    Console.WriteLine($"Page {page.PageNumber}: {page.Text}");
}

Imports IronOcr

Dim ocr As New IronTesseract()

' Configure OCR engine for multilingual text recognition
ocr.Language = OcrLanguage.English  ' IronOCR supports 125+ languages

' Process PDF with mixed handwriting styles and printed text
Using input As New OcrInput("web-report.pdf")
    input.Deskew()

    Dim result As OcrResult = ocr.Read(input)

    ' Access detailed recognition data including text regions
    For Each page In result.Pages
        Console.WriteLine($"Page {page.PageNumber}: {page.Text}")
    Next
End Using

$vbLabelText $csharpLabel

IronTesseract 클래스는 .NET 인터페이스를 통해 Tesseract 5의 신경망 기능에 대한 접근을 제공합니다. OcrResult 객체에는 추출된 텍스트뿐 아니라 페이지, 문단, 줄, 개별 단어의 신뢰도 점수와 경계 좌표를 포함한 구조화된 데이터가 포함되어 있습니다.

입력

IronOCR를 사용한 컴퓨터 비전의 OCR이 텍스트 인식 정확도를 향상시키는 방법: 이미지 3 - 샘플 PDF 입력

산출

IronOCR를 사용한 컴퓨터 비전의 OCR이 텍스트 인식 정확도를 향상시키는 방법: 이미지 4 - OCR 출력

이 구조화된 출력은 단순 텍스트 추출 이상의 응용 프로그램에 유용합니다. 문서 처리 시스템은 단어 위치를 사용하여 복잡한 레이아웃을 이해할 수 있으며, 품질 보증 워크플로는 신뢰도가 낮은 영역을 표시하여 인간 검토를 수행할 수 있습니다. 신경망 아키텍처는 인식된 텍스트와 함께 풍부한 메타데이터를 제공하여 대규모 비구조적 데이터를 효율적으로 처리할 수 있는 AI 기반 OCR 솔루션을 가능하게 합니다.

IronOCR는 다국어 문서를 어떻게 처리합니까?

IronOCR는 125개 이상의 언어를 지원하며 각 언어는 전용 Tesseract LSTM 언어 모델에 의해 지원됩니다. Language 속성을 IronTesseract에서 설정하여 언어를 선택한 후 Read를 호출합니다. 두 가지 언어가 혼합된 문서 - 예를 들어 독일어 계약서에 영어 푸터가 있는 경우 - 에 대해 여러 언어를 동시에 지정할 수 있으며, 엔진은 텍스트 영역별로 가장 적절한 모델을 적용합니다.

언어 팩은 NuGet 패키지로 배포되므로 응용 프로그램이 필요한 모델만 다운로드합니다. 이렇게 하면 단일 언어를 타겟으로 하는 응용 프로그램의 배포 크기를 관리할 수 있으며, 필요한 경우 다국어 지원을 완전히 제공할 수 있습니다.

양식 및 표를 위한 지역 기반 OCR을 어떻게 활성화합니까?

지역 기반 OCR은 이미지의 정의된 영역으로 인식을 제한하며, 이는 양식 필드, 송장 항목, 표 셀과 같은 특정 관심 영역을 포함하는 문서에 유용합니다. 이 목표 지향적 접근 방식은 관련 콘텐츠에 계산 리소스를 집중시킴으로써 속도와 정확성을 모두 향상시킵니다.

using IronOcr;
using IronSoftware.Drawing;

var ocr = new IronTesseract();

using var input = new OcrInput();
input.LoadImage("invoice.jpg");

// Define a crop region for the total amount field (x, y, width, height in pixels)
var totalRegion = new CropRectangle(x: 600, y: 800, width: 300, height: 50);
input.AddRegion(totalRegion);

OcrResult result = ocr.Read(input);
Console.WriteLine($"Invoice total: {result.Text}");

using IronOcr;
using IronSoftware.Drawing;

var ocr = new IronTesseract();

using var input = new OcrInput();
input.LoadImage("invoice.jpg");

// Define a crop region for the total amount field (x, y, width, height in pixels)
var totalRegion = new CropRectangle(x: 600, y: 800, width: 300, height: 50);
input.AddRegion(totalRegion);

OcrResult result = ocr.Read(input);
Console.WriteLine($"Invoice total: {result.Text}");

Imports IronOcr
Imports IronSoftware.Drawing

Dim ocr As New IronTesseract()

Using input As New OcrInput()
    input.LoadImage("invoice.jpg")

    ' Define a crop region for the total amount field (x, y, width, height in pixels)
    Dim totalRegion As New CropRectangle(x:=600, y:=800, width:=300, height:=50)
    input.AddRegion(totalRegion)

    Dim result As OcrResult = ocr.Read(input)
    Console.WriteLine($"Invoice total: {result.Text}")
End Using

$vbLabelText $csharpLabel

지역 기반 OCR과 신뢰도 임계값을 결합하면 데이터 품질에 대한 세밀한 제어가 가능합니다. 금융 문서 및 법적 자료에서는 85% 미만의 신뢰도 수준을 가진 단어에 대해 이중 검토를 위한 기초를 제공하는 것이 실용적입니다. 소스로부터 도착하는 스캔의 품질에 따라 문서 유형별로 임계값을 조정할 수 있습니다.

IronOCR 문서에서 지역 기반 OCR과 크롭 직사각형에 대해 더 알아보세요.

개발자는 프로그램적으로 OCR 정확도를 어떻게 최적화할 수 있습니까?

표준 전처리 필터를 적용하는 것 외에도 특정 문서 유형 및 품질 요건에 맞게 OCR 성능을 세부 조정할 수 있습니다. 신뢰도 점수, 자동 필터 최적화, 검색 가능한 PDF 생성은 모두 다양한 문서 유형에서 텍스트를 신뢰성 있게 인식해야 하는 생산 응용 프로그램에서 인식 정확도를 극대화하는 데 기여합니다.

신뢰도 점수는 엔진이 인식된 각 요소에 대해 얼마나 확신하는지를 나타냅니다. 이 점수를 분석하여 수동 검증이나 대체 처리 방식을 필요로 할 수 있는 문제 영역을 식별할 수 있습니다. 응용 프로그램에서 신뢰도 임계값을 설정하여 아래의 결과에 대해 검토를 위한 표시를 해야 합니다 - 높은 정확도를 요구하는 민감한 문서에 필수적입니다.

using IronOcr;

var ocr = new IronTesseract();

// Load business document for OCR processing
using var input = new OcrInput("receipt.jpg");

// Let the system determine optimal preprocessing for OCR accuracy
string suggestedCode = OcrInputFilterWizard.Run(
    "receipt.jpg",
    out double confidence,
    ocr);

Console.WriteLine($"Achieved confidence: {confidence:P1}");
Console.WriteLine($"Optimal filter chain: {suggestedCode}");

// Apply recommended filters for successful recognition
input.DeNoise();
input.Deskew();

OcrResult result = ocr.Read(input);

// Analyze word-level confidence for extracted text
foreach (var word in result.Words)
{
    if (word.Confidence < 0.85)
    {
        Console.WriteLine($"Low confidence: '{word.Text}' ({word.Confidence:P0})");
    }
}

using IronOcr;

var ocr = new IronTesseract();

// Load business document for OCR processing
using var input = new OcrInput("receipt.jpg");

// Let the system determine optimal preprocessing for OCR accuracy
string suggestedCode = OcrInputFilterWizard.Run(
    "receipt.jpg",
    out double confidence,
    ocr);

Console.WriteLine($"Achieved confidence: {confidence:P1}");
Console.WriteLine($"Optimal filter chain: {suggestedCode}");

// Apply recommended filters for successful recognition
input.DeNoise();
input.Deskew();

OcrResult result = ocr.Read(input);

// Analyze word-level confidence for extracted text
foreach (var word in result.Words)
{
    if (word.Confidence < 0.85)
    {
        Console.WriteLine($"Low confidence: '{word.Text}' ({word.Confidence:P0})");
    }
}

Imports IronOcr

Dim ocr As New IronTesseract()

' Load business document for OCR processing
Using input As New OcrInput("receipt.jpg")

    ' Let the system determine optimal preprocessing for OCR accuracy
    Dim confidence As Double
    Dim suggestedCode As String = OcrInputFilterWizard.Run("receipt.jpg", confidence, ocr)

    Console.WriteLine($"Achieved confidence: {confidence:P1}")
    Console.WriteLine($"Optimal filter chain: {suggestedCode}")

    ' Apply recommended filters for successful recognition
    input.DeNoise()
    input.Deskew()

    Dim result As OcrResult = ocr.Read(input)

    ' Analyze word-level confidence for extracted text
    For Each word In result.Words
        If word.Confidence < 0.85 Then
            Console.WriteLine($"Low confidence: '{word.Text}' ({word.Confidence:P0})")
        End If
    Next
End Using

$vbLabelText $csharpLabel

OcrInputFilterWizard는 이미지를 분석하고 다양한 필터 조합을 테스트하여 가장 높은 신뢰도 결과를 생성하는 전처리 체인을 결정합니다. 이 자동화된 접근 방식은 익숙하지 않은 문서 유형을 처리할 때의 추측 작업을 제거합니다. 마법사는 달성된 신뢰도 수준과 최적의 구성을 재현하는 데 필요한 코드를 모두 반환하여 비즈니스 프로세스를 위한 OCR 응용 프로그램 개발을 간소화합니다.

루프에서 입증된 단어 수준의 신뢰도 분석은 세부 품질 평가를 제공합니다. 금융 문서, 환자 기록, 법적 자료를 처리하는 응용 프로그램은 종종 추출된 데이터가 정확성 표준을 충족하는지 확인하기 위해 이 수준의 검토가 필요합니다. 신뢰도 임계값을 밑도는 단어는 2차 검증 프로세스 또는 대체 인식 시도를 촉발하여 신뢰성을 요구하는 데이터 관리 워크플로를 지원합니다.

스캔 문서에서 검색 가능한 PDF를 어떻게 생성합니까?

검색 가능한 아카이브로의 변환이 필요한 문서의 경우, IronOCR는 인식된 텍스트 레이어를 원본 이미지 아래에 삽입하여 검색 가능한 PDF를 생성할 수 있으며, 이는 시각적 충실도를 유지하면서 전체 텍스트 검색을 가능하게 합니다. 이 기능은 스캔 문서를 장기간 아카이빙, 법적 발견 워크플로, 또는 Enterprise 콘텐츠 관리 시스템에 적합한 디지털 형식으로 변환합니다.

using IronOcr;

var ocr = new IronTesseract();

using var input = new OcrInput("scanned-contract.pdf");
input.Deskew();
input.DeNoise();

OcrResult result = ocr.Read(input);

// Export as searchable PDF with embedded text layer
result.SaveAsSearchablePdf("searchable-contract.pdf");
Console.WriteLine("Searchable PDF saved successfully.");

using IronOcr;

var ocr = new IronTesseract();

using var input = new OcrInput("scanned-contract.pdf");
input.Deskew();
input.DeNoise();

OcrResult result = ocr.Read(input);

// Export as searchable PDF with embedded text layer
result.SaveAsSearchablePdf("searchable-contract.pdf");
Console.WriteLine("Searchable PDF saved successfully.");

Imports IronOcr

Dim ocr As New IronTesseract()

Using input As New OcrInput("scanned-contract.pdf")
    input.Deskew()
    input.DeNoise()

    Dim result As OcrResult = ocr.Read(input)

    ' Export as searchable PDF with embedded text layer
    result.SaveAsSearchablePdf("searchable-contract.pdf")
    Console.WriteLine("Searchable PDF saved successfully.")
End Using

$vbLabelText $csharpLabel

생성된 파일은 원본 스캔의 시각적 외관을 유지하면서 검색 도구와 화면 낭독기가 접근할 수 있는 숨겨진 텍스트 레이어를 추가합니다. 이는 준수 또는 접근성 요구 사항을 대상으로 하는 문서 디지털화 프로젝트의 표준 출력 형식입니다.

문서 유형별로 OCR 성능을 어떻게 비교합니까?

다양한 문서 카테고리 - 인쇄된 양식, 손으로 쓴 메모, 저품질 팩스 전송, 고해상도 카메라 캡처 - 는 전처리 및 인식 설정에 다르게 반응합니다. 각 카테고리에서 대표 샘플에 대한 파이프라인 벤치마킹을 통해 정확성 격차가 어디에 있는지 그리고 어떤 필터를 조정해야 하는지를 밝힐 수 있습니다.

문서 유형별 OCR 전처리 추천 사항
문서 유형	추천 필터	일반적인 정확성 향상	주요 문제점
플랫베드 스캔된 텍스트	Deskew, Binarize	5-15%	약간 회전, 그림자 가장자리
카메라 캡처 문서	Deskew, DeNoise, EnhanceResolution	20-40%	원근법 왜곡, 노이즈
팩스 / 복사기	이진화, 노이즈 제거	15-30%	하프톤 패턴, 대비 저하
Low-resolution scan (<150 DPI)	해상도 향상(300), 기울임 보정	30-50%	불충분한 픽셀 밀도
손으로 쓴 메모	이진화, 노이즈 제거	10-25%	가변 스트로크 너비, 스타일 변형

이 정확도 개선 사항은 학술 OCR 벤치마킹 연구에서 도출된 전처리 효과 연구를 기반으로 한 방향성 추정입니다. 실제 결과는 스캔 장비, 문서의 연령, 콘텐츠의 복잡성에 따라 다릅니다. 귀하의 샘플 세트에 대해 OcrInputFilterWizard를 실행하면 파이프라인에 특정한 경험적 데이터를 제공합니다.

파이프라인을 조정할 때 사용할 수 있는 모든 옵션을 이해하려면 사용 가능한 IronOCR 전처리 필터 전체 목록을 탐색하십시오.

제품 문서 처리를 위한 IronOCR의 주요 기능은 무엇입니까?

프로덕션 환경에서 OCR을 배포할 때 기본 인식을 넘어서는 여러 IronOCR 기능이 신뢰성과 처리량에 중요하게 작용합니다. 이 기능을 이해하면 정확성을 희생하지 않고 확장되는 파이프라인을 설계할 수 있습니다.

다중 형식 입력 지원 -- IronOCR은 단일 통합 API를 통해 이미지(PNG, JPEG, TIFF, BMP, GIF, WEBP), PDF 파일 및 다중 페이지 TIFF를 수락합니다. 이는 스캔 스테이션, 이메일 첨부 파일 또는 문서 관리 시스템에서 도착하는 포맷을 형식별 코드 경로 작성 없이 처리할 수 있음을 의미합니다.

스레드 안전성 -- IronTesseract 클래스는 단일 인스턴스를 생성하고 스레드 간에 공유할 때 스레드 안전합니다. 고처리량 애플리케이션의 경우, 스레드당 하나의 인스턴스를 생성하거나 풀을 사용하여 기본 Tesseract 엔진의 잠금 경쟁을 피하십시오.

바코드 및 QR 코드 공동 처리 -- IronOCR은 하나의 이미지에서 바코드 및 QR 코드를 한 번에 읽을 수 있어 배송 라벨 또는 제품 재고 시트와 같은 혼합 콘텐츠 문서를 처리할 때 별도의 바코드 라이브러리가 필요하지 않습니다.

출력 형식 옵션 -- IronOCR은 일반 텍스트 외에도 주석 신문 형식의 구조화된 데이터를 돌려주거나 직접 검색 가능한 PDF로 내보낼 수 있으며, 하위 데이터 추출 워크플로우에 적합한 단어 경계 상자를 제공합니다.

아키텍처를 최종 결정하기 전에 IronOCR 기능 개요를 검토하여 모든 기능을 확인하십시오.

다음 단계는 무엇입니까?

컴퓨터 비전 기술은 완벽한 입력에서만 작동하는 기술에서 스캔 문서, 사진 및 열화된 이미지를 처리할 수 있는 기술로 광학 문자 인식을 근본적으로 변형시킵니다. 전처리 단계 -- 기울임 보정, 노이즈 제거, 이진화 및 해상도 향상 -- 물리적 캡처 결함을 해결하는 반면, CNN-LSTM과 같은 신경망 아키텍처는 다양한 글꼴과 필기 스타일을 정확하게 해석할 수 있는 스크립트 인식 지능을 제공합니다.

.NET 개발자를 위해 IronOCR은 이러한 기능을 관리 라이브러리에 패키지하여 네이티브 Tesseract 통합을 간소화하면서 프로덕션 사용에 실질적인 개선을 추가합니다. 자동 전처리 최적화, 상세한 신뢰성 보고, 구조화된 결과 데이터를 결합하면 다양한 현실 세계의 입력, 즉 인쇄된 문서에서 손으로 쓴 메모까지 안정적으로 작동하며 다중 언어에 걸쳐 다국어 OCR을 지원하는 문서 처리 시스템을 가능하게 합니다.

다음 단계를 진행하려면:

IronOCR 무료 체험판을 다운로드하여 원하는 문서에 대해 이 가이드의 코드 예제를 실행하십시오
PDF 텍스트 추출, 양식 필드 읽기, 일괄 처리와 같은 일반적인 사용 사례를 다루는 단계별 튜토리얼을 보려면 IronOCR 튜토리얼을 검토하십시오
IronOCR API 참조를 탐색하여 IronTesseract, OcrInput, OcrResult의 전체 표면을 이해하십시오.
배포 시나리오에 맞는 계획을 선택하려면 IronOCR 라이선스 옵션을 확인하십시오

자주 묻는 질문

컴퓨터 비전은 OCR 정확도를 어떻게 향상시키나요?

컴퓨터 비전 기술은 OCR 인식 전에 이미지 전처리를 적용하여 정확도를 향상시킵니다. 기울기 보정, 노이즈 제거, 이진화, 해상도 향상과 같은 기술은 OCR 엔진이 문자를 잘못 읽거나 건너뛰게 만드는 물리적 이미지 캡처 결함을 수정합니다. 신경망 모델은 글꼴, 필기체 스타일, 손상된 이미지 등 다양한 환경에서 텍스트 패턴을 인식하도록 학습하여 정확도를 더욱 향상시킵니다.

IronOCR 어떤 전처리 필터를 지원하나요?

IronOCR OcrInput API를 통해 기울기 보정, 노이즈 제거, 이진화, 해상도 향상 및 여러 추가 필터를 지원합니다. 한 번의 처리 과정에서 여러 필터를 연결할 수 있으며, OcrInputFilterWizard를 사용하여 특정 문서 유형에 가장 적합한 필터 조합을 자동으로 찾을 수 있습니다.

IronOCR 어떤 딥러닝 모델을 사용하나요?

IronOCR LSTM(장단기 메모리) 신경망 아키텍처를 사용하는 Tesseract 5로 구동됩니다. 이 CRNN 모델은 컨볼루션 특징 추출과 결합하여 기존 템플릿 기반 OCR 시스템보다 글꼴 변형, 부분 가림, 이미지 손상 등을 더욱 효과적으로 처리합니다.

IronOCR 사용하여 영역 기반 OCR을 수행하는 방법은 무엇입니까?

OcrInput 객체의 AddRegion 메서드에 픽셀 단위로 대상 영역의 x, y, 너비 및 높이를 정의하는 CropRectangle 매개변수를 사용하십시오. 그러면 IronOCR 해당 영역으로 인식 범위를 제한하여 양식이나 송장과 같은 구조화된 문서의 속도와 정확도를 모두 향상시킵니다.

IronOCR 스캔한 문서에서 검색 가능한 PDF를 생성할 수 있습니까?

예. OcrInput 객체에서 Read 메서드를 호출한 후, OcrResult 객체에서 SaveAsSearchablePdf 메서드를 호출하십시오. 이렇게 하면 인식된 텍스트가 원본 스캔 이미지 아래에 숨겨진 레이어로 포함된 PDF 파일이 생성되어 문서의 시각적 모양을 유지하면서 전체 텍스트 검색이 가능해집니다.

IronOCR 몇 개의 언어를 지원하나요?

IronOCR 125개 이상의 언어를 지원합니다. 각 언어는 NuGet 패키지로 배포되는 전용 Tesseract LSTM 모델을 통해 지원됩니다. 두 개 이상의 언어가 혼합된 문서의 경우 여러 언어를 동시에 지정할 수 있습니다.

전처리 필터는 어떤 순서로 적용해야 할까요?

일반적으로 이미지 정렬을 먼저 수행하여 후속 필터가 올바르게 정렬된 이미지에서 작동하도록 합니다. 노이즈 제거 후 이진화를 수행하여 흑백 변환 과정에서 발생하는 아티팩트가 영구적으로 저장되는 것을 방지합니다. 원본 이미지가 저해상도인 경우, 노이즈 제거 전에 업스케일링을 수행하면 압축 아티팩트가 증폭되는 것을 방지할 수 있으므로 해상도 향상을 초기에 적용합니다.

IronOCR 에서 신뢰도 점수는 어떻게 작동하나요?

IronOCR OcrResult에서 인식된 각 단어에 대해 0에서 1 사이의 신뢰도 점수를 반환합니다. 일반적으로 비즈니스 문서의 경우 0.85 이상의 점수가 신뢰할 수 있는 것으로 간주됩니다. 사용자가 설정한 임계값 미만의 단어는 수동 검토를 위해 표시하거나 2차 인식 과정을 거치도록 할 수 있습니다.

칸나팟 우돈판트

지금 바로 엔지니어링 팀과 채팅하세요

소프트웨어 엔지니어

카나팟은 소프트웨어 엔지니어가 되기 전 일본 홋카이도 대학교에서 환경 자원학 박사 학위를 취득했습니다. 학위 과정 중에는 생물생산공학과 소속 차량 로봇 연구실에서 활동하기도 했습니다. 2022년에는 C# 기술을 활용하여 Iron Software의 엔지니어링 팀에 합류했고, 현재 IronPDF 개발에 집중하고 있습니다. 카나팟은 IronPDF에 사용되는 대부분의 코드를 직접 작성하는 개발자로부터 배울 수 있다는 점에 만족하며, 동료들과의 소통을 통해 배우는 것 외에도 Iron Software에서 일하는 즐거움을 누리고 있습니다. 코딩이나 문서 작업을 하지 않을 때는 주로 PS5로 게임을 하거나 The Last of Us를 다시 시청하는 것을 즐깁니다.

A PHP Error was encountered

고객 성공 사례:

주목할 만한 개발자:

웹 세미나:

30일 무료 체험 시작하기

컴퓨터 비전을 활용한 OCR이 텍스트 인식 정확도를 향상시키는 방법

컴퓨터 비전과 OCR의 관계는 무엇입니까?

입력

산출

이미지 전처리가 텍스트 인식을 어떻게 개선합니까?

올바른 전처리 필터 조합을 어떻게 선택합니까?

어떤 딥러닝 모델이 현대 OCR을 지원합니까?

입력

산출

IronOCR는 다국어 문서를 어떻게 처리합니까?

양식 및 표를 위한 지역 기반 OCR을 어떻게 활성화합니까?

개발자는 프로그램적으로 OCR 정확도를 어떻게 최적화할 수 있습니까?

스캔 문서에서 검색 가능한 PDF를 어떻게 생성합니까?

문서 유형별로 OCR 성능을 어떻게 비교합니까?

제품 문서 처리를 위한 IronOCR의 주요 기능은 무엇입니까?

다음 단계는 무엇입니까?

자주 묻는 질문

컴퓨터 비전은 OCR 정확도를 어떻게 향상시키나요?

IronOCR 어떤 전처리 필터를 지원하나요?

IronOCR 어떤 딥러닝 모델을 사용하나요?

IronOCR 사용하여 영역 기반 OCR을 수행하는 방법은 무엇입니까?

IronOCR 스캔한 문서에서 검색 가능한 PDF를 생성할 수 있습니까?

IronOCR 몇 개의 언어를 지원하나요?

전처리 필터는 어떤 순서로 적용해야 할까요?

IronOCR 에서 신뢰도 점수는 어떻게 작동하나요?

아이언 서포트 팀

A PHP Error was encountered

30일 무료 체험 시작하기

컴퓨터 비전을 활용한 OCR이 텍스트 인식 정확도를 향상시키는 방법

컴퓨터 비전과 OCR의 관계는 무엇입니까?

입력

산출

이미지 전처리가 텍스트 인식을 어떻게 개선합니까?

올바른 전처리 필터 조합을 어떻게 선택합니까?

어떤 딥러닝 모델이 현대 OCR을 지원합니까?

입력

산출

IronOCR는 다국어 문서를 어떻게 처리합니까?

양식 및 표를 위한 지역 기반 OCR을 어떻게 활성화합니까?

개발자는 프로그램적으로 OCR 정확도를 어떻게 최적화할 수 있습니까?

스캔 문서에서 검색 가능한 PDF를 어떻게 생성합니까?

문서 유형별로 OCR 성능을 어떻게 비교합니까?

제품 문서 처리를 위한 IronOCR의 주요 기능은 무엇입니까?

다음 단계는 무엇입니까?

자주 묻는 질문

컴퓨터 비전은 OCR 정확도를 어떻게 향상시키나요?

IronOCR 어떤 전처리 필터를 지원하나요?

IronOCR 어떤 딥러닝 모델을 사용하나요?

IronOCR 사용하여 영역 기반 OCR을 수행하는 방법은 무엇입니까?

IronOCR 스캔한 문서에서 검색 가능한 PDF를 생성할 수 있습니까?

IronOCR 몇 개의 언어를 지원하나요?

전처리 필터는 어떤 순서로 적용해야 할까요?

IronOCR 에서 신뢰도 점수는 어떻게 작동하나요?

관련 기사

실제로 유용한 데이터를 추출하는 영수증 OCR API를 C#에서 빌드합니다

IronOCR 이용한 텍스트 인식 (C# GitHub )

.NET OCR SDK: C#용 텍스트 인식 라이브러리

다음 단계: 30일 무료 체험 시작하기

다음 단계: 30일 무료 체험 시작하기

전 세계 수백만 엔지니어들이 신뢰하는 제품입니다.

아이언 서포트 팀