푸터 콘텐츠로 바로가기
IRONOCR 사용

컴퓨터 비전을 활용한 OCR (예제 튜토리얼)

IronOCR를 사용한 광학 문자 인식 (OCR)

광학 문자 인식(OCR)은 기계가 이미지에서 텍스트를 읽고 해석할 수 있도록 하여 데이터 처리와 자동화를 더 빠르고 효율적으로 만드는 기술입니다. 이 글은 IronOCR 라이브러리를 사용하여 OCR을 사용하는 지침과 이를 통해 텍스트 인식을 개선하고 이 과정을 자동화할 수 있는 방법을 제공합니다.

OCR이 중요한 이유는?

OCR과 컴퓨터 비전은 인공 지능 및 기계 학습 알고리즘의 힘을 활용하여 이미지에서 텍스트 문자를 더 정확하고 효율적으로 인식하는 고급 형태의 광학 문자 인식(OCR)입니다.

컴퓨터 비전 이미지 처리 알고리즘은 이미지 내 텍스트의 맥락과 레이아웃을 이해하고, 문자의 형태와 구조에 기반하여 문자를 인식할 수 있게 합니다. 컴퓨터 비전과 함께 하는 OCR은 여러 폰트, 스타일, 크기가 혼합되어 있는 복잡한 이미지에서 텍스트를 추출할 수 있어 문서 디지털화, 데이터 추출 및 자동화에 유용한 도구입니다.

IronOCR: C# OCR 라이브러리

IronOCR는 이미지 및 문서에서 텍스트를 추출하기 위해 컴퓨터 비전 기법을 사용하는 인기 있는 OCR 라이브러리입니다. 사용하기 쉽고 C#, VB.NET을 포함한 여러 프로그래밍 언어와 통합됩니다. IronOCR은 온프레미스 및 클라우드 버전으로 모두 제공되며, 이미지에서 텍스트를 처리하고 추출하는 다양한 기능을 제공합니다.

IronOCR 설치

IronOCR을 설치하려면 NuGet 패키지 관리자 콘솔에서 다음 명령을 사용하십시오:

Install-Package IronOcr

IronOCR을 활용한 OCR 시스템

다음 이미지는 IronOCR을 사용하여 컴퓨터 비전과 함께 하는 OCR 시스템을 테스트하는 데 사용됩니다.

컴퓨터 비전과 함께하는 OCR (예제 튜토리얼), 그림 1: OCR 탐지를 위해 사용된 이미지 샘플 OCR 감지를 위해 사용된 이미지 샘플

FindTextRegion 메서드

FindTextRegion 메서드는 이미지 내에서 단일 텍스트 영역을 식별하는 데 사용됩니다. 이 메서드는 Scale, DilationAmount, Binarize, Invert을 포함한 몇 가지 선택적 매개변수를 받습니다:

  • Scale은 더 나은 텍스트 인식을 위해 이미지 크기를 조정합니다.
  • DilationAmount은 텍스트 두께를 늘려 가시성을 향상시킵니다.
  • Binarize는 대조를 개선하기 위해 이미지를 흑백으로 변환합니다.
  • Invert은 특정 유형의 이미지에 유용할 수 있는 이미지 색상을 반전시킵니다.
using IronOcr;
using System;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var inputOCR = new OcrInput("test.jpg")) 
{
    // Identify a text region within the image
    inputOCR.FindTextRegion();

    // Perform OCR on the identified text region
    OcrResult result = ocr.Read(inputOCR);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;
using System;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var inputOCR = new OcrInput("test.jpg")) 
{
    // Identify a text region within the image
    inputOCR.FindTextRegion();

    // Perform OCR on the identified text region
    OcrResult result = ocr.Read(inputOCR);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
$vbLabelText   $csharpLabel

참고: 코드를 실행한 후 기계 학습 과정을 통해 텍스트 영역에서 텍스트가 추출되는 것을 볼 수 있습니다. 출력 결과는 콘솔에 높은 텍스트 인식 정확도로 나타납니다.

컴퓨터 비전과 함께하는 OCR (예제 튜토리얼), 그림 2: 텍스트 추출 프로세스의 콘솔 결과 텍스트 추출 과정의 콘솔 결과

FindMultipleTextRegions 메서드

FindMultipleTextRegions 메서드는 FindTextRegion와 유사하지만 이미지에 여러 텍스트 영역이 있을 때 사용됩니다. 이 메서드는 각각의 텍스트 영역 위치를 정의하는 CropRectangle 객체 목록을 반환합니다. 이 메서드는 여러 텍스트 섹션이 포함된 이미지에서 텍스트를 추출하고자 할 때 유용합니다.

using IronOcr;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var input = new OcrInput("test.jpg"))
{
    // Identify multiple text regions within the image
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);

    // Perform OCR on the pre-processed image
    OcrResult result = ocr.Read(input);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var input = new OcrInput("test.jpg"))
{
    // Identify multiple text regions within the image
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);

    // Perform OCR on the pre-processed image
    OcrResult result = ocr.Read(input);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
$vbLabelText   $csharpLabel

설명: 위에 제공된 코드 스니펫은 IronOCR 라이브러리를 사용하여 이미지 파일에서 OCR을 수행하는 방법의 예입니다. 먼저 IronOCR 라이브러리를 가져오고 IronTesseract 클래스의 새 인스턴스를 생성합니다. 그런 다음 입력 이미지 파일의 경로로 OcrInput 객체를 초기화하고 FindMultipleTextRegions 메서드를 사용하여 이미지 보정을 위한 전처리 기법을 적용합니다.

IronOCR의 출력

IronOCR의 출력은 여러 폰트, 크기, 스타일의 텍스트를 포함한 복잡한 이미지에서도 매우 정확합니다.

OCR 정확도는 이미지에서 데이터를 추출할 때 결정적입니다. 추출된 텍스트는 종종 데이터 분석, 수작업 데이터 입력, 기계 학습 또는 자연어 처리 등 추가 처리에 사용되기 때문입니다. 추출된 텍스트에 오류가 포함되어 있으면 다운스트림에서 문제가 발생할 수 있습니다. 또한, IronOCR은 결과 객체를 조사하여 신뢰 수준을 확인 할 수 있도록 합니다.

OCR 컴퓨터 비전의 사용 사례

광학 문자 인식(OCR) 기술은 인쇄된 텍스트가 처리되는 방식을 혁신적으로 변화시켰습니다. OCR 도구는 문서 처리 및 데이터 추출에서 없어서는 안 될 부분이 되었습니다. 광학 문자 인식 소프트웨어의 몇 가지 사용 사례는 다음과 같습니다:

OCR 번호판 인식

번호판 인식은 교통 관리, 주차 시스템 및 법 집행 활동을 자동화하는 데 중요한 역할을 합니다. C#에서 OCR 컴퓨터 비전을 구현하여 개발자는 이미지 또는 라이브 비디오 피드에서 번호판을 빠르고 정확하게 식별하는 애플리케이션을 작성할 수 있습니다. 이 기술은 다음과 같은 용도로 사용될 수 있습니다:

  • 교통 위반 모니터링 및 범죄 활동에 연루된 차량 식별.
  • 주차 시스템 자동화, 출입 관리 용이 및 청구 과정의 간소화.
  • 제한된 지역에서 차량 이동 추적 및 모니터링을 통한 보안 강화.

송장에서 텍스트 추출

C#에서 OCR 컴퓨터 비전은 송장 및 기타 금융 문서에서 텍스트 추출을 자동화하는 OCR 애플리케이션을 개발하는 데 활용될 수 있습니다. 이 프로세스는 수동 데이터 입력 오류를 크게 줄일 수 있으며 회계 작업을 간소화할 수 있습니다. 주요 이점은 다음과 같습니다.

  • 데이터 입력 프로세스를 자동화하여 생산성을 높였습니다.
  • OCR로 인해 인간 오류 가능성이 줄어 정확도가 향상되었습니다.
  • 효율적인 데이터 관리를 위한 회계 소프트웨어 및 시스템과 원활하게 통합됩니다.

OCR 자막 생성

비디오에 자막을 생성하는 것은 시간과 노동이 많이 드는 작업이 될 수 있습니다. C#의 OCR 컴퓨터 비전은 화면의 텍스트를 자동으로 감지하고 기록하여 개발자가 다음을 할 수 있도록 이 과정을 간소화할 수 있습니다:

  • 영화, TV 프로그램 및 온라인 비디오에 대한 정확한 자막을 만듭니다.
  • 청각 장애인이나 다른 언어를 사용하는 사람들을 위한 접근성을 향상시킵니다.
  • 검색 가능하고 색인화할 수 있는 콘텐츠를 비디오 플랫폼에 제공하여 SEO 노력을 강화합니다.

OCR PDF 처리

PDF는 문서를 공유하고 저장하는 데 널리 사용되지만 그로부터 텍스트를 추출하는 것은 어려울 수 있습니다. C#의 OCR 컴퓨터 비전은 개발자가 PDF 파일을 쉽게 처리하고 그 내용을 추출하는 OCR 애플리케이션을 구축하는 데 도움을 줄 수 있으며, 이를 통해 다음을 용이하게 합니다:

인쇄된 텍스트의 디지털화

OCR 소프트웨어는 문서 이미지에서 인쇄된 텍스트를 디지털화하기 위해 널리 사용됩니다. OCR 도구는 스캔된 디지털 문서, PDF, 및 다양한 형식의 이미지에서 텍스트를 추출할 수 있습니다. 이는 문서 관리에 특히 유용하며, 텍스트 기반 문서를 쉽게 검색, 저장, 및 공유할 수 있습니다.

데이터 추출

OCR 기술은 송장, 영수증, 양식과 같은 입력 데이터에서 데이터를 추출하는 데 널리 사용됩니다. OCR 모델은 이름, 주소, 날짜, 금액과 같은 주요 데이터 필드를 인식하고 추출할 수 있습니다. 이로 인해 수동 데이터 입력이 필요 없으며 데이터 처리에서 오류가 줄어듭니다.

이미지 검색

OCR 기술은 이미지 검색에도 사용되며, 포함된 텍스트를 기반으로 이미지를 검색할 수 있습니다. 이는 많은 이미지 라이브러리에서 수동 검색이 시간이 많이 걸릴 수 있는 경우에 특히 유용합니다.

번역

OCR 소프트웨어는 한 언어의 문서에서 텍스트를 추출하여 다른 언어로 번역하는 데 사용할 수 있습니다. 이는 문서가 신속하고 정확하게 번역되어야 하는 국제 비즈니스에 특히 유용합니다.

요약

광학 문자 인식(OCR)은 컴퓨터가 이미지에서 텍스트를 읽을 수 있도록 하는 기술입니다. OCR 및 컴퓨터 비전은 자율 주행 자동차, 로봇 공학, 자동화된 문서 처리와 같은 응용 프로그램에 필수적인 시각적 세계를 기계가 이해하고 해석할 수 있게 해주기 때문에 중요합니다.

IronOCR는 컴퓨터 비전을 사용하여 문자 인식을 적용하고 이미지에서 텍스트를 정확하게 인식하고 추출하는 강력한 OCR 엔진입니다. 이 메서드는 FindTextRegion, FindMultipleTextRegions, GetTextRegions을 포함하여 텍스트 영역을 찾고 추출하는 다양한 방법을 제공합니다. 각 메서드는 OCR 프로세스를 미세 조정하고 높은 OCR 정확성을 제공하기 위한 자체 매개변수 집합을 가집니다.

IronOCR를 사용하면 동시 작업과 사용자 지정 구성을 통해 입력 이미지의 스캔된 텍스트를 빠르고 정확하게 추출할 수 있으며, 이것은 대량의 입력 이미지 데이터를 다룰 때 시간과 노력을 절약할 수 있습니다. 스캔된 문서, 사진 또는 스크린샷과 작업하든 간에 IronOCR는 내포된 텍스트를 해제하는 데 도움을 줄 수 있습니다.

IronOCR는 구매 결정을 내리기 전에 소프트웨어를 테스트해 보려는 사용자에게 무료 체험판을 제공합니다. IronOCR의 라이선스는 $799에서 시작하며 1년 간의 지원 및 업데이트를 포함합니다. 강력한 기능과 합리적인 가격으로 IronOCR는 높은 OCR 정확성을 지닌 신뢰할 수 있는 OCR 솔루션을 찾고 있는 사람들에게 훌륭한 옵션입니다.

자주 묻는 질문

C#을 사용하여 이미지를 텍스트로 변환하는 방법은 무엇인가요?

IronOCR의 OCR 기능을 사용하면 C#으로 이미지를 텍스트로 변환할 수 있습니다. ReadReadAsync 와 같은 메서드를 활용하면 이미지를 처리하여 텍스트를 효율적으로 추출할 수 있습니다.

OCR을 컴퓨터 비전과 함께 사용하면 어떤 이점이 있나요?

OCR과 컴퓨터 비전을 결합하면 복잡한 이미지 레이아웃, 글꼴 및 스타일에서 더욱 정확한 텍스트 인식이 가능합니다. IronOCR AI와 머신러닝을 활용하여 텍스트 추출을 향상시키고 데이터 처리를 자동화합니다.

C#에서 OCR 정확도를 향상시키는 방법은 무엇인가요?

IronOCR 구성 설정 조정, 동시 처리 사용, 결과 객체의 신뢰도 검사 등 OCR 정확도를 향상시키는 다양한 방법을 제공합니다. 이를 통해 OCR 프로세스를 세밀하게 조정하여 더 나은 결과를 얻을 수 있습니다.

이미지의 여러 영역에서 텍스트를 추출하는 과정은 무엇인가요?

IronOCR 사용하여 이미지의 여러 영역에서 텍스트를 추출하려면 FindMultipleTextRegions 메서드를 사용할 수 있습니다. 이 메서드는 각 텍스트 영역의 위치를 ​​나타내는 CropRectangle 객체 목록을 반환합니다.

OCR 기술을 차량 번호판 인식에 사용할 수 있을까요?

네, IronOCR 에서 제공하는 것과 같은 OCR 기술은 차량 번호판 인식에 적용될 수 있습니다. IronOCR 차량 번호판 이미지를 처리하여 다양한 용도로 사용할 수 있는 텍스트를 추출할 수 있습니다.

C# 프로젝트에 IronOCR 설치하는 방법은 무엇인가요?

NuGet 패키지 관리자 콘솔을 사용하여 IronOCR C# 프로젝트에 설치할 수 있습니다. Install-Package IronOcr 명령을 실행하여 라이브러리를 프로젝트에 추가하세요.

C# OCR 라이브러리를 사용해 볼 수 있는 평가판이 있나요?

네, IronOCR 무료 평가판을 제공하여 사용자가 라이선스 구매 전에 라이브러리의 기능을 테스트해 볼 수 있도록 합니다.

C#으로 작성된 OCR 라이브러리에 사용할 수 있는 라이선스 옵션에는 어떤 것들이 있나요?

IronOCR 다양한 프로젝트 요구 사항과 예산에 맞춰 $liteLicense부터 시작하는 다양한 라이선스 옵션을 제공하며, 각 라이선스에는 1년간의 지원 및 업데이트가 포함됩니다.

칸나오팟 우돈판트
소프트웨어 엔지니어
카나팟은 소프트웨어 엔지니어가 되기 전 일본 홋카이도 대학교에서 환경 자원학 박사 학위를 취득했습니다. 학위 과정 중에는 생물생산공학과 소속 차량 로봇 연구실에서 활동하기도 했습니다. 2022년에는 C# 기술을 활용하여 Iron Software의 엔지니어링 팀에 합류했고, 현재 IronPDF 개발에 집중하고 있습니다. 카나팟은 IronPDF에 사용되는 대부분의 코드를 직접 작성하는 개발자로부터 배울 수 있다는 점에 만족하며, 동료들과의 소통을 통해 배우는 것 외에도 Iron Software에서 일하는 즐거움을 누리고 있습니다. 코딩이나 문서 작업을 하지 않을 때는 주로 PS5로 게임을 하거나 The Last of Us를 다시 시청하는 것을 즐깁니다.

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me