푸터 콘텐츠로 바로가기
OCR 도구

OCR 사진 (초보자용 튜토리얼)

광학 문자 인식(OCR) 기술은 디지털 세계에서 우리가 텍스트와 상호 작용하는 방식을 혁신적으로 변화시켰습니다. OCR 사진 도구는 이미지를 텍스트로 변환할 수 있는 기능을 제공하여 인쇄된 메모를 디지털화하기 쉽게 만듭니다.

이 글에서는 무료 및 유료 온라인 OCR 도구 네 가지를 살펴보고, 마지막으로 IronOCR 소개하며 C#으로 OCR을 프로그래밍 방식으로 구현하는 방법을 보여드리겠습니다.

1. Google Vision API

Google Vision API는 Google이 제공하는 이미지에서 텍스트를 변환하는 강력한 OCR 솔루션을 제공합니다. 이미지 및 PDF 텍스트 추출을 지원하며 여러 언어의 텍스트를 인식할 수 있습니다.

OCR Foto (Beginner Tutorial): Figure 1

장점

  • 높은 정확도
  • 언어 지원
  • 다른 Google Cloud 서비스와의 통합.

단점

  • API 키 필수
  • 특정 사용량을 초과하면 무료가 아닙니다.

1단계: API 키 획득

  • Google Cloud 콘솔을 방문하십시오.
  • 새 프로젝트를 만들거나 기존 프로젝트를 선택하십시오.
  • Cloud Vision API를 활성화하고 API 키를 생성하십시오.

2단계: API 요청 수행

  • cURL 또는 선택하신 프로그래밍 언어와 같은 도구를 사용하여 HTTP POST 요청을 수행하십시오.
  • 요청 페이로드에 이미지 파일 또는 URL을 포함하십시오.
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
SHELL

3단계: 결과 파싱

  • API 응답에서 인식된 텍스트를 추출하십시오.
{
  "responses": [
    {
      "textAnnotations": [
        {
          "description": "Hello World!",
          "boundingPoly": { /* bounding box coordinates */ }
        }
      ]
    }
  ]
}

2. Tesseract OCR

Tesseract는 Google이 개발한 오픈소스 OCR 엔진입니다. 100개 이상의 언어를 지원하며, 정확도와 유연성 때문에 널리 사용됩니다. 여러 파일 형식의 이미지를 변환하고 스캔된 이미지를 편집 가능한 텍스트로 변환하는 데 도움을 줍니다.

OCR Foto (Beginner Tutorial): Figure 2

장점

  • 오픈소스
  • 높은 정확도
  • 커뮤니티 지원

단점

  • 통합을 위해 추가 도구가 필요할 수 있음
  • 최적의 결과를 위해 이미지 전처리가 필요할 수 있음.

1단계: Tesseract 설치

  • 공식 GitHub 저장소에서 Tesseract OCR을 다운로드하고 설치하십시오.
  • 터미널에서 접근할 수 있도록 PATH 환경 변수에 Tesseract 폴더를 추가하십시오.

2단계: 이미지에서 OCR 실행

  • 터미널을 열고 이미지가 포함된 폴더로 이동하십시오.
  • 다음 명령어를 실행하십시오:
tesseract path/to/your/image.jpg output.txt
tesseract path/to/your/image.jpg output.txt
SHELL

3단계: 결과 보기

  • 생성된 텍스트 파일(output.txt)을 열어 추출된 텍스트를 확인하십시오.

3. ABBYY FineReader Online

ABBYY FineReader Online은 사용자가 스캔한 문서와 이미지를 편집 가능한 형식으로 변환할 수 있는 클라우드 기반 OCR 서비스입니다.

이 온라인 도구는 번거로움 없이 이미지에서 텍스트를 추출할 수 있는 무료 사용 OCR 기반 텍스트 변환기를 제공합니다.

OCR Foto (Beginner Tutorial): Figure 3

장점

  • 사용자 친화적인 이미지 OCR 도구
  • 다양한 입력 형식 지원
  • 문서 서식을 유지

단점

  • 제한된 무료 사용
  • 인터넷 연결 필요

1단계: ABBYY FineReader Online 방문

  • ABBYY FineReader Online 웹사이트로 이동합니다.
  • Windows 또는 Mac용 무료 체험판을 다운로드합니다.
  • 소프트웨어를 설치하고 주어진 단계를 따르세요.

단계 2: 이미지 업로드하기

  • '파일 선택' 버튼을 클릭하고 이미지를 업로드하세요.

단계 3: 이미지 처리하기

  • 이미지 처리를 기다립니다. 도구가 자동으로 텍스트를 추출할 것입니다.

단계 4: 텍스트 편집하기

  • 추출된 텍스트를 저장하거나 편집기를 사용하여 필요한 수정을 합니다.
  • Word, Excel, 텍스트 형식으로 저장합니다.

4. 온라인 OCR

온라인 OCR은 여러 언어를 지원하여 온라인 이미지에서 텍스트로 변환을 제공하는 웹 기반 OCR 서비스입니다. 사용자가 자신의 장치에서 이미지를 업로드하거나 URL을 제공합니다.

장점

  • 간단한 사용자 인터페이스
  • 다양한 입력 형식 지원
  • 한계가 있는 무료 사용

단점

  • 제한된 무료 기능
  • 인터넷 연결 의존

단계 1: 온라인 OCR 방문

온라인 OCR 웹사이트로 이동합니다.

단계 2: 이미지 업로드하기

"파일 선택" 버튼을 클릭하고 이미지를 업로드하세요.

OCR Foto (Beginner Tutorial): Figure 4

단계 3: 언어 및 출력 형식 선택하기

이미지의 텍스트 언어와 출력 형식을 선택하세요.

OCR Foto (Beginner Tutorial): Figure 5

단계 4: OCR 시작하기

"변환" 버튼을 클릭하여 OCR 프로세스를 시작합니다.

단계 5: 텍스트 다운로드하기

프로세스가 완료되면 제공된 링크에서 추출된 텍스트를 다운로드합니다.

OCR Foto (Beginner Tutorial): Figure 6

Introduction to IronOCR in C

지금부터 C# 강력한 OCR 라이브러리인 IronOCR에 대해 살펴보겠습니다. 개발자들이 OCR 기능을 원활하게 구현할 수 있는 도구를 제공합니다. IronOCR은 Iron Software 팀이 개발한 C#을 위한 선두 OCR 라이브러리입니다.

IronOCR은 C# 개발자를 위해 특별히 설계된 견고한 광학 문자 인식 (OCR) 라이브러리로, 이미지에서 정확하고 원활하게 텍스트를 추출할 수 있는 강력한 기능을 제공합니다.

신뢰성과 효율성으로 알려진 IronOCR은 이미지 및 문서에서 텍스트를 추출하기 위한 포괄적인 솔루션을 찾고 있는 C# 개발자들 사이에서 인기를 얻고 있습니다.

정확성과 다기능성에 중점을 둔 IronOCR은 문서 관리 시스템에서 데이터 추출 애플리케이션에 이르는 다양한 프로젝트에 적합한 선택지가 되었습니다.

고급 OCR 알고리즘을 활용하여 IronOCR은 JPEG, PNG, TIFF를 포함한 다양한 이미지 형식에서 텍스트를 정확하게 해독합니다. 그 다재다능함은 다국어 지원으로 확장되어 다양한 언어적 요구를 충족하는 애플리케이션에 귀중한 도구가 됩니다.

이 라이브러리는 인기 있는 .NET Framework와 원활하게 통합되어 C# 애플리케이션 내에서 OCR 기능을 쉽게 구현할 수 있습니다.

스캔된 문서나 이미지를 다룰 때, IronOCR의 포괄적인 기능은 개발자들이 각각의 프로젝트에 OCR 기능을 쉽게 통합할 수 있도록 권한을 부여합니다.

IronOCR 기능 세부 정보

  1. 고급 OCR 알고리즘: IronOCR은 기본 문자 인식을 넘어서는 정교한 OCR 알고리즘을 사용하여 복잡한 상황에서도 높은 정확도를 보장합니다.
  2. 이미지 형식 지원: 개발자들은 JPEG, PNG, TIFF와 같은 다양한 이미지 형식을 IronOCR이 지원함으로써 다양한 시각 콘텐츠를 처리하는 데 유연성을 제공합니다.
  3. 다국어 지원: 애플리케이션의 글로벌 특성을 인식하여, IronOCR은 여러 언어에서 텍스트를 정확히 추출할 수 있는 다국어 지원을 제공합니다.
  4. PDF 텍스트 추출: 이미지뿐만 아니라 IronOCR은 PDF 문서에서도 텍스트를 추출할 수 있어, 문서가 디지털 형식으로 저장되어 있는 시나리오에서 그 적용 가능성을 높입니다.
  5. .NET Framework 통합: IronOCR은 인기 있는 .NET Framework와 원활하게 통합되어, C# 개발자들이 복잡한 설정의 번거로움 없이 프로젝트에 OCR 기능을 쉽게 통합할 수 있습니다.

Implementing OCR with IronOCR in C

다음은 C#에서 IronOCR을 사용하여 이미지에서 텍스트를 추출하는 간단한 예입니다.

using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
Imports IronOcr ' Import the IronOcr namespace

' Create an instance of IronTesseract
Private ocr = New IronTesseract()

' Read text from the specified image file
Private imageText As String = ocr.Read("images\image.png").Text

' Output the extracted text
Console.WriteLine(imageText)
$vbLabelText   $csharpLabel

이 간단한 C# 코드 스니펫은 IronOCR을 사용하여 이미지 파일에서 텍스트를 읽는 방법을 보여줍니다. 개발자는 자신의 특정 요구에 맞게 OCR 프로세스를 추가로 사용자 정의할 수 있습니다.

IronOCR의 고급 기능에 대한 자세한 정보는 문서 페이지를 방문하세요.

결론

OCR 사진 도구는 이미지의 텍스트 콘텐츠를 디지털화하는 데 중요한 역할을 합니다. 여러 온라인 도구가 편리함을 제공하는 반면, IronOCR는 개발자에게 C# 응용 프로그램에 OCR 기능을 통합할 수 있는 강력하고 유연한 솔루션을 제공합니다.

온라인 도구와 프로그래밍으로 구현된 라이브러리 간의 선택은 정확성 요구사항, 맞춤화 요구사항 및 개발자가 OCR 프로세스에서 원하는 제어 수준과 같은 요인에 따라 달라집니다.

IronOCR는 무료 체험판을 제공합니다. 여기에서 소프트웨어를 다운로드하세요.

칸나오팟 우돈판트
소프트웨어 엔지니어
카나팟은 소프트웨어 엔지니어가 되기 전 일본 홋카이도 대학교에서 환경 자원학 박사 학위를 취득했습니다. 학위 과정 중에는 생물생산공학과 소속 차량 로봇 연구실에서 활동하기도 했습니다. 2022년에는 C# 기술을 활용하여 Iron Software의 엔지니어링 팀에 합류했고, 현재 IronPDF 개발에 집중하고 있습니다. 카나팟은 IronPDF에 사용되는 대부분의 코드를 직접 작성하는 개발자로부터 배울 수 있다는 점에 만족하며, 동료들과의 소통을 통해 배우는 것 외에도 Iron Software에서 일하는 즐거움을 누리고 있습니다. 코딩이나 문서 작업을 하지 않을 때는 주로 PS5로 게임을 하거나 The Last of Us를 다시 시청하는 것을 즐깁니다.

아이언 서포트 팀

저희는 주 5일, 24시간 온라인으로 운영합니다.
채팅
이메일
전화해