Financial OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

126개 언어 추가 지원

IronOCR 은 .NET 개발자가 금융 용어를 포함한 126개 언어로 된 이미지와 PDF 문서에서 텍스트를 읽을 수 있도록 해주는 C# 소프트웨어 구성 요소입니다.

이는 .NET 개발자 전용으로 개발된 Tesseract의 고급 포크 버전으로, 속도와 정확도 면에서 다른 Tesseract 엔진보다 뛰어난 성능을 보여줍니다.

IronOCR 의 내용.언어.금융

이 패키지에는 .NET 용 OCR 언어 16개가 포함되어 있습니다.

  • 재정적인

다운로드

금융 용어 학습 자료 [금융]

설치

먼저 해야 할 일은 .NET 프로젝트에 금융 OCR 패키지를 설치하는 것입니다.

Install-Package IronOcr.Languages.Financial

코드 예제

이 C# 코드 예제는 이미지 또는 PDF 문서에서 재무 관련 텍스트를 읽습니다.

// Import the IronOcr namespace
using IronOcr;

// Instantiate the IronTesseract OCR engine
var Ocr = new IronTesseract();

// Set the OCR language to Financial
Ocr.Language = OcrLanguage.Financial;

// Create an OCR input object, specifying the path to the image or PDF
using (var Input = new OcrInput(@"images\Financial.png"))
{
    // Perform OCR to read text from the input
    var Result = Ocr.Read(Input);

    // Retrieve the extracted text
    var AllText = Result.Text;
}
// Import the IronOcr namespace
using IronOcr;

// Instantiate the IronTesseract OCR engine
var Ocr = new IronTesseract();

// Set the OCR language to Financial
Ocr.Language = OcrLanguage.Financial;

// Create an OCR input object, specifying the path to the image or PDF
using (var Input = new OcrInput(@"images\Financial.png"))
{
    // Perform OCR to read text from the input
    var Result = Ocr.Read(Input);

    // Retrieve the extracted text
    var AllText = Result.Text;
}
$vbLabelText   $csharpLabel

설명:

  • IronOCR 사용법: 이 네임스페이스에는 OCR 프로세스에 필요한 모든 클래스가 포함되어 있습니다.
  • IronTesseract 클래스: 이 클래스는 OCR 작업을 가능하게 하는 핵심 클래스입니다.
  • 언어 설정: 언어를 Financial로 설정하면 OCR 엔진이 금융 용어를 인식할 수 있습니다.
  • OcrInput 클래스: 처리할 이미지 또는 PDF 파일의 파일 경로를 매개변수로 받습니다.
  • 읽기 메서드: Ocr.Read(Input)에서 실행되어 제공된 입력 및 언어 설정에 따라 이미지를 처리하여 텍스트를 가져옵니다.
  • Result.Text: 이미지 또는 PDF에서 인식된 텍스트를 저장합니다.