Financial OCR in C# and .NET
IronOCR 은 .NET 개발자가 금융 용어를 포함한 126개 언어로 된 이미지와 PDF 문서에서 텍스트를 읽을 수 있도록 해주는 C# 소프트웨어 구성 요소입니다.
이는 .NET 개발자 전용으로 개발된 Tesseract의 고급 포크 버전으로, 속도와 정확도 면에서 다른 Tesseract 엔진보다 뛰어난 성능을 보여줍니다.
IronOCR 의 내용.언어.금융
이 패키지에는 .NET 용 OCR 언어 16개가 포함되어 있습니다.
- 재정적인
다운로드
금융 용어 학습 자료 [금융]
설치
먼저 해야 할 일은 .NET 프로젝트에 금융 OCR 패키지를 설치하는 것입니다.
Install-Package IronOcr.Languages.Financial
코드 예제
이 C# 코드 예제는 이미지 또는 PDF 문서에서 재무 관련 텍스트를 읽습니다.
// Import the IronOcr namespace
using IronOcr;
// Instantiate the IronTesseract OCR engine
var Ocr = new IronTesseract();
// Set the OCR language to Financial
Ocr.Language = OcrLanguage.Financial;
// Create an OCR input object, specifying the path to the image or PDF
using (var Input = new OcrInput(@"images\Financial.png"))
{
// Perform OCR to read text from the input
var Result = Ocr.Read(Input);
// Retrieve the extracted text
var AllText = Result.Text;
}
// Import the IronOcr namespace
using IronOcr;
// Instantiate the IronTesseract OCR engine
var Ocr = new IronTesseract();
// Set the OCR language to Financial
Ocr.Language = OcrLanguage.Financial;
// Create an OCR input object, specifying the path to the image or PDF
using (var Input = new OcrInput(@"images\Financial.png"))
{
// Perform OCR to read text from the input
var Result = Ocr.Read(Input);
// Retrieve the extracted text
var AllText = Result.Text;
}
' Import the IronOcr namespace
Imports IronOcr
' Instantiate the IronTesseract OCR engine
Private Ocr = New IronTesseract()
' Set the OCR language to Financial
Ocr.Language = OcrLanguage.Financial
' Create an OCR input object, specifying the path to the image or PDF
Using Input = New OcrInput("images\Financial.png")
' Perform OCR to read text from the input
Dim Result = Ocr.Read(Input)
' Retrieve the extracted text
Dim AllText = Result.Text
End Using
설명:
- IronOCR 사용법: 이 네임스페이스에는 OCR 프로세스에 필요한 모든 클래스가 포함되어 있습니다.
- IronTesseract 클래스: 이 클래스는 OCR 작업을 가능하게 하는 핵심 클래스입니다.
- 언어 설정: 언어를
Financial로 설정하면 OCR 엔진이 금융 용어를 인식할 수 있습니다. - OcrInput 클래스: 처리할 이미지 또는 PDF 파일의 파일 경로를 매개변수로 받습니다.
- 읽기 메서드:
Ocr.Read(Input)에서 실행되어 제공된 입력 및 언어 설정에 따라 이미지를 처리하여 텍스트를 가져옵니다. - Result.Text: 이미지 또는 PDF에서 인식된 텍스트를 저장합니다.

