German OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
이 문서의 다른 버전:

IronOCR는 .NET 개발자가 이미지와 PDF 문서에서 독일어를 포함한 126개의 언어로 텍스트를 읽을 수 있게 해주는 C# 소프트웨어 컴포넌트입니다.

이는 .NET 개발자 전용으로 개발된 Tesseract의 고급 포크 버전으로, 속도와 정확도 면에서 다른 Tesseract 엔진보다 뛰어난 성능을 보여줍니다.

IronOcr.Languages.German의 내용

이 패키지에는 .NET용 OCR 언어 61개가 포함되어 있습니다.

  • German
  • GermanBest
  • GermanFast
  • GermanFraktur

다운로드

독일어 언어 팩 [Deutsch]

설치

첫 번째로 해야 할 일은 .NET 프로젝트에 우리의 독일어 OCR 패키지를 설치하는 것입니다.

Install-Package IronOcr.Languages.German

코드 예제

이 C# 코드 예제는 이미지나 PDF 문서에서 독일어 텍스트를 읽습니다.

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to German. This must match the language of the document you are scanning.
Ocr.Language = OcrLanguage.German;

using (var Input = new OcrInput(@"images\German.png"))
{
    // Perform OCR on the provided image and get the result.
    var Result = Ocr.Read(Input);
    // Extract all recognized text from the OCR result.
    var AllText = Result.Text;
    // Optionally, output the recognized text to the console for verification.
    Console.WriteLine(AllText);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to German. This must match the language of the document you are scanning.
Ocr.Language = OcrLanguage.German;

using (var Input = new OcrInput(@"images\German.png"))
{
    // Perform OCR on the provided image and get the result.
    var Result = Ocr.Read(Input);
    // Extract all recognized text from the OCR result.
    var AllText = Result.Text;
    // Optionally, output the recognized text to the console for verification.
    Console.WriteLine(AllText);
}
$vbLabelText   $csharpLabel

이 예제에서는 IronTesseract가 OCR을 위해 독일어를 사용하도록 설정되어 있으며, 이는 독일어 텍스트가 포함된 이미지 또는 PDF를 처리하는 데 필요합니다. OcrInput 클래스는 이미지 파일을 지정하는 데 사용되며, Read 메서드는 OCR 작업을 수행하여 추출된 텍스트를 반환합니다.