Kannada OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
이 문서의 다른 버전:

IronOCR는 .NET 코더가 이미지 및 PDF 문서에서 텍스트를 읽을 수 있도록 하는 C# 소프트웨어 컴포넌트로, 칸나다를 포함한 126개 언어를 지원합니다. 이는 .NET 개발자 전용으로 개발된 Tesseract의 고급 포크 버전으로, 속도와 정확도 면에서 다른 Tesseract 엔진보다 뛰어난 성능을 보여줍니다.

IronOcr.Languages.Kannada의 내용물

이 패키지는 .NET 용 여러 칸나다 OCR 언어 모델을 포함하고 있습니다:

  • 칸나다
  • 칸나다베스트
  • 칸나다패스트
  • 칸나다알파벳
  • 칸나다알파벳베스트
  • 칸나다알파벳패스트

다운로드

칸나다 언어팩 [ಕನನಡ]

설치

가장 먼저 해야 할 일은 칸나다 OCR 패키지를 .NET 프로젝트에 설치하는 것입니다.

Install-Package IronOcr.Languages.Kannada

코드 예제

이 C# 코드 예제는 이미지 또는 PDF 문서에서 칸나다 텍스트를 읽습니다.

// Make sure to install the IronOcr.Languages.Kannada package via NuGet
using IronOcr;

var Ocr = new IronTesseract
{
    // Set the OCR language to Kannada
    Language = OcrLanguage.Kannada
};

using (var Input = new OcrInput(@"images\Kannada.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);
    // Retrieve all recognized text from the OCR result
    var AllText = Result.Text;
}
// Make sure to install the IronOcr.Languages.Kannada package via NuGet
using IronOcr;

var Ocr = new IronTesseract
{
    // Set the OCR language to Kannada
    Language = OcrLanguage.Kannada
};

using (var Input = new OcrInput(@"images\Kannada.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);
    // Retrieve all recognized text from the OCR result
    var AllText = Result.Text;
}
$vbLabelText   $csharpLabel
  • IronTesseract는 OCR 엔진의 인스턴스입니다.
  • OcrLanguage.Kannada는 OCR이 칸나다 언어를 특히 대상으로 해야 한다는 것을 지정합니다.
  • OcrInput은 OCR 처리를 위해 지정된 경로에서 이미지를 로드합니다.
  • Read 메서드는 입력을 처리하고 인식된 텍스트를 반환합니다.
  • 마지막으로 인식된 텍스트가 AllText에 저장됩니다.