Devanagari Alphabet OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

126개 언어 추가 지원

IronOCR 은 .NET 개발자가 데바나가리 문자를 포함한 126개 언어로 된 이미지와 PDF 문서에서 텍스트를 읽을 수 있도록 해주는 C# 소프트웨어 구성 요소입니다. 이는 .NET 개발자 전용으로 개발된 Tesseract의 고급 포크 버전으로, 속도와 정확도 면에서 다른 Tesseract 엔진보다 뛰어난 성능을 보여줍니다.

IronOCR 의 내용.언어.데바나가리

이 패키지에는 .NET 용 OCR 언어 79개가 포함되어 있습니다.

  • 데바나가리 알파벳
  • 데바나가리 알파벳 베스트
  • 데바나가리알파벳패스트

다운로드

데바나가리 알파벳 언어 팩 [나가이르]

설치

먼저 해야 할 일은 데바나가리 알파벳 OCR 패키지를 .NET 프로젝트에 설치하는 것입니다.

Install-Package IronOcr.Languages.Devanagari

코드 예제

이 C# 코드 예제는 이미지 또는 PDF 문서에서 데바나가리 문자 텍스트를 읽습니다.

// Ensure the IronOcr package is installed 
// PM> Install-Package IronOcr.Languages.Devanagari

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Devanagari
Ocr.Language = OcrLanguage.Devanagari;

// Define the input file
using (var Input = new OcrInput(@"images\Devanagari.png"))
{
    // Process the input file
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Output the recognized text
    Console.WriteLine(AllText);
}
// Ensure the IronOcr package is installed 
// PM> Install-Package IronOcr.Languages.Devanagari

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Devanagari
Ocr.Language = OcrLanguage.Devanagari;

// Define the input file
using (var Input = new OcrInput(@"images\Devanagari.png"))
{
    // Process the input file
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Output the recognized text
    Console.WriteLine(AllText);
}
$vbLabelText   $csharpLabel

위 코드 조각은 다음을 보여줍니다.

  • IronTesseract OCR 엔진 설정.
  • OCR 언어를 데바나가리 문자로 설정합니다.
  • 데바나가리 문자가 포함된 이미지 파일을 읽는 중.
  • 인식된 텍스트를 추출하여 콘솔에 출력합니다.