Telugu OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
이 문서의 다른 버전:

IronOCR은 .NET 개발자가 텔루구어를 포함한 126개 언어로 된 이미지와 PDF 문서에서 텍스트를 읽을 수 있도록 해주는 C# 소프트웨어 구성 요소입니다.

이는 .NET 개발자 전용으로 개발된 Tesseract의 고급 포크 버전으로, 속도와 정확도 면에서 다른 Tesseract 엔진보다 뛰어난 성능을 보여줍니다.

IronOcr의 내용.언어.텔루구어

이 패키지에는 텔루구어 관련 .NET용 OCR 언어 모델이 여러 개 포함되어 있습니다.

  • 텔루구어
  • 텔루구베스트
  • 텔루구패스트
  • 텔루구어 알파벳
  • 텔루구어알파벳베스트
  • 텔루구어알파벳패스트

다운로드

Telugu Language Pack [తలుగు]

설치

첫 번째 단계는 .NET 프로젝트에 텔루구어 OCR 패키지를 설치하는 것입니다.

Install-Package IronOcr.Languages.Telugu

코드 예제

다음은 이미지 또는 PDF 문서에서 텔루구어 텍스트를 읽는 C# 코드 예제입니다.

// Ensure that you have installed the IronOcr.Languages.Telugu package before running this code.

using IronOcr;

public class TeluguOcrExample
{
    public static void Main()
    {
        // Create a new IronTesseract instance
        var Ocr = new IronTesseract();

        // Specify the OCR language as Telugu
        Ocr.Language = OcrLanguage.Telugu;

        // Create a new OcrInput and specify the path to the image or PDF
        using (var Input = new OcrInput(@"images\Telugu.png"))
        {
            // Perform OCR on the input file
            var Result = Ocr.Read(Input);

            // Extract and store the recognized text
            var AllText = Result.Text;

            // Output the recognized text to the console (optional)
            Console.WriteLine(AllText);
        }
    }
}
// Ensure that you have installed the IronOcr.Languages.Telugu package before running this code.

using IronOcr;

public class TeluguOcrExample
{
    public static void Main()
    {
        // Create a new IronTesseract instance
        var Ocr = new IronTesseract();

        // Specify the OCR language as Telugu
        Ocr.Language = OcrLanguage.Telugu;

        // Create a new OcrInput and specify the path to the image or PDF
        using (var Input = new OcrInput(@"images\Telugu.png"))
        {
            // Perform OCR on the input file
            var Result = Ocr.Read(Input);

            // Extract and store the recognized text
            var AllText = Result.Text;

            // Output the recognized text to the console (optional)
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel

이 코드 조각은 IronOCR 패키지를 사용하여 OCR 엔진을 초기화하고, OCR 처리 언어를 텔루구어로 설정하며, 사용자가 지정한 입력 이미지 파일에서 텍스트를 읽습니다.