Kazakh OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
이 문서의 다른 버전:

IronOCR는 .NET 코더가 이미지 및 PDF 문서에서 텍스트를 읽을 수 있도록 하는 C# 소프트웨어 컴포넌트로, 카자흐 어를 포함한 126개 언어를 지원합니다.

이는 .NET 개발자 전용으로 개발된 Tesseract의 고급 포크 버전으로, 속도와 정확도 면에서 다른 Tesseract 엔진보다 뛰어난 성능을 보여줍니다.

IronOcr.Languages.Kazakh의 내용물

이 패키지에는 .NET 용 OCR 언어 43개가 포함되어 있습니다.

  • 카자흐
  • 카자흐베스트
  • 카자흐패스트

다운로드

카자흐 언어팩 [қазақ тілі]

설치

가장 먼저 해야 할 일은 카자흐 OCR 패키지를 .NET 프로젝트에 설치하는 것입니다.

Install-Package IronOcr.Languages.Kazakh

코드 예제

이 C# 코드 예제는 이미지 또는 PDF 문서에서 카자흐 텍스트를 읽습니다.

// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Initialize the IronTesseract OCR class
        var Ocr = new IronTesseract();

        // Set the OCR language to Kazakh
        Ocr.Language = OcrLanguage.Kazakh;

        // Use a 'using' statement to manage resources efficiently
        using (var Input = new OcrInput(@"images\Kazakh.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Retrieve and store the recognized text
            var AllText = Result.Text;

            // Output the recognized text
            Console.WriteLine(AllText);
        }
    }
}
// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Initialize the IronTesseract OCR class
        var Ocr = new IronTesseract();

        // Set the OCR language to Kazakh
        Ocr.Language = OcrLanguage.Kazakh;

        // Use a 'using' statement to manage resources efficiently
        using (var Input = new OcrInput(@"images\Kazakh.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Retrieve and store the recognized text
            var AllText = Result.Text;

            // Output the recognized text
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel

이 코드는 IronOCR을 사용하여 카자흐어로 구성된 Kazakh.png라는 이미지 파일에 광학 문자 인식(OCR)을 수행하는 방법을 보여줍니다. 인식된 텍스트는 추출되어 콘솔에 출력됩니다.