Tibetan Alphabet OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

126개 언어 추가 지원

IronOCR은 .NET 개발자가 티베트 문자를 포함한 126개 언어로 된 이미지와 PDF 문서에서 텍스트를 읽을 수 있도록 해주는 C# 소프트웨어 구성 요소입니다.

이는 .NET 개발자 전용으로 제작된 Tesseract의 고급 포크 버전으로, 속도와 정확도 면에서 다른 Tesseract 엔진보다 뛰어난 성능을 보여줍니다.

IronOcr.Languages.Tibetan의 내용

이 패키지에는 .NET 용 OCR 언어 114개가 포함되어 있습니다.

  • 티베트어
  • 티베트베스트
  • 티베트식사
  • 티베트 알파벳
  • 티베트 알파벳 베스트
  • 티베트 알파벳 패스트

다운로드

티베트어 알파벳 언어 팩 [티베트어 표준]

설치

먼저 .NET 프로젝트에 티베트어 알파벳 OCR 패키지를 설치해야 합니다.

Install-Package IronOcr.Languages.Tibetan

코드 예제

이 C# 코드 예제는 이미지 또는 PDF 문서에서 티베트어 알파벳 텍스트를 읽습니다.

// Import the IronOcr namespace to use its components
using IronOcr;

class Program
{
    static void Main()
    {
        // Initialize a new IronTesseract object for OCR
        var Ocr = new IronTesseract();

        // Set the OCR language to Tibetan
        Ocr.Language = OcrLanguage.Tibetan;

        // Use a using statement for automatic resource disposal
        using (var Input = new OcrInput(@"images\Tibetan.png"))
        {
            // Perform OCR to read text from the input image
            var Result = Ocr.Read(Input);

            // Retrieve all recognized text from the OCR Result
            var AllText = Result.Text;

            // Output the recognized text to the console
            // Note: Ensure that the console supports Tibetan script for correct display
            Console.WriteLine(AllText);
        }
    }
}
// Import the IronOcr namespace to use its components
using IronOcr;

class Program
{
    static void Main()
    {
        // Initialize a new IronTesseract object for OCR
        var Ocr = new IronTesseract();

        // Set the OCR language to Tibetan
        Ocr.Language = OcrLanguage.Tibetan;

        // Use a using statement for automatic resource disposal
        using (var Input = new OcrInput(@"images\Tibetan.png"))
        {
            // Perform OCR to read text from the input image
            var Result = Ocr.Read(Input);

            // Retrieve all recognized text from the OCR Result
            var AllText = Result.Text;

            // Output the recognized text to the console
            // Note: Ensure that the console supports Tibetan script for correct display
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel

메모

  • OCR 라이브러리 (IronTesseract)는 제공된 이미지에서 티베트어를 읽도록 구성되어 있습니다.
  • OcrInput는 입력 이미지를 로드하고 using 문장을 사용하여 리소스의 적절한 처리를 보장합니다.
  • Result.Text는 애플리케이션 내에서 인쇄되거나 사용할 수 있는 OCR 처리된 텍스트를 포함하고 있습니다.