Assamese OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

126개 언어 추가 지원

IronOCR 은 .NET 개발자가 아삼어를 포함한 126개 언어로 된 이미지와 PDF 문서에서 텍스트를 읽을 수 있도록 해주는 C# 소프트웨어 구성 요소입니다.

이는 .NET 개발자 전용으로 개발된 Tesseract의 고급 포크 버전으로, 속도와 정확도 면에서 다른 Tesseract 엔진보다 뛰어난 성능을 보여줍니다.

IronOCR 의 내용.언어.아삼어

이 패키지에는 .NET용 OCR 언어 49개가 포함되어 있습니다.

  • 아삼어
  • 아삼어베스트
  • 아삼어 패스트

다운로드

아삼어 언어 팩 [অসমীযা]

설치

먼저 아삼어 OCR 패키지를 .NET 프로젝트에 설치해야 합니다.

Install-Package IronOcr.Languages.Assamese

코드 예제

이 C# 코드 예제는 이미지 또는 PDF 문서에서 아삼어 텍스트를 읽습니다.

// Make sure to install the necessary package:
// PM> Install-Package IronOcr.Languages.Assamese

using IronOcr;

class OCRExample
{
    public void ReadAssameseText()
    {
        // Create an instance of IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Set the language to Assamese
        Ocr.Language = OcrLanguage.Assamese;

        // Create an OCR input object with the specified image or PDF file
        using (var Input = new OcrInput(@"images\Assamese.png"))
        {
            // Read the text from the input file
            var Result = Ocr.Read(Input);

            // Retrieve the text from the OCR result
            var AllText = Result.Text;

            // Output the recognized text to the console
            Console.WriteLine(AllText);
        }
    }
}
// Make sure to install the necessary package:
// PM> Install-Package IronOcr.Languages.Assamese

using IronOcr;

class OCRExample
{
    public void ReadAssameseText()
    {
        // Create an instance of IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Set the language to Assamese
        Ocr.Language = OcrLanguage.Assamese;

        // Create an OCR input object with the specified image or PDF file
        using (var Input = new OcrInput(@"images\Assamese.png"))
        {
            // Read the text from the input file
            var Result = Ocr.Read(Input);

            // Retrieve the text from the OCR result
            var AllText = Result.Text;

            // Output the recognized text to the console
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel
  • IronTesseract : 이 클래스는 OCR 작업을 담당하는 주요 클래스입니다.
  • OcrLanguage.Assamese : OCR에 사용할 언어를 지정합니다. 이 경우에는 아삼어로 설정되어 있습니다.
  • OcrInput : 이 클래스는 텍스트를 추출하려는 이미지 또는 PDF를 불러오는 데 사용됩니다.
  • Result.Text : 이미지 또는 PDF에서 추출한 전체 텍스트를 포함합니다.