Cherokee OCR in C#

This article was translated from English: Does it need improvement?
Translated
View the article in English

126개 언어 추가 지원

IronOCR 은 .NET 개발자가 체로키어를 포함한 126개 언어로 된 이미지와 PDF 문서에서 텍스트를 읽을 수 있도록 해주는 C# 소프트웨어 구성 요소입니다.

이는 .NET 개발자 전용으로 개발된 Tesseract의 고급 포크 버전으로, 속도와 정확도 면에서 다른 Tesseract 엔진보다 뛰어난 성능을 보여줍니다.

IronOCR 의 내용.언어.체로키어

이 패키지에는 .NET 용 OCR 언어 120개가 포함되어 있습니다.

  • 체로키 알파벳
  • 체로키알파벳베스트
  • 체로키 알파벳 패스트
  • 체로키족
  • 체로키베스트
  • 체로키패스트

다운로드

체로키어 언어 팩 [ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ]

설치

먼저 해야 할 일은 Cherokee OCR 패키지를 .NET 프로젝트에 설치하는 것입니다.

Install-Package IronOcr.Languages.Cherokee

코드 예제

이 C# 코드 예제는 이미지 또는 PDF 문서에서 체로키어 텍스트를 읽습니다.

// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an instance of the IronTesseract class
        var Ocr = new IronTesseract();

        // Set the language for OCR to Cherokee
        Ocr.Language = OcrLanguage.Cherokee;

        // Use OcrInput to specify the image or PDF to be read
        using (var Input = new OcrInput(@"images\Cherokee.png"))
        {
            // Perform OCR on the input document
            var Result = Ocr.Read(Input);

            // Extract all recognized text
            var AllText = Result.Text;

            // Display the recognized text
            Console.WriteLine(AllText);
        }
    }
}
// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an instance of the IronTesseract class
        var Ocr = new IronTesseract();

        // Set the language for OCR to Cherokee
        Ocr.Language = OcrLanguage.Cherokee;

        // Use OcrInput to specify the image or PDF to be read
        using (var Input = new OcrInput(@"images\Cherokee.png"))
        {
            // Perform OCR on the input document
            var Result = Ocr.Read(Input);

            // Extract all recognized text
            var AllText = Result.Text;

            // Display the recognized text
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel

다음은 코드 작동 방식에 대한 간략한 설명입니다.

  • IronTesseract: OCR 작업을 처리하기 위해 IronTesseract 클래스의 인스턴스가 생성됩니다.
  • OcrLanguage.Cherokee: OcrLanguage.Cherokee 속성을 사용하여 언어를 체로키어로 설정하며, 이는 OCR 엔진에 체로키어로 텍스트를 인식하도록 지시합니다.
  • OcrInput: OcrInput 클래스에 이미지나 PDF 문서가 있는 입력 경로를 제공합니다.
  • Ocr.Read: OCR 객체에서 Read 메서드를 호출하여 입력을 전달합니다. 이 프로그램은 OCR(광학 문자 인식) 프로세스를 수행합니다.
  • Result.Text: 결과에서 인식된 텍스트를 추출하여 AllText 변수에 저장하여 추가로 사용합니다.
  • 콘솔 출력: 인식된 텍스트가 콘솔에 출력됩니다.