English OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

126개 언어 추가 지원

IronOCR은 .NET 개발자가 이미지를 비롯한 PDF 문서에서 영어를 포함한 126개 언어의 텍스트를 읽을 수 있게 하는 C# 소프트웨어 컴포넌트입니다.

이는 .NET 개발자 전용으로 제작된 Tesseract의 고급 포크 버전으로, 속도와 정확도 면에서 다른 Tesseract 엔진보다 뛰어난 성능을 보여줍니다.

IronOcr.Languages.English의 내용

이 패키지에는 .NET용 OCR 언어 64개가 포함되어 있습니다.

다운로드

영어 언어 팩 [현대 영어]

  • Zip 으로 다운로드

코드 예제

이 C# 코드 예제는 이미지 또는 PDF 문서에서 영어 텍스트를 읽습니다.

// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Initialize the IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Set the language to English
        Ocr.Language = OcrLanguage.English;

        // Define the input source as an image file
        using (var Input = new OcrInput(@"images\English.png"))
        {
            // Perform OCR to read the text from the input
            var Result = Ocr.Read(Input);

            // Get all the recognized text
            var AllText = Result.Text;

            // Output the recognized text
            Console.WriteLine(AllText);
        }
    }
}
// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Initialize the IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Set the language to English
        Ocr.Language = OcrLanguage.English;

        // Define the input source as an image file
        using (var Input = new OcrInput(@"images\English.png"))
        {
            // Perform OCR to read the text from the input
            var Result = Ocr.Read(Input);

            // Get all the recognized text
            var AllText = Result.Text;

            // Output the recognized text
            Console.WriteLine(AllText);
        }
    }
}
Imports IronOcr

Class Program
    Shared Sub Main()
        ' Initialize the IronTesseract OCR engine
        Dim Ocr As New IronTesseract()

        ' Set the language to English
        Ocr.Language = OcrLanguage.English

        ' Define the input source as an image file
        Using Input As New OcrInput("images\English.png")
            ' Perform OCR to read the text from the input
            Dim Result = Ocr.Read(Input)

            ' Get all the recognized text
            Dim AllText = Result.Text

            ' Output the recognized text
            Console.WriteLine(AllText)
        End Using
    End Sub
End Class
$vbLabelText   $csharpLabel
  • IronOCR 패키지와 해당 언어 팩이 설치되어 있는지 확인하십시오.
  • 이 예제는 OCR 엔진을 초기화하고, 영어 처리로 설정하여 입력 이미지에서 텍스트를 읽고, 인식된 텍스트를 출력합니다.