Vietnamese OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
이 문서의 다른 버전:

IronOCR 은 .NET 개발자가 베트남어를 포함한 126개 언어로 된 이미지와 PDF 문서에서 텍스트를 읽을 수 있도록 해주는 C# 소프트웨어 구성 요소입니다.

이는 .NET 개발자 전용으로 개발된 Tesseract의 고급 포크 버전으로, 속도와 정확도 면에서 다른 Tesseract 엔진보다 뛰어난 성능을 보여줍니다.

IronOCR 의 내용.언어.베트남어

이 패키지에는 .NET 용 OCR 언어 132개가 포함되어 있습니다.

  • 베트남어
  • 베트남어Best
  • 베트남어Fast
  • 베트남어 알파벳
  • 베트남어 알파벳Best
  • 베트남어 알파벳 빠르게

다운로드

베트남어 언어 팩 [Tiếng Viet]

  • Download as Zip
  • NuGet 사용하여 설치하세요

설치

먼저 .NET 프로젝트에 베트남어 OCR 패키지를 설치해야 합니다.

Install-Package IronOcr.Languages.Vietnamese

코드 예제

이 C# 코드 예제는 이미지 또는 PDF 문서에서 베트남어 텍스트를 읽습니다.

// You need to install the IronOcr.Languages.Vietnamese package using the following NuGet command before running this code:
// PM> Install-Package IronOcr.Languages.Vietnamese

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Vietnamese
Ocr.Language = OcrLanguage.Vietnamese;

using (var Input = new OcrInput(@"images\Vietnamese.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Extract all recognized text
    var AllText = Result.Text;

    // Example: Output the extracted text to the console
    Console.WriteLine(AllText);
}
// You need to install the IronOcr.Languages.Vietnamese package using the following NuGet command before running this code:
// PM> Install-Package IronOcr.Languages.Vietnamese

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Vietnamese
Ocr.Language = OcrLanguage.Vietnamese;

using (var Input = new OcrInput(@"images\Vietnamese.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Extract all recognized text
    var AllText = Result.Text;

    // Example: Output the extracted text to the console
    Console.WriteLine(AllText);
}
' You need to install the IronOcr.Languages.Vietnamese package using the following NuGet command before running this code:
' PM> Install-Package IronOcr.Languages.Vietnamese

Imports IronOcr

Dim Ocr As New IronTesseract()

' Set the OCR language to Vietnamese
Ocr.Language = OcrLanguage.Vietnamese

Using Input As New OcrInput("images\Vietnamese.png")
    ' Perform OCR on the input image
    Dim Result = Ocr.Read(Input)

    ' Extract all recognized text
    Dim AllText = Result.Text

    ' Example: Output the extracted text to the console
    Console.WriteLine(AllText)
End Using
$vbLabelText   $csharpLabel

이 코드 예제에서는 다음과 같습니다.

  • IronTesseract의 인스턴스를 생성합니다.
  • Ocr.Language = OcrLanguage.Vietnamese;을 사용하여 언어를 베트남어로 설정하십시오.
  • 이미지 또는 PDF의 경로를 사용하여 OcrInput 객체를 생성합니다.
  • Read 메서드를 호출하여 OCR을 수행하고 추출된 텍스트를 얻습니다.
  • 추출된 텍스트는 AllText에 저장되며, 이를 표시하거나 파일에 저장하는 등 필요에 따라 사용할 수 있습니다.