Vietnamese OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Andere Versionen dieses Dokuments:

IronOCR ist eine C#-Softwarekomponente, die .NET-Entwicklern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich Vietnamesisch, zu lesen.

Es ist eine erweiterte Abspaltung von Tesseract, die exklusiv for .NET-Entwickler entwickelt wurde und regelmäßig andere Tesseract-Engines sowohl in Bezug auf Geschwindigkeit als auch Genauigkeit übertrifft.

Inhalt von IronOcr.Languages.Vietnamese

Dieses Paket enthält 132 OCR-Sprachen for .NET:

  • Vietnamesisch
  • VietnamesischBest
  • VietnamesischFast
  • VietnamesischAlphabet
  • VietnamesischAlphabetBest
  • VietnamesischAlphabetFast

Download

Vietnamesisches Sprachpaket [Tiếng Việt]

Installation

Das Erste, was wir tun müssen, ist unser Vietnamesisch OCR-Paket in Ihrem .NET-Projekt zu installieren.

Install-Package IronOcr.Languages.Vietnamese

Beispielcode

Dieses C#-Codebeispiel liest vietnamesischen Text aus einem Bild oder PDF-Dokument.

// You need to install the IronOcr.Languages.Vietnamese package using the following NuGet command before running this code:
// PM> Install-Package IronOcr.Languages.Vietnamese

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Vietnamese
Ocr.Language = OcrLanguage.Vietnamese;

using (var Input = new OcrInput(@"images\Vietnamese.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Extract all recognized text
    var AllText = Result.Text;

    // Example: Output the extracted text to the console
    Console.WriteLine(AllText);
}
// You need to install the IronOcr.Languages.Vietnamese package using the following NuGet command before running this code:
// PM> Install-Package IronOcr.Languages.Vietnamese

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Vietnamese
Ocr.Language = OcrLanguage.Vietnamese;

using (var Input = new OcrInput(@"images\Vietnamese.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Extract all recognized text
    var AllText = Result.Text;

    // Example: Output the extracted text to the console
    Console.WriteLine(AllText);
}
$vbLabelText   $csharpLabel

In diesem Codebeispiel:

  • Wir erstellen eine Instanz von IronTesseract.
  • Stellen Sie die Sprache mit Ocr.Language = OcrLanguage.Vietnamese; auf Vietnamesisch ein.
  • Erstellen Sie ein OcrInput-Objekt mit dem Pfad zum Bild oder PDF.
  • Rufen Sie die Methode Read auf, um eine OCR durchzuführen und den extrahierten Text zu erhalten. Der extrahierte Text wird in AllText gespeichert und kann nach Bedarf verwendet werden, z. B. zum Anzeigen oder Speichern in einer Datei.