Niederländische OCR in C# und .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR ist eine C#-Softwarekomponente, die es .NET-Entwicklern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich Niederländisch, zu lesen.

Es ist eine erweiterte Abspaltung von Tesseract, die exklusiv für .NET-Entwickler entwickelt wurde und regelmäßig andere Tesseract-Engines sowohl in Bezug auf Geschwindigkeit als auch Genauigkeit übertrifft.

Inhalt von IronOcr.Languages.Dutch

Dieses Paket enthält 40 OCR-Sprachen für .NET:

  • Niederländisch
  • NiederländischBest
  • NiederländischFast

Download

Niederländisches Sprachpaket [Nederlands]

Installation

Das erste, was wir tun müssen, ist das Niederländische OCR-Paket in Ihrem .NET-Projekt zu installieren.

Install-Package IronOCR.Languages.Dutch

Beispielcode

Dieses C#-Codebeispiel liest niederländischen Text aus einem Bild oder PDF-Dokument.

// The first step is to ensure the IronOcr.Languages.Dutch package is installed.
// You can do this from the Package Manager Console with the command:
// PM> Install-Package IronOcr.Languages.Dutch

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Dutch.
// This is crucial for recognizing text in that language effectively.
Ocr.Language = OcrLanguage.Dutch;

// Use a using statement to manage the OcrInput resource lifecycle.
using (var Input = new OcrInput(@"images\Dutch.png"))
{
    // Read the image and perform OCR to extract text.
    var Result = Ocr.Read(Input);

    // Store the recognized text into a variable.
    var AllText = Result.Text;

    // You can now use the extracted text stored in AllText.
}
// The first step is to ensure the IronOcr.Languages.Dutch package is installed.
// You can do this from the Package Manager Console with the command:
// PM> Install-Package IronOcr.Languages.Dutch

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Dutch.
// This is crucial for recognizing text in that language effectively.
Ocr.Language = OcrLanguage.Dutch;

// Use a using statement to manage the OcrInput resource lifecycle.
using (var Input = new OcrInput(@"images\Dutch.png"))
{
    // Read the image and perform OCR to extract text.
    var Result = Ocr.Read(Input);

    // Store the recognized text into a variable.
    var AllText = Result.Text;

    // You can now use the extracted text stored in AllText.
}
$vbLabelText   $csharpLabel

Dieser Code richtet einen OCR-Prozess in C# ein, um niederländischen Text zu lesen. Es initialisiert das IronTesseract-Objekt, gibt die OCR-Sprache an und verarbeitet die Eingabebilddatei. Das Ergebnis ist der extrahierte Text aus der Datei, der nach Bedarf in Ihrer Anwendung verwendet werden kann.