German OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR ist eine C#-Softwarekomponente, die es .NET-Programmierern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich Deutsch, auszulesen.

Es ist eine erweiterte Abspaltung von Tesseract, die exklusiv für .NET-Entwickler entwickelt wurde und regelmäßig andere Tesseract-Engines sowohl in Bezug auf Geschwindigkeit als auch Genauigkeit übertrifft.

Inhalt von IronOcr.Languages.German

Dieses Paket enthält 61 OCR-Sprachen für .NET:

  • Deutsch
  • DeutschBest
  • DeutschFast
  • DeutschFraktur

Download

Deutsches Sprachpaket style='white-space:default'>[Deutsch]

Installation

Das Erste, was wir tun müssen, ist, unser deutsches OCR-Paket in Ihr .NET-Projekt zu installieren.

Install-Package IronOCR.Languages.German

Beispielcode

Dieses C#-Beispiel liest deutschen Text aus einem Bild oder PDF-Dokument.

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to German. This must match the language of the document you are scanning.
Ocr.Language = OcrLanguage.German;

using (var Input = new OcrInput(@"images\German.png"))
{
    // Perform OCR on the provided image and get the result.
    var Result = Ocr.Read(Input);
    // Extract all recognized text from the OCR result.
    var AllText = Result.Text;
    // Optionally, output the recognized text to the console for verification.
    Console.WriteLine(AllText);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to German. This must match the language of the document you are scanning.
Ocr.Language = OcrLanguage.German;

using (var Input = new OcrInput(@"images\German.png"))
{
    // Perform OCR on the provided image and get the result.
    var Result = Ocr.Read(Input);
    // Extract all recognized text from the OCR result.
    var AllText = Result.Text;
    // Optionally, output the recognized text to the console for verification.
    Console.WriteLine(AllText);
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set the OCR language to German. This must match the language of the document you are scanning.
Ocr.Language = OcrLanguage.German

Using Input = New OcrInput("images\German.png")
	' Perform OCR on the provided image and get the result.
	Dim Result = Ocr.Read(Input)
	' Extract all recognized text from the OCR result.
	Dim AllText = Result.Text
	' Optionally, output the recognized text to the console for verification.
	Console.WriteLine(AllText)
End Using
$vbLabelText   $csharpLabel

In diesem Beispiel ist IronTesseract so konfiguriert, dass es die deutsche Sprache für OCR verwendet, was für die Verarbeitung von Bildern oder PDFs mit deutschem Text erforderlich ist. Die OcrInput-Klasse wird verwendet, um die Bilddatei anzugeben, und die Read-Methode führt die OCR-Operation aus und gibt den extrahierten Text zurück.