Czech OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Andere Versionen dieses Dokuments:

IronOCR ist eine C#-Softwarekomponente, die .NET-Programmierern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich Tschechisch, auszulesen.

Es ist eine fortschrittliche Abspaltung von Tesseract, die ausschließlich for .NET-Entwickler gebaut wurde und regelmäßig andere Tesseract-Engines sowohl in Geschwindigkeit als auch Genauigkeit übertrifft.

Inhalt von IronOcr.Languages.Czech

Dieses Paket enthält 40 OCR-Sprachen for .NET:

  • Tschechisch
  • TschechischBest
  • TschechischFast

Download

Tschechisches Sprachpaket [čeština]

Installation

Das Erste, was wir tun müssen, ist, unser Tschechisch OCR-Paket zu Ihrem .NET-Projekt zu installieren.

Install-Package IronOcr.Languages.Czech

Beispielcode

Dieses C#-Beispiel liest tschechischen Text aus einem Bild oder PDF-Dokument.

// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create a new IronTesseract instance
        var Ocr = new IronTesseract();

        // Set the OCR language to Czech
        Ocr.Language = OcrLanguage.Czech;

        // Define the input image or PDF and perform OCR
        using (var Input = new OcrInput(@"images\Czech.png"))
        {
            // Read the input and perform OCR
            var Result = Ocr.Read(Input);

            // Extract all recognized text
            var AllText = Result.Text;

            // Output the recognized text to the console
            Console.WriteLine(AllText);
        }
    }
}
// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create a new IronTesseract instance
        var Ocr = new IronTesseract();

        // Set the OCR language to Czech
        Ocr.Language = OcrLanguage.Czech;

        // Define the input image or PDF and perform OCR
        using (var Input = new OcrInput(@"images\Czech.png"))
        {
            // Read the input and perform OCR
            var Result = Ocr.Read(Input);

            // Extract all recognized text
            var AllText = Result.Text;

            // Output the recognized text to the console
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel

Der obige Code demonstriert, wie die Klasse IronTesseract konfiguriert und verwendet wird, um eine OCR-Texterkennung auf einem gegebenen Bild oder PDF durchzuführen.

  • Stellen Sie sicher, dass das Paket IronOcr.Languages.Czech in Ihrer Umgebung installiert ist, damit der Code korrekt ausgeführt werden kann. Die Klasse OcrInput dient zum Laden des Bildes vom angegebenen Pfad, und Ocr.Read() führt die OCR-Operation durch.
  • Result.Text enthält die OCR-Ausgabe, die in diesem Fall auf der Konsole ausgegeben wird.