Corsican OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Andere Versionen dieses Dokuments:

IronOCR ist eine C# Softwarekomponente, die .NET-Entwicklern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich Korsisch, zu lesen.

Es ist eine erweiterte Abspaltung von Tesseract, die exklusiv for .NET-Entwickler entwickelt wurde und regelmäßig andere Tesseract-Engines sowohl in Bezug auf Geschwindigkeit als auch Genauigkeit übertrifft.

Inhalt von IronOcr.Languages.Corsican

Dieses Paket enthält 49 OCR-Sprachen for .NET:

  • Korsisch
  • KorsischBest
  • KorsischSchnell

Download

Korsisches Sprachpaket [corsu]

Installation

Das Erste, was wir tun müssen, ist unser Korsisch OCR-Paket in Ihr .NET-Projekt zu installieren.

Install-Package IronOcr.Languages.Corsican

Beispielcode

Dieses C#-Codebeispiel liest einen korsischen Text aus einem Bild oder PDF-Dokument.

// First, ensure the IronOcr.Languages.Corsican package is installed
// You can use the NuGet Package Manager console:
// PM> Install-Package IronOcr.Languages.Corsican

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Corsican
Ocr.Language = OcrLanguage.Corsican;

// Reading text from an image file
using (var Input = new OcrInput(@"images\Corsican.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Extract all recognized text from the OCR result
    var AllText = Result.Text;
}
// First, ensure the IronOcr.Languages.Corsican package is installed
// You can use the NuGet Package Manager console:
// PM> Install-Package IronOcr.Languages.Corsican

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Corsican
Ocr.Language = OcrLanguage.Corsican;

// Reading text from an image file
using (var Input = new OcrInput(@"images\Corsican.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Extract all recognized text from the OCR result
    var AllText = Result.Text;
}
$vbLabelText   $csharpLabel

In diesem Code:

  • Wir erstellen eine Instanz von IronTesseract, die zur Durchführung der OCR verwendet wird.
  • Wir geben die Sprache als Korsisch mit OcrLanguage.Corsican an.
  • Wir lesen aus einem Eingabebild mit dem Namen Corsican.png. Die Methode Read von Ocr führt die OCR durch und gibt das Ergebnis zurück, aus dem wir den erkannten Text extrahieren können.