Kannada OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR ist eine C# Softwarekomponente, die es .NET-Entwicklern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, darunter Kannada, zu lesen. Es ist eine erweiterte Abspaltung von Tesseract, die exklusiv für .NET-Entwickler entwickelt wurde und regelmäßig andere Tesseract-Engines sowohl in Bezug auf Geschwindigkeit als auch Genauigkeit übertrifft.

Inhalt von IronOcr.Languages.Kannada

Dieses Paket enthält mehrere Kannada-OCR-Sprachmodelle für .NET:

  • Kannada
  • KannadaBest
  • KannadaFast
  • KannadaAlphabet
  • KannadaAlphabetBest
  • KannadaAlphabetFast

Download

Kannada Sprachpaket style='white-space:default'>[ಕನ್ನಡ]

Installation

Das Erste, was wir tun müssen, ist das Kannada OCR-Paket in Ihr .NET-Projekt zu installieren.

Install-Package IronOCR.Languages.Kannada

Beispielcode

Dieses C# Codebeispiel liest Kannada-Text aus einem Bild oder PDF-Dokument.

// Make sure to install the IronOcr.Languages.Kannada package via NuGet
using IronOcr;

var Ocr = new IronTesseract
{
    // Set the OCR language to Kannada
    Language = OcrLanguage.Kannada
};

using (var Input = new OcrInput(@"images\Kannada.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);
    // Retrieve all recognized text from the OCR result
    var AllText = Result.Text;
}
// Make sure to install the IronOcr.Languages.Kannada package via NuGet
using IronOcr;

var Ocr = new IronTesseract
{
    // Set the OCR language to Kannada
    Language = OcrLanguage.Kannada
};

using (var Input = new OcrInput(@"images\Kannada.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);
    // Retrieve all recognized text from the OCR result
    var AllText = Result.Text;
}
' Make sure to install the IronOcr.Languages.Kannada package via NuGet
Imports IronOcr

Private Ocr = New IronTesseract With {.Language = OcrLanguage.Kannada}

Using Input = New OcrInput("images\Kannada.png")
	' Perform OCR on the input image
	Dim Result = Ocr.Read(Input)
	' Retrieve all recognized text from the OCR result
	Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel
  • IronTesseract ist eine Instanz der OCR-Engine.
  • OcrLanguage.Kannada gibt an, dass die OCR speziell auf die Kannada-Sprache ausgerichtet sein soll.
  • OcrInput lädt das Bild vom angegebenen Pfad zur OCR-Verarbeitung.
  • Die Read-Methode verarbeitet die Eingabe und gibt den erkannten Text zurück.
  • Schließlich wird der erkannte Text in AllText gespeichert.