OCR de Kannada en C# y .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR es un componente de software en C# que permite a los desarrolladores de .NET leer texto de imágenes y documentos PDF en 126 idiomas, incluida Kannada. Es una rama avanzada de Tesseract, construida exclusivamente para desarrolladores de .NET y supera regularmente a otros motores de Tesseract tanto en velocidad como en precisión.

Contenido de IronOcr.Languages.Kannada

Este paquete contiene varios modelos de idioma OCR de Kannada para .NET:

  • Kannada
  • KannadaBest
  • KannadaFast
  • KannadaAlphabet
  • KannadaAlphabetBest
  • KannadaAlphabetFast

Descargar

Paquete de idioma Kannada [ಕನನಡ]

Instalación

Lo primero que debemos hacer es instalar el paquete OCR de Kannada en tu proyecto .NET.

Install-Package IronOCR.Languages.Kannada

Ejemplo de código

Este ejemplo de código en C# lee texto en kannada desde una imagen o documento PDF.

// Make sure to install the IronOcr.Languages.Kannada package via NuGet
using IronOcr;

var Ocr = new IronTesseract
{
    // Set the OCR language to Kannada
    Language = OcrLanguage.Kannada
};

using (var Input = new OcrInput(@"images\Kannada.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);
    // Retrieve all recognized text from the OCR result
    var AllText = Result.Text;
}
// Make sure to install the IronOcr.Languages.Kannada package via NuGet
using IronOcr;

var Ocr = new IronTesseract
{
    // Set the OCR language to Kannada
    Language = OcrLanguage.Kannada
};

using (var Input = new OcrInput(@"images\Kannada.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);
    // Retrieve all recognized text from the OCR result
    var AllText = Result.Text;
}
' Make sure to install the IronOcr.Languages.Kannada package via NuGet
Imports IronOcr

Private Ocr = New IronTesseract With {.Language = OcrLanguage.Kannada}

Using Input = New OcrInput("images\Kannada.png")
	' Perform OCR on the input image
	Dim Result = Ocr.Read(Input)
	' Retrieve all recognized text from the OCR result
	Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel
  • IronTesseract es una instancia del motor OCR.
  • OcrLanguage.Kannada especifica que el OCR debe enfocarse específicamente en el idioma kannada.
  • OcrInput carga la imagen desde la ruta especificada para el procesamiento OCR.
  • El método Read procesa la entrada y devuelve el texto reconocido.
  • Finalmente, el texto reconocido se almacena en AllText.