Kannada OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Outras versões deste documento:

O IronOCR é um componente de software C# que permite aos desenvolvedores .NET ler texto a partir de imagens e documentos PDF em 126 idiomas, incluindo o canarês. Trata-se de uma versão avançada do Tesseract, criada exclusivamente para desenvolvedores .NET e que supera regularmente outros mecanismos do Tesseract em termos de velocidade e precisão.

Conteúdos de IronOcr.Languages.Kannada

Este pacote contém vários modelos de idioma OCR para o canarês em .NET:

  • Canarês
  • KannadaBest
  • KannadaFast
  • KannadaAlphabet
  • KannadaAlphabetBest
  • KannadaAlphabetFast

Baixar

Pacote de Idioma Canarês [ಕನನಡ]

Instalação

A primeira coisa que temos que fazer é instalar o pacote OCR de Canarês no seu projeto .NET.

Install-Package IronOcr.Languages.Kannada

Exemplo de código

Este exemplo de código C# lê texto em canarês de uma imagem ou documento PDF.

// Make sure to install the IronOcr.Languages.Kannada package via NuGet
using IronOcr;

var Ocr = new IronTesseract
{
    // Set the OCR language to Kannada
    Language = OcrLanguage.Kannada
};

using (var Input = new OcrInput(@"images\Kannada.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);
    // Retrieve all recognized text from the OCR result
    var AllText = Result.Text;
}
// Make sure to install the IronOcr.Languages.Kannada package via NuGet
using IronOcr;

var Ocr = new IronTesseract
{
    // Set the OCR language to Kannada
    Language = OcrLanguage.Kannada
};

using (var Input = new OcrInput(@"images\Kannada.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);
    // Retrieve all recognized text from the OCR result
    var AllText = Result.Text;
}
$vbLabelText   $csharpLabel
  • IronTesseract é uma instância do mecanismo OCR.
  • OcrLanguage.Kannada especifica que o OCR deve direcionar especificamente o idioma canarês.
  • OcrInput carrega a imagem do caminho especificado para o processamento OCR.
  • O método Read processa o input e retorna o texto reconhecido.
  • Finalmente, o texto reconhecido é armazenado em AllText.