Telugu OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Outras versões deste documento:

O IronOCR é um componente de software em C# que permite aos programadores .NET ler texto de imagens e documentos PDF em 126 idiomas, incluindo o telugu.

Trata-se de uma versão avançada do Tesseract, criada exclusivamente para desenvolvedores .NET e que supera regularmente outros mecanismos do Tesseract em termos de velocidade e precisão.

Conteúdo de IronOcr.Idiomas.Telugu

Este pacote contém diversos modelos de linguagem OCR for .NET relacionados ao Telugu:

  • Telugu
  • TeluguMelhor
  • TeluguFast
  • Alfabeto Telugu
  • TeluguAlphabetBest
  • Alfabeto Telugu Rápido

Baixar

Pacote de Idioma Telugu [తలుగు]

Instalação

O primeiro passo é instalar o pacote OCR Telugu em seu projeto .NET.

Install-Package IronOcr.Languages.Telugu

Exemplo de código

Este é um exemplo de código C# que lê texto em telugu de uma imagem ou documento PDF.

// Ensure that you have installed the IronOcr.Languages.Telugu package before running this code.

using IronOcr;

public class TeluguOcrExample
{
    public static void Main()
    {
        // Create a new IronTesseract instance
        var Ocr = new IronTesseract();

        // Specify the OCR language as Telugu
        Ocr.Language = OcrLanguage.Telugu;

        // Create a new OcrInput and specify the path to the image or PDF
        using (var Input = new OcrInput(@"images\Telugu.png"))
        {
            // Perform OCR on the input file
            var Result = Ocr.Read(Input);

            // Extract and store the recognized text
            var AllText = Result.Text;

            // Output the recognized text to the console (optional)
            Console.WriteLine(AllText);
        }
    }
}
// Ensure that you have installed the IronOcr.Languages.Telugu package before running this code.

using IronOcr;

public class TeluguOcrExample
{
    public static void Main()
    {
        // Create a new IronTesseract instance
        var Ocr = new IronTesseract();

        // Specify the OCR language as Telugu
        Ocr.Language = OcrLanguage.Telugu;

        // Create a new OcrInput and specify the path to the image or PDF
        using (var Input = new OcrInput(@"images\Telugu.png"))
        {
            // Perform OCR on the input file
            var Result = Ocr.Read(Input);

            // Extract and store the recognized text
            var AllText = Result.Text;

            // Output the recognized text to the console (optional)
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel

Este trecho de código inicializa um mecanismo de OCR usando o pacote IronOCR, define o idioma Telugu para processamento de OCR e lê o texto de um arquivo de imagem de entrada especificado pelo usuário.