Panjabi OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Outras versões deste documento:

O IronOCR é um componente de software C# que permite aos programadores .NET ler texto de imagens e documentos PDF em 126 idiomas, incluindo o panjabi. Trata-se de uma versão avançada do Tesseract, criada exclusivamente para desenvolvedores .NET e que supera regularmente outros mecanismos do Tesseract em termos de velocidade e precisão.

Conteúdo de IronOcr.Languages.Panjabi

Este pacote contém 46 linguagens de OCR for .NET:

  • Panjabi
  • PanjabiBest
  • PanjabiFast

Baixar

Pacote de idiomas Panjabi [ਪਜਾਬੀ]

Instalação

A primeira coisa que precisamos fazer é instalar o pacote OCR Panjabi em seu projeto .NET.

Install-Package IronOcr.Languages.Panjabi

Exemplo de código

Este exemplo de código C# lê texto em panjabi de uma imagem ou documento PDF.

// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create a new instance of the IronTesseract class
        var Ocr = new IronTesseract();

        // Set the language to Panjabi
        Ocr.Language = OcrLanguage.Panjabi;

        // Define the input image or PDF file
        using (var Input = new OcrInput(@"images\Panjabi.png"))
        {
            // Perform OCR on the input file
            var Result = Ocr.Read(Input);

            // Extract and store the recognized text from the OCR result
            var AllText = Result.Text;
        }
    }
}
// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create a new instance of the IronTesseract class
        var Ocr = new IronTesseract();

        // Set the language to Panjabi
        Ocr.Language = OcrLanguage.Panjabi;

        // Define the input image or PDF file
        using (var Input = new OcrInput(@"images\Panjabi.png"))
        {
            // Perform OCR on the input file
            var Result = Ocr.Read(Input);

            // Extract and store the recognized text from the OCR result
            var AllText = Result.Text;
        }
    }
}
$vbLabelText   $csharpLabel

Explicação

  • IronTesseract : Esta é a classe principal fornecida pelo IronOCR para operações de OCR.
  • Ocr.Language : Especificamos qual idioma o mecanismo de OCR deve usar. Aqui, está configurado para Panjabi.
  • OcrInput : Esta classe é usada para especificar o arquivo de entrada (imagem ou PDF) no qual o OCR precisa ser executado.
  • Ocr.Read() : Este método executa a tarefa de OCR propriamente dita e retorna um resultado contendo o texto extraído.
  • Result.Text : Este arquivo contém o texto extraído após a aplicação do OCR no arquivo de entrada.

Este exemplo demonstra como usar efetivamente a biblioteca IronOCR para extrair texto em panjabi de imagens ou documentos PDF em uma aplicação .NET.