Oriya OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Outras versões deste documento:

O IronOCR é um componente de software C# que permite aos programadores .NET ler texto de imagens e documentos PDF em 126 idiomas, incluindo o Oriya. Trata-se de uma versão avançada do Tesseract, criada exclusivamente para desenvolvedores .NET e que supera regularmente outros mecanismos do Tesseract em termos de velocidade e precisão.

Conteúdo de IronOcr.Languages.Oriya

Este pacote contém diversas linguagens de OCR for .NET:

  • Oriya
  • OriyaBest
  • OriyaFast
  • Alfabeto Oriya
  • Alfabeto OriyaBest
  • Alfabeto OriyaFast

Baixar

Pacote de idioma Oriya [ଓଡଆ]

Instalação

A primeira coisa que precisamos fazer é instalar nosso pacote de OCR Oriya em seu projeto .NET.

Install-Package IronOcr.Languages.Oriya

Exemplo de código

Este exemplo de código C# lê texto em Oriya de uma imagem ou documento PDF.

// This example demonstrates how to use the IronOCR library to perform OCR on an Oriya language image.
using IronOcr;

class Program
{
    static void Main()
    {
        // Instantiate the IronTesseract engine
        var Ocr = new IronTesseract();

        // Set the OCR language to Oriya
        Ocr.Language = OcrLanguage.Oriya;

        // Define the input file path for the OCR
        using (var Input = new OcrInput(@"images\Oriya.png"))
        {
            // Perform OCR and obtain the result
            var Result = Ocr.Read(Input);

            // Extract all recognized text from the result
            var AllText = Result.Text;

            // Output the recognized text
            Console.WriteLine(AllText);
        }
    }
}
// This example demonstrates how to use the IronOCR library to perform OCR on an Oriya language image.
using IronOcr;

class Program
{
    static void Main()
    {
        // Instantiate the IronTesseract engine
        var Ocr = new IronTesseract();

        // Set the OCR language to Oriya
        Ocr.Language = OcrLanguage.Oriya;

        // Define the input file path for the OCR
        using (var Input = new OcrInput(@"images\Oriya.png"))
        {
            // Perform OCR and obtain the result
            var Result = Ocr.Read(Input);

            // Extract all recognized text from the result
            var AllText = Result.Text;

            // Output the recognized text
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel
  • O objeto IronTesseract é usado para configurar e realizar OCR.
  • O idioma para OCR é definido como Oriya usando OcrLanguage.Oriya.
  • O OcrInput permite especificar a imagem ou documento que precisa de extração de texto.
  • O método Read() realiza o OCR e produz um resultado do qual o texto reconhecido pode ser extraído e utilizado.