Macedonian OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Outras versões deste documento:

IronOCR é um componente de software C# que permite aos programadores .NET lerem texto de imagens e documentos PDF em 126 idiomas, incluindo o macedônio. Trata-se de uma versão avançada do Tesseract, criada exclusivamente para desenvolvedores .NET e que supera regularmente outros mecanismos do Tesseract em termos de velocidade e precisão.

Conteúdo do IronOcr.Languages.Macedonian

Este pacote contém 55 linguagens OCR for .NET:

  • Macedônio
  • MacedônioBest
  • MacedônioFast

Baixar

Pacote de Idioma Macedônio [македонски јазик]

Instalação

A primeira coisa que precisamos fazer é instalar nosso pacote OCR Macedônio em seu projeto .NET.

Install-Package IronOcr.Languages.Macedonian

Exemplo de código

Este exemplo de código C# lê texto macedônio a partir de uma imagem ou documento PDF.

// Using IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();

        // Set the language for OCR to Macedonian
        Ocr.Language = OcrLanguage.Macedonian;

        // Using OcrInput to load an image
        using (var Input = new OcrInput(@"images\Macedonian.png"))
        {
            // Perform OCR on the input
            var Result = Ocr.Read(Input);

            // Get the recognized text
            var AllText = Result.Text;

            // Output the recognized text
            Console.WriteLine(AllText);
        }
    }
}
// Using IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();

        // Set the language for OCR to Macedonian
        Ocr.Language = OcrLanguage.Macedonian;

        // Using OcrInput to load an image
        using (var Input = new OcrInput(@"images\Macedonian.png"))
        {
            // Perform OCR on the input
            var Result = Ocr.Read(Input);

            // Get the recognized text
            var AllText = Result.Text;

            // Output the recognized text
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel

Explicação:

  • IronTesseract: Esta é uma classe da biblioteca IronOCR que fornece funcionalidade para realizar operações OCR.
  • OcrInput: Esta classe é usada para especificar a imagem ou arquivo PDF de onde o texto precisa ser extraído.
  • Ocr.Read(): Este método realiza o processo OCR na entrada fornecida e retorna o resultado que inclui o texto reconhecido.

Para executar este código, certifique-se de que você tem a biblioteca IronOCR instalada e o pacote de idioma macedônio carregado em seu projeto.