Maori OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

Mais 126 idiomas

IronOCR é um componente de software C# que permite aos desenvolvedores .NET ler texto de imagens e documentos PDF em 126 idiomas, incluindo Maori.

Trata-se de uma versão avançada do Tesseract, criada exclusivamente para desenvolvedores .NET , e que supera regularmente outros mecanismos do Tesseract tanto em velocidade quanto em precisão.

Conteúdos de IronOcr.Languages.Maori

Este pacote contém 40 idiomas de OCR for .NET:

  • Maori
  • MaoriBest
  • MaoriFast

Baixar

Pacote de Idioma Maori [te reo Māori]

Instalação

A primeira coisa que precisamos fazer é instalar nosso pacote OCR Maori no seu projeto .NET.

Install-Package IronOcr.Languages.Maori

Exemplo de código

Este exemplo de código C# lê texto em maori de uma imagem ou documento PDF.

// Install the IronOCR Maori language package using NuGet
// PM> Install-Package IronOcr.Languages.Maori

using IronOcr;

var Ocr = new IronTesseract();

// Specify the language to be Maori
Ocr.Language = OcrLanguage.Maori;

using (var Input = new OcrInput(@"images\Maori.png"))
{
    // Perform OCR to extract text
    var Result = Ocr.Read(Input);

    // Retrieve the recognized text
    var AllText =  Result.Text;

    // Optionally, print the extracted text
    // Console.WriteLine(AllText);
}
// Install the IronOCR Maori language package using NuGet
// PM> Install-Package IronOcr.Languages.Maori

using IronOcr;

var Ocr = new IronTesseract();

// Specify the language to be Maori
Ocr.Language = OcrLanguage.Maori;

using (var Input = new OcrInput(@"images\Maori.png"))
{
    // Perform OCR to extract text
    var Result = Ocr.Read(Input);

    // Retrieve the recognized text
    var AllText =  Result.Text;

    // Optionally, print the extracted text
    // Console.WriteLine(AllText);
}
$vbLabelText   $csharpLabel

Explicação

  • IronTesseract é uma instância que permite realizar OCR.
  • Ocr.Language é configurado para Maori para especificar o idioma do texto que estamos lendo.
  • OcrInput é usado para capturar a entrada de uma imagem com um caminho de arquivo especificado.
  • Ocr.Read() realiza o OCR e recupera o resultado.
  • Result.Text contém o texto extraído da imagem, que pode ser armazenado ou processado conforme necessário.

Este conjunto de código garante que o pacote de idioma OCR correto seja utilizado para alcançar um reconhecimento de texto preciso.