Cherokee OCR in C#

This article was translated from English: Does it need improvement?
Translated
View the article in English

Mais 126 idiomas

O IronOCR é um componente de software C# que permite aos programadores .NET ler texto de imagens e documentos PDF em 126 idiomas, incluindo o cherokee.

Trata-se de uma versão avançada do Tesseract, criada exclusivamente para desenvolvedores .NET e que supera regularmente outros mecanismos do Tesseract em termos de velocidade e precisão.

Conteúdo de IronOcr.Languages.Cherokee

Este pacote contém 120 idiomas OCR for .NET:

  • Alfabeto Cherokee
  • CherokeeAlphabetBest
  • Alfabeto Cherokee Rápido
  • Cherokee
  • CherokeeMelhor
  • CherokeeFast

Baixar

Pacote de Língua Cherokee [ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ]

Instalação

A primeira coisa que precisamos fazer é instalar o pacote Cherokee OCR no seu projeto .NET .

Install-Package IronOcr.Languages.Cherokee

Exemplo de código

Este exemplo de código C# lê texto em cherokee de uma imagem ou documento PDF.

// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an instance of the IronTesseract class
        var Ocr = new IronTesseract();

        // Set the language for OCR to Cherokee
        Ocr.Language = OcrLanguage.Cherokee;

        // Use OcrInput to specify the image or PDF to be read
        using (var Input = new OcrInput(@"images\Cherokee.png"))
        {
            // Perform OCR on the input document
            var Result = Ocr.Read(Input);

            // Extract all recognized text
            var AllText = Result.Text;

            // Display the recognized text
            Console.WriteLine(AllText);
        }
    }
}
// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an instance of the IronTesseract class
        var Ocr = new IronTesseract();

        // Set the language for OCR to Cherokee
        Ocr.Language = OcrLanguage.Cherokee;

        // Use OcrInput to specify the image or PDF to be read
        using (var Input = new OcrInput(@"images\Cherokee.png"))
        {
            // Perform OCR on the input document
            var Result = Ocr.Read(Input);

            // Extract all recognized text
            var AllText = Result.Text;

            // Display the recognized text
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel

Segue uma breve descrição de como o código funciona:

  • IronTesseract: Uma instância da classe IronTesseract é criada para lidar com operações de OCR.
  • OcrLanguage.Cherokee: O idioma é definido como Cherokee usando a propriedade OcrLanguage.Cherokee, que informa ao mecanismo OCR para reconhecer texto em Cherokee.
  • OcrInput: Um caminho de entrada é fornecido à classe OcrInput onde a imagem ou documento PDF reside.
  • Ocr.Read: O método Read é chamado no objeto OCR, passando a entrada. Ele executa o processo de OCR.
  • Result.Text: Extrai o texto reconhecido do resultado e armazena-o na variável AllText para uso posterior.
  • Saída do console: O texto reconhecido é impresso no console.