Welsh OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Outras versões deste documento:

O IronOCR é um componente de software C# que permite aos programadores .NET ler texto de imagens e documentos PDF em 126 idiomas, incluindo o galês. Trata-se de uma versão avançada do Tesseract, criada exclusivamente para desenvolvedores .NET e que supera regularmente outros mecanismos do Tesseract em termos de velocidade e precisão.

Conteúdo de IronOcr.Idiomas.Galês

Este pacote contém três versões da linguagem OCR galesa for .NET:

  • Galês
  • Melhor galês
  • Jejum galês

Baixar

Pacote de Língua Galesa [Cymraeg]

Instalação

O primeiro passo é instalar o pacote OCR galês no seu projeto .NET .

Install-Package IronOcr.Languages.Welsh

Exemplo de código

Este exemplo de código C# demonstra como ler texto galês a partir de uma imagem ou documento PDF.

// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();

        // Set the language to Welsh
        Ocr.Language = OcrLanguage.Welsh;

        // Read text from the given image
        using (var Input = new OcrInput(@"images\Welsh.png"))
        {
            // Perform OCR and get the result
            var Result = Ocr.Read(Input);

            // Extract all recognized text
            var AllText = Result.Text;

            // Output text to the console
            Console.WriteLine(AllText);
        }
    }
}
// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();

        // Set the language to Welsh
        Ocr.Language = OcrLanguage.Welsh;

        // Read text from the given image
        using (var Input = new OcrInput(@"images\Welsh.png"))
        {
            // Perform OCR and get the result
            var Result = Ocr.Read(Input);

            // Extract all recognized text
            var AllText = Result.Text;

            // Output text to the console
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel

Neste código:

  • Começamos usando o namespace IronOcr para acessar funcionalidades de OCR.
  • Criamos uma instância de IronTesseract, que é a classe principal fornecida pelo IronOCR para realizar operações de OCR.
  • O idioma do OCR é configurado para galês usando Ocr.Language = OcrLanguage.Welsh.
  • Abrimos um arquivo de imagem chamado Welsh.png localizado no diretório images para processamento de OCR.
  • Finalmente, o método Ocr.Read(Input) lê o texto da imagem, e o texto extraído é armazenado em AllText.
  • O texto galês reconhecido é então impresso no console.