Polish OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Outras versões deste documento:

O IronOCR é um componente de software C# que permite aos desenvolvedores .NET ler texto de imagens e documentos PDF em 126 idiomas, incluindo o polonês. Trata-se de uma versão avançada do Tesseract, criada exclusivamente para desenvolvedores .NET , e que supera regularmente outros mecanismos do Tesseract tanto em velocidade quanto em precisão.

Conteúdo de IronOcr.Idiomas.Polonês

Este pacote contém 43 linguagens OCR for .NET:

  • Polonês
  • PolishBest
  • PolishFast

Baixar

Pacote de idioma polonês [język polski] :

Instalação

O primeiro passo é instalar o pacote OCR polonês em seu projeto .NET.

Para instalar usando o Gerenciador de Pacotes NuGet, execute o seguinte comando:

Install-Package IronOcr.Languages.Polish

Exemplo de código

Este exemplo de código C# demonstra como ler texto em polonês a partir de uma imagem ou de um documento PDF usando o IronOCR.

// Install the IronOcr.Languages.Polish package via NuGet before using this code.
using IronOcr;

public class PolishOcrExample
{
    public void ReadPolishTextFromImage()
    {
        // Initialize the IronTesseract object
        var Ocr = new IronTesseract();

        // Set the language to Polish
        Ocr.Language = OcrLanguage.Polish;

        // Provide the path to the image or PDF file containing Polish text
        using (var Input = new OcrInput(@"images\Polish.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Extract all recognized text
            var AllText = Result.Text;

            // Display or process the recognized text
            Console.WriteLine(AllText);
        }
    }
}
// Install the IronOcr.Languages.Polish package via NuGet before using this code.
using IronOcr;

public class PolishOcrExample
{
    public void ReadPolishTextFromImage()
    {
        // Initialize the IronTesseract object
        var Ocr = new IronTesseract();

        // Set the language to Polish
        Ocr.Language = OcrLanguage.Polish;

        // Provide the path to the image or PDF file containing Polish text
        using (var Input = new OcrInput(@"images\Polish.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Extract all recognized text
            var AllText = Result.Text;

            // Display or process the recognized text
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel

Este script inicializa o mecanismo de OCR, especifica o idioma (polonês) e processa a imagem localizada em "images\Polish.png" para extrair e exibir o texto. Certifique-se de que o caminho do arquivo esteja correto e que o pacote OCR esteja instalado antes de executar o código.