Ir para o conteúdo do rodapé
UTILIZANDO O IRONOCR

Como usar OCR para obter texto de uma captura de tela em C#

Muitas pessoas podem estar se perguntando "O que é uma Captura de Tela OCR?" Outras podem se perguntar como converter uma captura de tela de qualquer texto em um formato de texto digital editável ou para .txt ou .doc. Se você é uma dessas pessoas, não se preocupe mais, pois temos as soluções perfeitas para você.

Neste artigo, discutiremos diferentes ferramentas que permitirão que você realize OCR, Reconhecimento Ótico de Caracteres, em capturas de tela.

Existem muitas ferramentas de OCR disponíveis, mas hoje usaremos o IronOCR para extrair texto de capturas de tela.

1. IronOCR

IronOCR é uma biblioteca de software para as linguagens de programação C# e VB.NET, projetada para permitir que os desenvolvedores adicionem capacidades de OCR (Reconhecimento Ótico de Caracteres) a suas aplicações. A biblioteca pode ser usada para reconhecer texto em imagens e convertê-lo em texto legível por máquina. A biblioteca é construída sobre o motor Tesseract OCR, que é considerado um dos motores de OCR mais precisos disponíveis.

IronOCR pode ser usado para ler textos de imagens em muitos formatos de arquivo diferentes, incluindo PNG, JPG, TIFF e PDF. Ele também fornece uma gama de recursos avançados para trabalhar com reconhecimento de texto, como a capacidade de reconhecer vários idiomas, bem como a capacidade de reconhecer texto de imagens que foram giradas ou inclinadas. Além disso, os desenvolvedores podem usar IronOCR para integrar rapidamente a funcionalidade OCR em suas aplicações, pois ele oferece uma API simples e fácil de usar que pode ser chamada a partir de código em C# ou VB.NET. Usando IronOCR, você pode escolher seu idioma OCR e realizar OCR em imagens, arquivos PDF digitais e arquivos PDF digitalizados.

IronOCR é considerado uma boa opção para desenvolvedores que desejam adicionar funcionalidade OCR às suas aplicações. É de código aberto, fácil de usar e integrar, rápido, preciso e atualizado com as mais recentes tecnologias de OCR.

2. Recursos do IronOCR

IronOCR oferece uma ampla gama de recursos para ajudar os desenvolvedores a integrar a funcionalidade OCR em suas aplicações. Alguns dos principais recursos do IronOCR incluem:

  1. Suporte a múltiplos idiomas: IronOCR pode reconhecer texto em mais de 60 idiomas, incluindo inglês, espanhol, alemão, francês, italiano e chinês.
  2. Detecção automática da orientação do texto: IronOCR pode detectar automaticamente a orientação do texto em uma imagem, mesmo que a imagem tenha sido girada ou inclinada.
  3. Suporte a uma ampla gama de formatos de imagem: IronOCR pode ler texto de imagens em muitos formatos de arquivo diferentes, incluindo PNG, JPG, TIFF e PDF.
  4. Configurações de reconhecimento personalizáveis: Os desenvolvedores podem personalizar as configurações de reconhecimento para melhorar a precisão do reconhecimento para tipos específicos de imagens ou casos de uso.
  5. Capacidade de reconhecer texto de documentos digitalizados e PDFs com várias páginas.
  6. Reconhecimento rápido e alta precisão: IronOCR usa o motor OCR Tesseract, que é um dos motores OCR mais precisos e amplamente utilizados disponíveis.
  7. API fácil de usar: IronOCR fornece uma API simples e fácil de usar que pode ser chamada a partir de código C# ou VB.NET, o que facilita a integração da funcionalidade OCR em qualquer aplicação.

No geral, IronOCR é uma ferramenta poderosa que oferece uma ampla gama de recursos para ajudar os desenvolvedores a adicionar a funcionalidade OCR às suas aplicações.

3. Criando um Novo Projeto no Visual Studio

Abra o Visual Studio e vá para o menu Arquivo. Selecione "Novo Projeto" e, em seguida, selecione Aplicativo de Console.

Insira o nome do projeto e selecione o caminho na caixa de texto apropriada. Em seguida, clique no botão Criar. Selecione a .NET Framework desejada, conforme mostrado na captura de tela abaixo:

Como realizar OCR para obter texto de uma captura de tela em C#, Figura 1: Criando um Novo Projeto no Visual Studio Criando um novo projeto no Visual Studio

O projeto do Visual Studio agora irá gerar a estrutura para o aplicativo de console. Após terminar, ele abrirá o arquivo program.cs, no qual você pode escrever e executar o código fonte.

Como realizar OCR para obter texto de uma captura de tela em C#, Figura 2: O arquivo program.cs, gerado pelo Assistente de Novo Projeto do Visual Studio O arquivo program.cs, gerado pelo Assistente de Novo Projeto do Visual Studio

Agora podemos adicionar a biblioteca IronOCR e testar o programa.

4. Instalar IronOCR

No Visual Studio, você pode integrar facilmente o IronOCR no seu projeto C#.

IronOCR oferece vários processos para integrar com um projeto C# .NET. Aqui, discutiremos um deles: instalar o IronOCR usando o Gerenciador de Pacotes NuGet.

No Visual Studio vá para Ferramentas > Gerenciador de Pacotes NuGet > Console do Gerenciador de Pacotes

Como realizar OCR para obter texto de uma captura de tela em C#, Figura 3: A interface do Gerenciador de Pacotes NuGet A interface do Gerenciador de Pacotes NuGet

Após clicar, um novo console aparecerá na parte inferior da janela do Visual Studio. Digite o comando abaixo no console e pressione enter.

Install-Package IronOcr

IronOCR será instalado em apenas alguns segundos.

5. Usando IronOCR para realizar OCR em uma captura de tela

IronOCR é uma poderosa biblioteca OCR que pode ser usada para reconhecer texto de capturas de tela. Com IronOCR, você pode capturar uma captura de tela de texto e, em seguida, usar as capacidades OCR da biblioteca para converter o texto na captura de tela em um formato digital e editável. Aqui está um exemplo de como você pode usar IronOCR para realizar OCR em uma captura de tela em C#. Para realizar OCR de captura de tela, basta capturar uma captura de tela e executar o código abaixo para extrair o texto para qualquer formato de saída que você desejar.

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        // Create an instance of IronTesseract, the core OCR engine
        var ocr = new IronTesseract();

        // Perform OCR on the specified image file
        var result = ocr.Read("ocr.png");

        // Output the recognized text to the console
        Console.WriteLine(result.Text);
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        // Create an instance of IronTesseract, the core OCR engine
        var ocr = new IronTesseract();

        // Perform OCR on the specified image file
        var result = ocr.Read("ocr.png");

        // Output the recognized text to the console
        Console.WriteLine(result.Text);
    }
}
$vbLabelText   $csharpLabel

Arquivo de Imagem de Entrada

Como realizar OCR para obter texto de uma captura de tela em C#, Figura 4: Exemplo de captura de tela usada como entrada Captura de Tela de Exemplo usada para entrada

Saída de Texto

- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 125+ global language packs
- Output as text, structured data, or searchable PDFs
- Supports NET 6, 5, Core, Standard, Framework

6. Usando IronOCR para realizar OCR em uma zona específica

IronOCR permite que você realize OCR em zonas específicas dentro de uma imagem. Isso pode ser útil quando a imagem contém várias regiões de texto e você só deseja reconhecer o texto dentro de uma região específica. Um exemplo de código para isso é mostrado abaixo.

using IronOcr;
using IronSoftware.Drawing;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();

        using (var ocrInput = new OcrInput())
        {
            // Define the rectangle to crop the image for OCR
            var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);

            // Add the image with the specified cropping area
            ocrInput.AddImage("ocr.png", contentArea);

            // Perform the OCR operation on the defined area
            var ocrResult = ocrTesseract.Read(ocrInput);

            // Output the recognized text
            Console.WriteLine(ocrResult.Text);
        }
    }
}
using IronOcr;
using IronSoftware.Drawing;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();

        using (var ocrInput = new OcrInput())
        {
            // Define the rectangle to crop the image for OCR
            var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);

            // Add the image with the specified cropping area
            ocrInput.AddImage("ocr.png", contentArea);

            // Perform the OCR operation on the defined area
            var ocrResult = ocrTesseract.Read(ocrInput);

            // Output the recognized text
            Console.WriteLine(ocrResult.Text);
        }
    }
}
$vbLabelText   $csharpLabel

Saída

- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 125+ global language packs

7. Usando IronOCR para realizar OCR em uma imagem

Para realizar OCR em uma imagem e salvar o texto reconhecido em um arquivo .txt, você pode usar o seguinte código.

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using (var input = new OcrInput("ocr.png"))
        {
            // Perform OCR on the image
            var result = ocr.Read(input);

            // Save the recognized text to a .txt file
            result.SaveAsTextFile("output.txt");
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using (var input = new OcrInput("ocr.png"))
        {
            // Perform OCR on the image
            var result = ocr.Read(input);

            // Save the recognized text to a .txt file
            result.SaveAsTextFile("output.txt");
        }
    }
}
$vbLabelText   $csharpLabel

O conteúdo do arquivo de saída é mostrado abaixo:

Como realizar OCR para obter texto de uma captura de tela em C#, Figura 5: Conteúdo do arquivo output.txt gerado Conteúdo do arquivo output.txt gerado

8. Saiba Mais

Leia o tutorial Extração de Texto de Imagem para mais informações sobre como realizar OCR em imagens.

IronOCR faz parte de um conjunto de cinco bibliotecas .NET projetadas para trabalhar com diferentes tipos de documentos. Você pode adquirir todas as cinco bibliotecas pelo preço de apenas duas licenças.

Perguntas frequentes

Como posso extrair texto de uma captura de tela usando OCR em C#?

Você pode usar o IronOCR em C# para extrair texto de uma captura de tela, aproveitando sua API simples para converter a captura de tela em um formato digital editável. Primeiro, instale o IronOCR via NuGet no Visual Studio e, em seguida, use os exemplos de código fornecidos pelo IronOCR para realizar o OCR na imagem da sua captura de tela.

O que é o Reconhecimento Óptico de Caracteres (OCR)?

O Reconhecimento Óptico de Caracteres (OCR) é uma tecnologia que converte diferentes tipos de documentos, como documentos digitalizados em papel, arquivos PDF ou imagens capturadas por uma câmera digital, em dados editáveis e pesquisáveis. IronOCR é uma biblioteca C# que facilita o uso de OCR em aplicações.

O IronOCR consegue lidar com vários idiomas para OCR?

Sim, o IronOCR suporta reconhecimento de texto em mais de 60 idiomas, tornando-o versátil para aplicações internacionais. Ele oferece opções para definir as preferências de idioma e garantir uma extração de texto precisa.

Quais formatos de imagem o IronOCR suporta para OCR?

O IronOCR suporta diversos formatos de imagem para OCR, incluindo PNG, JPG, TIFF e PDF. Essa flexibilidade permite que os desenvolvedores trabalhem com uma ampla variedade de fontes de imagem sem precisar converter os formatos manualmente.

Como a orientação do texto pode afetar a precisão do OCR?

A orientação do texto pode afetar significativamente a precisão do OCR. O IronOCR detecta e corrige automaticamente a orientação do texto em imagens, garantindo que textos rotacionados ou distorcidos sejam reconhecidos com precisão e convertidos para um formato digital.

Como faço para instalar o IronOCR em um projeto C#?

Para instalar o IronOCR em um projeto C#, utilize o Gerenciador de Pacotes NuGet no Visual Studio. Procure por IronOCR e instale-o em seu projeto para começar a usar seus recursos de OCR para extração de texto de imagens.

Quais são as vantagens de usar o IronOCR para reconhecimento de texto?

O IronOCR oferece diversas vantagens, incluindo suporte robusto a vários idiomas, correção automática da orientação do texto, suporte a múltiplos formatos de imagem e configurações personalizáveis para melhorar a precisão do reconhecimento. Sua API simples facilita a integração em aplicações C#.

O IronOCR é adequado para reconhecer texto em zonas específicas de uma imagem?

Sim, o IronOCR permite que os desenvolvedores definam zonas específicas dentro de uma imagem para realizar o OCR, possibilitando a extração de texto direcionada. Esse recurso é útil em cenários onde apenas uma parte da imagem contém o texto relevante.

Quais são algumas dicas comuns para solucionar problemas de OCR?

Algumas dicas comuns para solucionar problemas de OCR incluem garantir que a imagem esteja nítida e em alta resolução, verificar a orientação do texto, certificar-se de que o idioma correto esteja selecionado e atualizar para a versão mais recente do IronOCR para obter o melhor desempenho.

Como posso converter os resultados do OCR em um arquivo .txt ou .doc?

Com o IronOCR, você pode converter os resultados do OCR em um arquivo .txt ou .doc, extraindo o texto da imagem e salvando-o usando operações padrão de entrada/saída de arquivos em C#. Isso permite criar documentos editáveis a partir de texto em imagens.

Kannaopat Udonpant
Engenheiro de Software
Antes de se tornar Engenheiro de Software, Kannapat concluiu um doutorado em Recursos Ambientais pela Universidade de Hokkaido, no Japão. Durante o doutorado, Kannapat também integrou o Laboratório de Robótica Veicular, que faz parte do Departamento de Engenharia de Bioprodução. Em 2022, ele utilizou suas habilidades ...
Leia mais

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me