Ir para o conteúdo do rodapé
FERRAMENTAS DE OCR

OCR no Windows 10 (Ferramentas online gratuitas)

Reconhecimento Óptico de Caracteres (OCR) é o processo de converter uma imagem de texto em um formato legível por máquina. Quando uma imagem ou documento é escaneada em um computador, é salva como um arquivo de imagem. Isso torna impossível para editores de texto editar, pesquisar ou contar as palavras no arquivo de imagem. OCR permite que os sistemas extraiam texto de uma imagem, com o conteúdo sendo então armazenado como dados de texto editáveis.

A maioria dos fluxos de trabalho de negócios envolve a comunicação de informações usando mídia impressa. Digitalizar documentos e imagens pode criar desafios. A tecnologia OCR resolve esse problema convertendo imagens de texto em dados de texto que podem ser analisados por outros softwares de negócios. Esses dados podem ser usados para realizar análises, agilizar operações, automatizar processos e melhorar a produtividade.

Este artigo apresentará alguns programas gratuitos de OCR que podem ajudar os usuários a gerenciar arquivos de forma eficiente.

Microsoft OneNote: O Melhor Software Gratuito de OCR

O OneNote é um aplicativo digital de anotações que fornece um único lugar para manter todas as suas notas, pesquisas, planos e informações. O OneNote suporta Reconhecimento Óptico de Caracteres (OCR), uma ferramenta que permite extrair texto de uma imagem ou impressão de arquivo (documento PDF ou arquivo Word) e colá-lo em suas notas, para que você possa fazer alterações nas palavras. É uma ótima maneira de fazer coisas como copiar informações de um cartão de visita que você escaneou no OneNote. Depois de extrair o texto, você pode colá-lo em outro lugar no OneNote ou em outro programa, como Outlook ou Word. Você pode baixar a versão mais recente na loja da Microsoft, e muitas vezes já está instalada em sistemas Windows. É uma das melhores opções de software gratuito de OCR para reconhecimento de texto.

OCR in Windows 10, Figure 1: OneNote OCR

Extraindo texto de uma única imagem

  1. Clique com o botão direito na imagem e clique em Copiar Texto da Imagem.
  2. Clique onde você gostaria de colar o texto copiado e então pressione Ctrl+V.

Extraindo texto das imagens de uma impressão de arquivo de várias páginas

  1. Clique com o botão direito em qualquer um dos arquivos de imagem e faça uma das seguintes opções:
    • Clique em Copiar Texto desta Página da Impressão para copiar texto apenas da imagem (página) selecionada atualmente.
    • Clique em Copiar Texto de Todas as Páginas da Impressão para copiar texto de todas as imagens (páginas).
  2. Clique onde você gostaria de colar o texto copiado e então pressione Ctrl+V.

Ferramentas de OCR Online

Acabamos de ver como podemos extrair texto de arquivos de imagem usando a tecnologia OCR usando o Microsoft OneNote em uma máquina local. Em seguida, vamos dar uma olhada nos softwares de OCR atualmente disponíveis online.

OnlineOCR

OnlineOCR is a professional online OCR service with a clean and simple design. A aparência deste site pode parecer um pouco desatualizada, já que foi criado em 2009, mas isso também ajuda a manter as operações de OCR bem simples para os usuários.

O OnlineOCR permite que você reconheça documentos PDF escaneados, fotografias e imagens capturadas por câmeras digitais, e os converta em arquivos editáveis, como Word, TXT e Excel. Existem 46 idiomas diferentes que podem ser reconhecidos, incluindo inglês, espanhol, japonês, chinês e coreano.

OCR in Windows 10, Figure 2: OnlineOCR

Realizar um trabalho de OCR com o OnlineOCR leva apenas três passos fáceis.

Etapa 1. Pressione o botão "Selecionar arquivo" para enviar um arquivo PDF ou um documento escaneado nos formatos JPG, BMP, GIF ou TIFF. Você também pode enviar vários arquivos de uma só vez. Nota: o tamanho máximo de arquivo que você pode enviar é de 15 MB.

Etapa 2. Selecione o idioma do arquivo que você enviou e escolha um formato de saída entre Word, Excel e TXT.

Passo 3. Clique em "Converter" para começar a reconhecer e converter seus arquivos.

NewOCR

Another free online OCR tool is NewOCR, which can analyze the text in an image file or PDF document that you upload, and then convert it to a text document that can be edited easily on your computer. Todo usuário pode desfrutar de uploads ilimitados sem quaisquer requisitos de registro. Todos os arquivos que você enviar serão excluídos do servidor, portanto, não há necessidade de se preocupar com a segurança dos arquivos.

OCR in Windows 10, Figure 3: NewOCR

Primeiro, clique em "Escolher Arquivo" para adicionar uma imagem ou documentos digitalizados do seu dispositivo, depois clique em "Pré-visualizar".

Em seguida, escolha um ou vários idiomas de reconhecimento na caixa de idiomas, depois gire a imagem se necessário. Se o seu arquivo enviado contiver texto em múltiplas colunas, marque a aba "Análise de layout de página" para dividir o texto em colunas. Por fim, clique no botão "OCR".

OCR in Windows 10, Figure 4: NewOCR

O texto reconhecido será exibido na caixa de texto abaixo. Você pode baixar o texto em formato TXT, Word ou PDF.

OCR in Windows 10, Figure 5: NewOCR

Conversão

Conversão is a free online OCR service with a modern and attractive design. Usuários gratuitos e não registrados podem processar um máximo de 10 páginas. Estes podem ser arquivos PDF ou Word. Você também pode usar um arquivo PDF digitalizado. Se precisar reconhecer mais páginas, basta se inscrever para obter um serviço melhorado.

Para realizar OCR online com o Conversão, basta seguir estes três passos.

Passo 1. Clique em "Escolher Arquivos" para escolher e enviar arquivos do seu dispositivo local, Google Drive, Dropbox ou páginas da web. Você também pode adicionar arquivos arrastando-os para a página.

OCR in Windows 10, Figure 6: Conversão

Conversão

Passo 2. Escolha um ou dois idiomas usados em seu arquivo enviado. Depois, defina o formato de saída para documento Word, planilha Excel, documento PDF, arquivo de texto ou o que você precisar. Você pode escolher reconhecer todas as páginas ou apenas certas páginas digitando um intervalo de páginas na caixa "Número da Página".

OCR in Windows 10, Figure 7: Configurações de OCR do Conversão

Configurações de OCR do Conversão

Passo 3. Quando o reconhecimento e a conversão forem concluídos, um link de download para o texto extraído em um documento convertido aparecerá no topo. Basta salvá-lo na localização desejada.

OCR in Windows 10, Figure 8: Conversão Downloading Files

Baixando Arquivos do Conversão

O Conversão oferece mais opções como um serviço de OCR online e é, portanto, o melhor software de OCR online gratuito.

IronOCR

IronOCR é uma tecnologia de biblioteca OCR popular para desenvolvedores .NET que precisam extrair texto de documentos digitalizados ou arquivos PDF. Ele oferece alta precisão, processamento rápido e desempenho sólido em tempo real para imitação, digitalização e reconhecimento. A biblioteca é um componente de software que simplifica a digitalização de documentos automatizando a digitalização de documentos. Ele também suporta outros processos, incluindo indexação de documentos e processamento de imagens.

IronOCR é único em sua capacidade de detectar e extrair automaticamente dados de imagens e documentos escaneados de forma imperfeita. A classe IronTesseract fornece a compilação mais avançada de Tesseract conhecida em qualquer lugar e em qualquer plataforma, com maior velocidade e precisão.

Vamos dar uma olhada em um exemplo de código para extrair texto de um arquivo de imagem digitalizado.

// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

Imagem de Entrada para Extrair Texto

OCR in Windows 10, Figure 9: IronOCR, Dados de Funcionários Redigidos

Dados de Funcionários Redigidos

Saída de Texto Extraído

A saída é limpa e corresponde à imagem original com apenas algumas linhas de código, traduzindo em uma saída perfeita e sem problemas técnicos.

OCR in Windows 10, Figure 10: IronOCR, Saída de imagem

Saída de imagem

Licenciamento

IronOCR é totalmente gratuito para fins de desenvolvimento. Também possui uma estrutura de preços distinta para licenças comerciais. O pacote Lite começa em $799 sem taxas ocultas. Os usuários podem experimentar o IronOCR em produção antes de comprá-lo com o teste gratuito. Escolha um pacote que corresponda ao tamanho do seu negócio optando por licenciamento para um desenvolvedor, dez desenvolvedores ou desenvolvedores ilimitados.

A Iron Software está oferecendo toda a sua suíte de produtos com um grande desconto. Saiba mais detalhes nesta página

Kannaopat Udonpant
Engenheiro de Software
Antes de se tornar Engenheiro de Software, Kannapat concluiu um doutorado em Recursos Ambientais pela Universidade de Hokkaido, no Japão. Durante o doutorado, Kannapat também integrou o Laboratório de Robótica Veicular, que faz parte do Departamento de Engenharia de Bioprodução. Em 2022, ele utilizou suas habilidades ...
Leia mais

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me