Ir para o conteúdo do rodapé
UTILIZANDO O IRONOCR

Como criar uma demonstração de software OCR em C#

O reconhecimento óptico de caracteres (OCR) é uma tecnologia que transforma vários formatos de documentos, incluindo documentos em papel digitalizados, PDFs, arquivos digitais ou imagens de texto impresso tiradas com uma câmera digital, em dados de texto editável e pesquisável por máquina.

IronOCR é uma excelente biblioteca de mecanismo OCR que oferece poderosas funcionalidades de OCR para desenvolvedores. Neste artigo, vamos explorar como realizar OCR usando IronOCR com exemplos de código com Demo de Software OCR.

O que é IronOCR?

IronOCR é uma poderosa biblioteca .NET projetada para facilitar o reconhecimento óptico de caracteres (OCR) dentro de aplicações C# e VB.NET. Aproveitando algoritmos avançados e técnicas de aprendizado de máquina, o IronOCR pode extrair texto e conteúdo com precisão de arquivos PDF digitalizados, imagens e PDFs, facilitando o processamento, pesquisa e análise desses arquivos programaticamente.

Com sua API direta e recursos extensos, os desenvolvedores podem integrar perfeitamente as capacidades de OCR em suas aplicações para automatizar tarefas de extração de dados, processamento de documentos, entrada de dados e gerenciamento de conteúdo. Seja trabalhando em negócios, com faturas, relatórios, extração de dados automatizada, um PDF pesquisável ou qualquer outro documento rico em texto, o IronOCR oferece uma solução confiável para lidar com requisitos de OCR de forma eficiente.

Começando com IronOCR

Antes de mergulhar nos exemplos de código, você precisa instalar IronOCR via Gerenciador de Pacotes NuGet. Você pode instalar o IronOCR executando o seguinte comando no Console do Gerenciador de Pacotes:

Install-Package IronOcr

Realizando OCR com IronOCR

Reconhecimento de Texto Básico

Para realizar o reconhecimento básico de texto usando o IronOCR, você pode usar o seguinte trecho de código:

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using (var ocrInput = new OcrInput("ocr.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);
            string recognizedText = ocrResult.Text;
            Console.WriteLine(recognizedText);
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using (var ocrInput = new OcrInput("ocr.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);
            string recognizedText = ocrResult.Text;
            Console.WriteLine(recognizedText);
        }
    }
}
$vbLabelText   $csharpLabel

Este código usa o IronOCR para realizar reconhecimento óptico de caracteres (OCR) em um arquivo de imagem chamado "ocr.png". Ele inicializa um objeto IronTesseract e lê a camada de texto do arquivo de imagem em um objeto OcrInput.

O resultado do OCR é então obtido como recognizedText e impresso no console.

Saída
- LOGO SHOP
- LOREM IPSUM
- DOLOR SITAMET CONSECTETUR
- ADIPISCING ELIT
- 1 LOREM IPSUM $3.20
- 2 ORNARE MALESUADA $9.50
- 3 PORTA FERMENTUM $5.90
- 4 SODALES ARCU $6.00
- 5 ELEIFEND $9.00
- 6 SEMNISIMASSA $0.50
- 7 DUIS FAMES DIS $7.60
- 8 FACILISIRISUS $810
- TOTAL AMOUNT $49.80
- CASH $50.00

Opções Avançadas de OCR

O IronOCR fornece várias opções que permitem personalizar o processo de OCR de acordo com seus arquivos de imagem e requisitos. Por exemplo, você pode especificar o idioma do OCR, ajustar as configurações de pré-processamento de imagem ou habilitar a limpeza de texto. Aqui está um exemplo que demonstra algumas dessas opções avançadas:

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\image.png");

        // Set OCR language to English
        ocr.Language = OcrLanguage.English;

        // Enable text cleaning and enhance the resolution
        ocrInput.DeNoise();
        ocrInput.EnhanceResolution(225);

        var result = ocr.Read(ocrInput);
        if (!string.IsNullOrEmpty(result.Text))
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\image.png");

        // Set OCR language to English
        ocr.Language = OcrLanguage.English;

        // Enable text cleaning and enhance the resolution
        ocrInput.DeNoise();
        ocrInput.EnhanceResolution(225);

        var result = ocr.Read(ocrInput);
        if (!string.IsNullOrEmpty(result.Text))
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
$vbLabelText   $csharpLabel

O código usa o IronOCR para realizar OCR em um arquivo de imagem "image.png" localizado na pasta "images". Ele define o idioma do OCR para inglês, limpa o ruído da imagem e melhora sua resolução. O texto reconhecido da imagem é extraído e depois impresso no console.

Como Criar um Demo de Software OCR em C#: Figura 1

Leitura de Código de Barras

O IronOCR também suporta a leitura de códigos de barras, permitindo que você faça software para extrair informações de código de barras de imagens. Aqui está um exemplo de código que demonstra como ler um código de barras usando o IronOCR:

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        ocrTesseract.Configuration.ReadBarCodes = true;

        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\imageWithBarcode.png");

        var ocrResult = ocrTesseract.Read(ocrInput);
        foreach (var barcode in ocrResult.Barcodes)
        {
            Console.WriteLine(barcode.Value);
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        ocrTesseract.Configuration.ReadBarCodes = true;

        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\imageWithBarcode.png");

        var ocrResult = ocrTesseract.Read(ocrInput);
        foreach (var barcode in ocrResult.Barcodes)
        {
            Console.WriteLine(barcode.Value);
        }
    }
}
$vbLabelText   $csharpLabel

O código usa o IronOCR para detectar e ler códigos de barras de um arquivo de imagem "imageWithBarcode.png" na pasta "images". Ele configura o IronOCR para habilitar a leitura de códigos de barras definindo ReadBarCodes como verdadeiro. Os valores do código de barras detectados são então impressos no console.

Como Criar um Demo de Software OCR em C#: Figura 2

Extração de Texto de PDF

O IronOCR também pode extrair texto de PDFs e documentos digitalizados. Aqui está um exemplo de código que demonstra como extrair texto de um arquivo PDF usando o IronOCR:

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using var ocrInput = new OcrInput();

        // OCR entire document
        ocrInput.LoadPdf("Email_Report.pdf");

        // Alternatively OCR selected page numbers
        int[] pages = { 1, 2, 3, 4, 5 };
        ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");

        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using var ocrInput = new OcrInput();

        // OCR entire document
        ocrInput.LoadPdf("Email_Report.pdf");

        // Alternatively OCR selected page numbers
        int[] pages = { 1, 2, 3, 4, 5 };
        ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");

        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
}
$vbLabelText   $csharpLabel

O código usa o IronOCR para realizar processamento de OCR em um documento PDF chamado "Email_Report.pdf". Pode fazer OCR do documento inteiro usando LoadPdf, ou páginas específicas de "example.pdf" usando LoadPdfPages com uma senha. O texto reconhecido da operação de OCR é impresso no console.

Como Criar um Demo de Software OCR em C#: Figura 3

Conclusão

IronOCR é uma poderosa biblioteca .NET que oferece capacidades avançadas de software OCR, facilitando para os desenvolvedores a execução de tarefas de OCR em suas aplicações. Neste artigo, exploramos como realizar Demo de Software OCR básico e avançado usando o IronOCR com exemplos de código.

Se você está trabalhando em um projeto .NET e precisa integrar funcionalidades de OCR, o IronOCR vale a pena considerar ao examinar diferentes motores de OCR. Sua facilidade de uso, velocidade, flexibilidade e documentação extensa o tornam uma escolha popular entre desenvolvedores para tarefas de automação de OCR.

Por que não experimentar o IronOCR e ver como ele pode simplificar seu próprio processo de desenvolvimento de projetos de OCR? Pode ser o melhor motor de OCR para seus projetos.

O IronOCR oferece uma licença de teste gratuita e depois começa a partir de $799 USD, o que permite que você continue a obter o máximo do IronOCR em seus projetos.

Para saber mais sobre o IronOCR, visite aqui.

Perguntas frequentes

Como posso realizar OCR em C#?

Você pode realizar OCR em C# usando a biblioteca IronOCR. Primeiro, instale-a através do Gerenciador de Pacotes NuGet com o comando Install-Package IronOcr . Em seguida, use o objeto `IronTesseract` para ler o texto de imagens ou PDFs e convertê-lo em texto editável.

Quais são os passos envolvidos na extração de texto de uma imagem usando C#?

Para extrair texto de uma imagem em C#, use o IronOCR criando uma instância do objeto IronTesseract. Carregue sua imagem, como 'ocr.png', e chame o método Read() para processar a imagem e extrair o texto.

Posso personalizar o processo de OCR com o IronOCR?

Sim, o IronOCR permite personalizar o processo de OCR definindo opções como o idioma do OCR, ativando o pré-processamento de imagem para redução de ruído e ajustando a resolução para melhorar a precisão.

É possível realizar a leitura de códigos de barras com o IronOCR?

Sim, o IronOCR suporta leitura de código de barras. Você pode configurá-lo para detectar e extrair informações de código de barras de imagens ativando o recurso de leitura de código de barras nas configurações do seu OCR.

Como extrair texto de um PDF usando C#?

Usando o IronOCR, você pode extrair texto de arquivos PDF em C#. Você pode optar por realizar o OCR no documento inteiro ou em páginas específicas, carregando o PDF no IronTesseract e usando seu método Read() para extrair o texto.

O que torna o IronOCR uma escolha recomendada para desenvolvedores?

O IronOCR é recomendado para desenvolvedores devido aos seus recursos abrangentes de OCR, facilidade de uso, processamento rápido e flexibilidade. Ele se integra perfeitamente a projetos .NET, permitindo a automação eficiente de tarefas de OCR.

Existem opções de licenciamento disponíveis para o IronOCR?

A IronOCR oferece diversas opções de licenciamento, começando com um período de avaliação gratuito. Os desenvolvedores podem escolher entre diferentes licenças para continuar usando todos os recursos da IronOCR em seus aplicativos.

Onde posso encontrar exemplos de código para usar o IronOCR?

Você pode encontrar exemplos de código para usar o IronOCR no artigo "Demonstração de software OCR em C# (Tutorial para desenvolvedores)". Os exemplos demonstram reconhecimento básico de texto, opções avançadas de OCR e leitura de código de barras.

Kannaopat Udonpant
Engenheiro de Software
Antes de se tornar Engenheiro de Software, Kannapat concluiu um doutorado em Recursos Ambientais pela Universidade de Hokkaido, no Japão. Durante o doutorado, Kannapat também integrou o Laboratório de Robótica Veicular, que faz parte do Departamento de Engenharia de Bioprodução. Em 2022, ele utilizou suas habilidades ...
Leia mais

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me