Ir para o conteúdo do rodapé
COMPARAR COM OUTROS COMPONENTES

Uma comparação entre IronOCR e Asprise OCR

Quando falamos de OCR, refere-se ao reconhecimento óptico de caracteres. O termo é frequentemente usado no mundo dos negócios para se referir ao processo de conversão de uma imagem ou representação gráfica de qualquer documento baseado em texto (por exemplo, uma página digitalizada ou enviada por fax) em um formato de palavra editável ou formato de documento pesquisável por meio de software de computador.

O acrônimo OCR significa Optical Character Recognition, uma tarefa executada por software de computador que foi projetado especificamente para esse propósito. Este tipo de software irá digitalizar a página e reconhecer qualquer informação textual que esteja lá, convertendo-a em uma forma digital para que possa ser editada e reproduzida digitalmente sem perda de qualidade.

Existem muitas aplicações para OCR, mas o caso de uso mais popular é a conversão de documentos digitalizados em arquivos digitais que podem ser formatados, indexados em bancos de dados e analisados.

Neste artigo, vamos comparar duas das bibliotecas e aplicações mais comuns para OCR e imagens de documentos em PDF. Estes são:

  • Asprise OCR
  • IronOCR

1.0 Introdução

1.1 Introdução e Características do Asprise OCR

O SDK de reconhecimento de caracteres ópticos (OCR) e reconhecimento de código de barras do Asprise C# .NET oferece uma biblioteca de API de alto desempenho para você equipar suas aplicações C# .NET (aplicações Windows, Silverlight, aplicações de serviço web ASP.NET, controles ActiveX, etc.) com a funcionalidade de extrair informações de texto e códigos de barras de documentos digitalizados.

Você pode converter imagens (em vários formatos como JPEG, PNG, TIFF, PDF, etc.) em formatos de documentos editáveis (Word, XML, PDF pesquisável, etc.). Juntamente com outras ofertas, como o SDK de Digitalização de Imagens Asprise (que captura documentos de scanners), você pode facilmente implementar soluções completas de gerenciamento de documentos.

As Características do Asprise OCR

Reconhecimento Preciso de Texto Com processamento de imagem aprimorado e algoritmos de detecção de texto, o Asprise OCR pode facilmente reconhecer documentos difíceis com baixa qualidade de imagem. Parâmetros podem ser usados para favorecer levemente a precisão sobre a velocidade.

Motor OCR de Alta Velocidade O Asprise OCR usa um motor OCR otimizado para realizar um reconhecimento excelente em um curto espaço de tempo. A velocidade pode ser ainda melhorada através de multithreading e aceleração opcional de GPU.

20+ Idiomas Suportados O Asprise OCR reconhece 20+ idiomas, como inglês, espanhol, francês, alemão, italiano, húngaro, finlandês, sueco, romeno, polonês, malaio, árabe, indonésio e russo.

Todos os Formatos de Código de Barras Populares Todos os formatos populares de código de barras são suportados: EAN-8, EAN-13, UPC-A, UPC-E, ISBN-10, ISBN-13, Intercalado 2 de 5, Código 39, Código 128, PDF417 e Código QR.

Imagens para PDF Pesquisáveis Com algumas linhas de código, você pode converter vários formatos de imagem, como JPEG, PNG, TIFF e PDF em arquivos PDF pesquisáveis.

Implantação Fácil Nenhum dongle de proteção de software, nenhum servidor de licenciamento é necessário. A implantação do SDK Asprise OCR é tão fácil quanto você desenvolve com ele.

Amigável ao Orçamento, Livre de Direitos Autorais Livre de direitos autorais significa que você paga quando encomenda uma licença de desenvolvimento, mas não precisa pagar novamente quando implanta seu software em milhares de servidores ou para milhares de usuários finais.

Suporte Premiado A equipe deles não é apenas amigável, mas também capaz de fornecer suporte técnico de primeira classe.

1.2 IronOCR — Introdução e Funcionalidades

O IronOCR fornece software para engenheiros que usam IronOCR for .NET para ler conteúdo de texto de fotos e PDFs em aplicativos e sites .NET. Ele digitaliza fotos para texto e códigos de barras e suporta vários idiomas mundialmente; ele pode então fornecer saída como texto simples ou dados estruturados. A biblioteca de OCR da Iron Software pode ser usada em aplicações .NET MVC, Web, console e desktop. Para implantações comerciais, o licenciamento é fornecido com assistência direta da equipe de desenvolvimento.

  • Usando o mais recente mecanismo Tesseract 5, IronOCR lê textos, códigos de barras e códigos QR de qualquer formato de imagem ou PDF. Esta biblioteca adiciona rapidamente OCR a aplicativos de desktop, console e web.
  • IronOCR suporta 125 idiomas internacionais. Ela também suporta listas de idiomas e palavras personalizadas.
  • IronOCR é capaz de ler mais de 20 formatos de código de barras e códigos QR.
  • O IronOCR suporta formatos de imagem GIFs e TIFF com várias páginas.
  • IronOCR oferece correção para imagens digitalizadas de baixa qualidade.
  • IronOCR suporta multithreading — ele executa um ou mais processos simultaneamente.
  • IronOCR pode fornecer saída de dados estruturados para páginas, parágrafos, linhas, palavras, caracteres, etc.
  • IronOCR suporta uma variedade de sistemas operacionais, como Windows, Linux, macOS, etc.

2.0 Criando um Novo Projeto no Visual Studio

Abra o software Visual Studio e vá para o "menu arquivo". Selecione "novo projeto", depois selecione "Aplicativo Console".

Abbyy Finereader Ocr Alternatives 1 related to 2.0 Criando um Novo Projeto no Visual Studio

Insira o nome do projeto e selecione o caminho do arquivo na caixa de texto apropriada. Em seguida, clique no botão criar e selecione o .NET Framework necessário, conforme a captura de tela abaixo.

Abbyy Finereader Ocr Alternatives 2 related to 2.0 Criando um Novo Projeto no Visual Studio

O projeto do Visual Studio agora irá gerar a estrutura para o aplicativo selecionado, e se você selecionou o console, aplicativos Windows, e web, ele agora abrirá o arquivo Program.cs onde você pode inserir o código e construir/executar o aplicativo.

Abbyy Finereader Ocr Alternatives 3 related to 2.0 Criando um Novo Projeto no Visual Studio

Em seguida, podemos adicionar a biblioteca para testar o código.

3.0 Instalar

3.1 Instalar Asprise OCR

We can download the Asprise OCR here.

There are two options: install using NuGet or manually download the SDK from asprise.com.

Opção 1: NuGet PM> Install-Package asprise-ocr-api

Primeiro, crie um novo projeto de Aplicativo de Formulário Windows Visual C#/Visual Basic ou use um projeto existente. With this solution opened, open the NuGet Package Manager Console and type the following command:

Install-Package asprise-ocr-api

Uma vez concluído, você pode invocar o Formulário de demonstração OCR copiando o seguinte código para Program.cs (para C#):

using System;
using System.Windows.Forms;
using asprise_ocr_api;

static class Program
{
    // Main application entry point
    [STAThread]
    static void Main()
    {
        // Enable visual styles and set text rendering mode
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);

        // Launch the OCR sample form
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
using System;
using System.Windows.Forms;
using asprise_ocr_api;

static class Program
{
    // Main application entry point
    [STAThread]
    static void Main()
    {
        // Enable visual styles and set text rendering mode
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);

        // Launch the OCR sample form
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
$vbLabelText   $csharpLabel

Opção 2: Baixar o SDK de OCR de Asprise.com

Download a copy of the Asprise SDK de OCR from www.asprise.com/product/ocr. Basta descompactá-lo para uma pasta vazia.

A organização de arquivos da distribuição do SDK Asprise OCR é a seguinte:

SDK de OCR
|--- aocr.dll, aocr_x64.dll [DLL necessária]
|--- projetos de exemplo        [API .NET e projeto de exemplo]
+--- imagens                 [Imagens de exemplo]

Navegue até a pasta sample-projects e abra a solução: ocr-samples-vs.sln. Existem dois projetos:

  • asprise-ocr-api: a API OCR .NET
  • asprise-ocr-api-sample: programa de demonstração

Clique com o botão direito no projeto asprise-ocr-api-sample e "Definir como Projeto de Inicialização", então pressione o botão 'Iniciar' ou pressione F5 e você verá a mesma interface como mostrado.

3.2 Instalar IronOCR

A biblioteca IronOCR pode ser baixada e instalada de quatro maneiras.

Estes são:

  • Usando o Visual Studio
  • Usando a linha de comando do Visual Studio
  • Download direto do site do NuGet
  • Download direto do site do IronPDF

3.2.1 Usando Visual Studio

O software Visual Studio oferece a opção NuGet Package Manager para instalar o pacote diretamente na solução. A captura de tela abaixo mostra como abrir o Gerenciador de Pacotes NuGet .

Abbyy Finereader Ocr Alternatives 6 related to 3.2.1 Usando Visual Studio

Ele fornece uma caixa de pesquisa para mostrar a lista de pacotes do site da NuGet. No gerenciador de pacotes, precisamos procurar pela palavra-chave IronOCR, como na captura de tela abaixo:

Abbyy Finereader Ocr Alternatives 7 related to 3.2.1 Usando Visual Studio

Na imagem acima, obteremos a lista de itens de pesquisa relacionados. Precisamos selecionar a opção necessária para instalar o pacote na solução.

3.2.2 Usando a Linha de Comando do Visual Studio

No Visual Studio, acesse Ferramentas -> Gerenciador de Pacotes NuGet -> Console do Gerenciador de Pacotes.

Insira a seguinte linha na guia Console do Gerenciador de Pacotes:

Install-Package IronOcr

Em seguida, o pacote será baixado/instalado no projeto atual e estará pronto para uso.

3.2.3 Download direto do site da NuGet

A terceira maneira é baixar o pacote NuGet diretamente do site.

  • Navigate to the Link.
  • Selecione a opção de pacote de download no menu à direita.
  • Clique duas vezes no pacote baixado. Será instalado automaticamente. Em seguida, recarregue a solução e comece a usá-la no projeto.

3.2.4 Download direto do site do IronOCR

Click the link here to download the latest package direct from the website. Once downloaded, follow the steps below to add the package to the project.

  • Clique com o botão direito do mouse no projeto na janela de soluções. Em seguida, selecione a opção de referência e navegue até o local onde o arquivo de referência foi baixado. Em seguida, clique em OK para adicionar a referência.

4.0 Imagem de OCR

Tanto IronOCR quanto Asprise OCR têm uma tecnologia OCR que converterá imagens em texto buscando.

4.1 Usando Asprise

O código a seguir demonstra o uso básico do Asprise OCR.

using System;
using asprise_ocr_api;

class Example
{
    static void Main()
    {
        // Set up OCR engine
        AspriseOCR.SetUp();
        AspriseOCR ocr = new AspriseOCR();
        ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);

        // Recognize text from the given image
        string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, 
            AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);

        // Output the recognized text to the console
        Console.WriteLine("OCR Result: " + s);

        // Stop the OCR engine
        ocr.StopEngine();
    }
}
using System;
using asprise_ocr_api;

class Example
{
    static void Main()
    {
        // Set up OCR engine
        AspriseOCR.SetUp();
        AspriseOCR ocr = new AspriseOCR();
        ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);

        // Recognize text from the given image
        string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, 
            AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);

        // Output the recognized text to the console
        Console.WriteLine("OCR Result: " + s);

        // Stop the OCR engine
        ocr.StopEngine();
    }
}
$vbLabelText   $csharpLabel

O Asprise OCR suporta os seguintes formatos de imagem: GIF, PNG, JPEG, TIFF e PDF. Para o código de exemplo OCR na seção acima, a entrada se parece com o abaixo:

Asprise Ocr Alternatives 6 related to 4.1 Usando Asprise

A saída OCR estará no formato de Texto Simples:

Reconhecimento OCR e de Código de Barras Asprise

Alta performance, reconhecimento OCR e de código de barras sem royalties no Windows,
...
ISBN-13, Interleaved 2 of 5, Code 39, Code 128, PDF417 e QR Code.

[[QR-Code: www.asprise.com]]
[[CODE-128: Asprise]].

As duas últimas linhas representam extrato de informações de código de barras. Nota: tanto o formato quanto o conteúdo do código de barras estão encerrados em pares de '[[ ]]'.

4.2 Usando IronOCR

using System;
using IronOcr;

class Example
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();
        Ocr.Language = OcrLanguage.EnglishBest;

        // Specify to use Tesseract 5 engine
        Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

        // Create OcrInput to hold the images
        using (var Input = new OcrInput())
        {
            // Add an image to the OcrInput
            Input.AddImage(@"3.png");

            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Output the recognized text to the console
            Console.WriteLine(Result.Text);
            Console.ReadKey();
        }
    }
}
using System;
using IronOcr;

class Example
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();
        Ocr.Language = OcrLanguage.EnglishBest;

        // Specify to use Tesseract 5 engine
        Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

        // Create OcrInput to hold the images
        using (var Input = new OcrInput())
        {
            // Add an image to the OcrInput
            Input.AddImage(@"3.png");

            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Output the recognized text to the console
            Console.WriteLine(Result.Text);
            Console.ReadKey();
        }
    }
}
$vbLabelText   $csharpLabel

O Tesseract 5 API, que nos permite converter arquivos de imagem em texto, é demonstrado acima. Estamos criando um objeto para Iron Tesseract na linha de código acima. Também estamos criando um objeto OcrInput que nos permitirá adicionar um ou mais arquivos de imagem. Podemos precisar fornecer o caminho disponível da imagem dentro do código ao utilizar o método add do objeto OcrInput. Qualquer número de imagens pode ser adicionado. A função Read no Objeto IronTesseract que construímos antes pode ser utilizada para obter as imagens analisando o arquivo de imagem e extraindo o resultado em um resultado OCR. É capaz de extrair texto de fotos e convertê-lo em uma string.

Também podemos usar Tesseract para adicionar imagens com múltiplos quadros. "AddMultiFrameTiff" é um método diferente para esta operação. A biblioteca Tesseract lê cada quadro na imagem, e cada quadro é tratado como uma página distinta. O processo lerá o primeiro quadro da imagem e então prosseguirá para o próximo quadro, e assim por diante, até que todos os quadros da imagem tenham sido escaneados. Apenas o formato de imagem TIFF é suportado por este método.

Asprise Ocr Alternatives 7 related to 4.2 Usando IronOCR

A imagem acima é o resultado do IronOCR, que converteu com precisão os dados em texto editável.

5.0 Arquivos PDF OCR

IronOCR e Asprise OCR convertem arquivos PDF em texto editável. O Asprise OCR oferece uma lista de opções ao usuário, como salvar a página, editar a imagem, reconhecer a página, etc. Também oferece opções de salvamento como texto, documento, formato HTML, etc. O IronOCR também nos permite salvar o arquivo OCR convertido em HTML, texto, PDF, etc.

5.1 Usando Asprise OCR

Se você definir o formato de saída como OUTPUT_FORMAT_PDF, você precisa especificar o arquivo de saída PDF de destino como:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf|PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf|PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
$vbLabelText   $csharpLabel

No código acima, as propriedades são especificadas em uma única string separada por|(com chave e valor separados por =). Alternativamente, você pode especificar propriedades separadamente em pares:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
$vbLabelText   $csharpLabel

Para tornar o texto invisível ou transparente, basta definir PROP_PDF_OUTPUT_TEXT_VISIBLE como "false". Tanto PDF normal quanto PDF/A são suportados. Por favor, consulte o Resumo de Propriedades do Asprise OCR. Defina o formato de saída como OUTPUT_FORMAT_RTF. Você pode então gerar arquivos .rtf que podem ser editados na maioria dos processadores de texto (Microsoft Word, Libre Office, TextEdit, etc.).

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
$vbLabelText   $csharpLabel

Uma vez que o OCR estiver concluído, você pode visualizar ou editar o arquivo RTF com um processador de texto:

Asprise Ocr Alternatives 8 related to 5.1 Usando Asprise OCR

Você usa o seguinte método para realizar OCR em um arquivo PDF de entrada:

Asprise Ocr Alternatives 9 related to 5.1 Usando Asprise OCR

5.2 Usando IronOCR

Também podemos usar OCRInput para gerenciar arquivos PDF. Todas as páginas dos documentos serão lidas pela classe Iron Tesseract. O texto será então extraído das páginas. Também podemos abrir documentos protegidos usando uma segunda função chamada AddPdf, que nos permite adicionar PDFs à nossa lista de documentos (senha caso esteja protegido). O código a seguir demonstra como abrir um documento PDF protegido por senha:

using IronOcr;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Add a password protected PDF
    Input.AddPdf("example.pdf", "password");

    // Read the PDF document
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Add a password protected PDF
    Input.AddPdf("example.pdf", "password");

    // Read the PDF document
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

Podemos ler e extrair conteúdo de uma única página em um documento PDF usando AddpdfPage. Apenas o número da página da qual queremos extrair o texto precisa ser especificado. AddPdfPage nos permite extrair texto de várias páginas que especificamos. No IEnumerable<int>, podemos facilmente especificar múltiplas páginas. Devemos também incluir a localização do arquivo, bem como a extensão do arquivo. Isso é demonstrado no exemplo de código a seguir:

using IronOcr;
using System.Collections.Generic;

IEnumerable<int> numbers = new List<int> {2, 8, 10};
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Extract single page
    Input.AddPdfPage("example.pdf", 10);

    // Extract multiple pages
    Input.AddPdfPages("example.pdf", numbers);

    // Read the pages and extract content
    var Result = Ocr.Read(Input);

    // Output the recognized text and save to a text file
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
using IronOcr;
using System.Collections.Generic;

IEnumerable<int> numbers = new List<int> {2, 8, 10};
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Extract single page
    Input.AddPdfPage("example.pdf", 10);

    // Extract multiple pages
    Input.AddPdfPages("example.pdf", numbers);

    // Read the pages and extract content
    var Result = Ocr.Read(Input);

    // Output the recognized text and save to a text file
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
$vbLabelText   $csharpLabel

Usando a função SaveAsTextFile, podemos armazenar o resultado como um arquivo de texto, o que nos permite baixar o arquivo para o caminho do diretório de saída. Além disso, podemos salvar o arquivo em um arquivo HTML usando SaveAsHocrFile.

6.0 Outras Funcionalidades

6.1 Usando Asprise OCR

O Asprise OCR tem algumas opções adicionais, como Desenhar Área de Texto, Desenhar Área de Imagem, Desenhar Área de Tabela, Desenhar Área de Reconhecimento, etc. Todas elas ajudam o usuário a melhorar o desempenho do OCR. Não só o aplicativo realiza OCR, mas também somos capazes de realizar operações como combinar PDFs, dividir PDFs, editar PDFs, etc.

6.2 Usando IronOCR

O IronOCR tem recursos exclusivos que nos permitem ler códigos de barras e QR de documentos digitalizados. Os códigos abaixo mostram como podemos ler um código de barras de uma imagem ou documento fornecido.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    // Add an image containing a barcode
    Input.AddImage("barcode.gif");

    // Read the image to recognize text and barcodes
    var Result = Ocr.Read(Input);

    // Loop through barcodes and output the value
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    // Add an image containing a barcode
    Input.AddImage("barcode.gif");

    // Read the image to recognize text and barcodes
    var Result = Ocr.Read(Input);

    // Loop through barcodes and output the value
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
$vbLabelText   $csharpLabel

O acima é o código que ajuda a ler um código de barras de uma imagem ou documento PDF dado. Ele pode ler mais de um código de barras de uma página/imagem. Para ler um código de barras, o IronOCR tem uma configuração exclusiva, Ocr.Configuration.ReadBarCodes, que ajuda a ler um código de barras. O valor padrão está definido como falso.

Após ler a entrada, os dados serão salvos no objeto chamado OCRResult. Este tem uma propriedade chamada Barcodes, e terá todos os dados de código de barras disponíveis em uma lista. Usando o loop for-each, podemos obter todos os detalhes do código de barras um por um. Além disso, ele escaneará o código de barras e lerá o valor do código de barras - duas operações completadas em um processo.

Ele também suportará opções de threading. Podemos realizar múltiplos processos OCR de uma vez. IronOCR também é capaz de reconhecer uma área específica de uma região especificada.

using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Define the area to recognize text
    var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };

    // Add the document with the specified content area
    Input.Add("document.png", ContentArea);

    // Perform OCR on the specified region
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
} 
using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Define the area to recognize text
    var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };

    // Add the document with the specified content area
    Input.Add("document.png", ContentArea);

    // Perform OCR on the specified region
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
} 
$vbLabelText   $csharpLabel

O acima é o código de exemplo para executar OCR em uma região específica. Precisamos apenas especificar a região do retângulo na imagem ou PDF. O motor Tesseract no IronOCR nos ajuda a reconhecer o texto.

7.0 Modelos de Licença e Preços do IronOCR e Asprise OCR

Modelos de Licença e Preços do IronOCR

Garantia de devolução do dinheiro em 30 dias: quando a licença é adquirida, você terá 30 dias de devolução do dinheiro se a licença não funcionar.

Integração fácil: a integração do IronOCR com um projeto e ambiente é tão fácil que podemos fazê-lo apenas escrevendo uma única linha de código e adicionando-a a partir do Pacote NuGet. Ou, podemos baixá-lo da web e integrá-lo ao nosso ambiente dessa forma.

Licenciamento Perpétuo: cada licença é comprada uma vez e não requer renovação.

Suporte Gratuito e Atualizações de Produto: toda licença vem com um ano de atualizações gratuitas do produto e suporte da equipe por trás do produto. É possível adquirir extensões a qualquer momento. Extensões podem ser visualizadas.

Licenças Imediatas: chaves de licença registradas são enviadas assim que o pagamento é recebido.

Todas as licenças são perpétuas e se aplicam ao desenvolvimento, staging e produção.

A Licença Lite:

  • 1 desenvolvedor
  • 1 local
  • 1 projeto
  • Licença perpétua

Este pacote permite que um único desenvolvedor de software em uma organização utilize o Iron Software em um único lugar. O Iron Software pode ser usado em uma única aplicação web, aplicação intranet ou programa de software desktop. As licenças não são transferíveis e não podem ser compartilhadas fora de uma organização ou de um relacionamento agência/cliente. Este tipo de licença, como todos os outros tipos de licença, exclui expressamente todos os direitos não expressamente concedidos sob o Acordo, sem redistribuição OEM e utilizando o Iron Software como um SaaS sem adquirir cobertura adicional.

Preços: A partir de $799 por ano.

A Licença Professional:

  • 10 desenvolvedores
  • 10 locais
  • 10 projetos
  • Licença perpétua

Este pacote permite que um número predeterminado de desenvolvedores de software em uma organização utilize o Iron Software em locais únicos, até um máximo de dez. O Iron Software pode ser utilizado em quantos sites, aplicações intranet ou aplicações de software desktop desejar. As licenças são intransferíveis e não podem ser compartilhadas fora de uma organização ou de uma relação de agência/cliente. Este tipo de licença, como todos os outros tipos de licença, exclui expressamente todos os direitos não expressamente concedidos no Acordo, incluindo a redistribuição OEM e a utilização do Iron Software como SaaS sem a aquisição de cobertura adicional. Esta licença pode ser integrada com um único projeto até um máximo de 10.

Preços: A partir de $999 por ano.

A Licença Ilimitada:

  • Desenvolvedores ilimitados
  • Locais ilimitados
  • Projetos ilimitados
  • Licença perpétua

Isso permite que um número ilimitado de desenvolvedores de software em uma organização utilize o Iron Software em um número ilimitado de locais. O Iron Software pode ser utilizado em quantos sites, aplicações intranet ou aplicações de software desktop desejar. As licenças são intransferíveis e não podem ser compartilhadas fora de uma organização ou de uma relação de agência/cliente. Este tipo de licença, como todos os outros tipos de licença, exclui expressamente todos os direitos não expressamente concedidos no Acordo, incluindo a redistribuição OEM e a utilização do Iron Software como SaaS sem a aquisição de cobertura adicional.

Preço: A partir de $2,999 por ano.

Redistribuição Sem Royalties: Isso permite que você distribua o Iron Software como parte de vários produtos comerciais embalados de forma diferente (sem ter que pagar royalties) com base no número de projetos cobertos pela licença base. Permite a implementação do Iron Software em serviços de software SaaS, com base no número de projetos cobertos pela licença básica.

Preço: A partir de $1,599 por ano.

Asprise Ocr Alternatives 10 related to Modelos de Licença e Preços do IronOCR

Modelos de Licença e Preços do Asprise OCR

A Licença Lite:

  • Usuários finais ilimitados
  • Reconhecer texto
  • Ler códigos de barras 1D: UPC, EAN, Code39, Code128
  • Saída de Texto, XML e PDF
  • Implantação fácil
  • Suporta apenas 2 sistemas operacionais
  • Capacidade 1
  • Suporte: Não

Preços: A partir de $7998 por ano.

A Licença Standard:

  • Usuários finais ilimitados
  • Entrada BMP, GIF, PNG, JPEG, TIFF e PDF.
  • Reconhecer texto
  • Ler códigos de barras 1D: UPC, EAN, Code39, Code128
  • Ler alguns 2D: QR e Data Matrix apenas
  • Saída de Texto, XML e PDF
  • Implantação fácil
  • Suporte: Não

Preços: Começa a partir de $7,998 por ano.

A Licença Enterprise:

  • Usuários finais ilimitados
  • Entrada BMP, GIF, PNG, JPEG, TIFF e PDF.
  • Reconhecer texto
  • Ler códigos de barras 1D: UPC, EAN, Code39, Code128
  • 2D: QR, PDF 417, Data Matrix e Aztec
  • Saída de Texto, XML e PDF
  • Implantação fácil
  • Multi-threading, multi-processamento

Preços: Começa a partir de $12,998.

Asprise Ocr Alternatives 11 related to Modelos de Licença e Preços do Asprise OCR

O IronOCR Lite incluindo um pacote para um desenvolvedor com um ano de suporte custa cerca de $799, enquanto o Asprise Lite incluindo um pacote para um desenvolvedor custa $7998 sem suporte técnico, e $6,296 com suporte técnico pago. A licença Professional do IronOCR incluindo um pacote para 10 desenvolvedores com um ano de suporte técnico custa $999, enquanto a licença equivalente da Asprise, incluindo um pacote para 10 desenvolvedores, custa $37,998 por ano sem suporte técnico, mas com lançamentos e atualizações técnicas pagas, além de suporte por um ano, custa $46,999.00.

Os pacotes Lite e Professional do IronOCR têm serviço SaaS ou OEM e uma opção de suporte de 5 anos. A versão Lite, incluindo um pacote de um desenvolvedor com suporte de 5 anos e serviço SaaS e OEM, custa $2897USD, enquanto a Asprise tem um serviço SaaS ou OEM e uma opção de suporte personalizado. A versão Professional do IronOCR inclui um pacote para 10 desenvolvedores com um ano de suporte pago e serviço SaaS e OEM custa $3397, enquanto a versão da Asprise com um pacote para 10 desenvolvedores sem suporte de 1 ano e com serviço SaaS e OEM custa $59,996.

8.0 Conclusão

O IronOCR no contexto do .NET Framework fornece Tesseract que é direto e fácil de usar. Ele suporta fotos e documentos em PDF de várias maneiras. Também fornece uma série de configurações para melhorar o desempenho da biblioteca Tesseract OCR. Vários idiomas são suportados, assim como vários idiomas em uma única operação. Para saber mais sobre o Tesseract OCR, visite o site deles.

O Asprise é um aplicativo de software que usa um motor de inteligência artificial para reconhecer imagens e documentos PDF. Ele também fornece várias configurações para melhorar o desempenho do processo de OCR. Além disso, ele oferece a opção de selecionar múltiplos idiomas. O Asprise tem algumas limitações no uso das conversões de páginas. Também possui um preço diferente para diferentes sistemas operacionais.

Os pacotes do IronOCR oferecem melhor licenciamento e suporte em comparação com Asprise. O Asprise OCR tem pacotes personalizados e fixos que são mais caros. O IronOCR começa a partir de $799, enquanto o Asprise OCR começa a partir de $7994 por ano, então nosso produto é mais econômico enquanto também fornece mais recursos do que o Aspire. Ele também suporta múltiplas plataformas com um único preço.

Então, o que você está esperando? O teste gratuito está aberto para todos. You can obtain the License here and begin straightaway.

ObserveAspose é uma marca registrada de seu respectivo proprietário. Este site não é afiliado, endossado ou patrocinado pela Aspose. Todos os nomes de produtos, logotipos e marcas são propriedade de seus respectivos proprietários. As comparações são apenas para fins informativos e refletem informações disponíveis publicamente no momento da redação.

Perguntas frequentes

O que é reconhecimento óptico de caracteres?

O reconhecimento óptico de caracteres (OCR) é a tecnologia usada para converter diferentes tipos de documentos, como documentos digitalizados em papel, PDFs ou imagens capturadas por uma câmera digital, em dados editáveis e pesquisáveis. Ferramentas como o IronOCR são usadas para realizar o OCR, convertendo imagens de texto em dados textuais propriamente ditos.

Como posso converter imagens em texto usando C#?

O IronOCR oferece uma solução robusta para converter imagens em texto em C#. Você pode usar seus poderosos recursos de OCR para processar arquivos de imagem e extrair texto, mesmo de imagens de baixa qualidade, utilizando o mecanismo Tesseract 5.

Quais formatos o IronOCR suporta para operações de OCR?

O IronOCR suporta uma ampla variedade de formatos para operações de OCR, incluindo JPEG, PNG, GIF, BMP, TIFF e PDF. Ele também pode lidar com documentos de várias páginas e PDFs protegidos por senha.

Como instalo o IronOCR no meu projeto C#?

Você pode instalar o IronOCR em seu projeto C# usando o Gerenciador de Pacotes NuGet no Visual Studio. Como alternativa, você pode usar a linha de comando com o comando Install-Package IronOCR ou baixá-lo diretamente do site do IronOCR.

Quais são as vantagens de usar o IronOCR em comparação com outras bibliotecas de OCR?

O IronOCR oferece amplo suporte a idiomas, excelente desempenho com imagens de baixa qualidade e recursos como reconhecimento de código de barras e código QR. Ele oferece licenciamento econômico e suporte a múltiplas plataformas por um preço único, tornando-se uma escolha versátil para desenvolvedores.

O IronOCR consegue lidar com documentos de várias páginas?

Sim, o IronOCR consegue processar documentos com várias páginas, incluindo TIFFs e PDFs, extraindo o texto de cada página de forma eficiente. Isso é particularmente útil para lidar com documentos grandes ou processamento em lote.

Quais são as opções de licenciamento disponíveis para o IronOCR?

A IronOCR oferece opções flexíveis de licenciamento perpétuo, incluindo as licenças Lite, Professional e Unlimited. Essas licenças são isentas de royalties e suportam serviços SaaS e OEM, tornando-as adequadas para uma variedade de cenários de implantação.

Como o IronOCR lida com a extração de texto em imagens de baixa qualidade?

O IronOCR se destaca na extração de texto de imagens de baixa qualidade, utilizando técnicas avançadas de pré-processamento para melhorar a qualidade da imagem antes de realizar o OCR. Isso aumenta significativamente a precisão do reconhecimento de texto.

Kannaopat Udonpant
Engenheiro de Software
Antes de se tornar Engenheiro de Software, Kannapat concluiu um doutorado em Recursos Ambientais pela Universidade de Hokkaido, no Japão. Durante o doutorado, Kannapat também integrou o Laboratório de Robótica Veicular, que faz parte do Departamento de Engenharia de Bioprodução. Em 2022, ele utilizou suas habilidades ...
Leia mais

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me