Ir para o conteúdo do rodapé
COMPARAR COM OUTROS COMPONENTES

Uma comparação entre IronOCR e Nanonets OCR

O Reconhecimento Óptico de Caracteres (OCR) fornece a capacidade de converter um arquivo de imagem em texto codificado por máquina. Isso é incrivelmente útil dado que os documentos digitalizados são salvos como arquivos de imagem, e os dados nesses arquivos de imagem não podem ser pesquisados, editados ou salvos em formato de texto usando um editor de texto normal ou mesmo uma aplicação de processamento de texto. O processamento OCR ajuda a converter essas imagens em texto legível por máquina para processamento adicional pelos usuários.

Nesta era moderna, documentos compartilhados pela internet estão geralmente em formato digital, principalmente na forma de PDFs ou imagens. Existem inúmeros recursos online disponíveis que convertem imagens em texto. No entanto, a maioria das empresas requer essa funcionalidade em suas aplicações de software. Tendo isso em mente, existem muitas bibliotecas que fornecem tecnologia de processamento OCR para serem incorporadas em aplicações de software.

Neste artigo, vamos discutir duas das bibliotecas OCR mais populares para C#. Estes são:

  • IronOCR
  • API OCR Nanonets

IronOCR - Biblioteca C

IronOCR for .NET é uma biblioteca C# que permite aos usuários escanear, pesquisar e ler imagens e PDFs. Ela recebe um arquivo de imagem ou PDF como entrada e usa o mais recente mecanismo .NET OCR personalizado Tesseract 5 para produzir texto, dados estruturados ou documentos PDF pesquisáveis. Tesseract está disponível em mais de 125 idiomas, e o IronOCR oferece suporte multiplataforma em .NET Core, Standard, de 2.0 até 7.

IronOCR é uma API fácil de usar que permite aos desenvolvedores C# converter automaticamente imagens em texto usando a classe IronTesseract. A biblioteca prioriza velocidade, precisão e facilidade de uso.

Outro recurso poderoso do IronOCR é a capacidade de escanear códigos de barras e códigos QR de todos os arquivos de imagem e ler seu texto. Recursos adicionais importantes do IronOCR estão listados abaixo.

Características

  • Idiomas Internacionais: Mais de 125 idiomas e suporte a idiomas personalizados.
  • Leitura de Texto e Código de Barras: Leia textos e números de múltiplos idiomas ao mesmo tempo.
  • Documentos Especializados: Leia texto de documentos especiais como recibos, cheques e faturas.
  • Ler de Muitos Formatos: Ler de imagens (PNG, JPG, GIF, TIFF, BMP), System.Drawing Objects, fluxos, documentos PDF, e mais.
  • Recursos de Pré-processamento: Inclui recursos de pré-processamento como o Filter Wizard, correção de imagem, correção de orientação e correção de cor.
  • Saída Simples de Dados: Saídas em .NET Text Strings, Código de Barras, QR e formato de Imagem.

Agora, vamos dar uma olhada na Nanonets OCR API.

API OCR Nanonets

Nanonets OCR API é uma API REST que fornece extração de dados em tempo real adaptada às necessidades do seu negócio para fluxos de trabalho automatizados. A OCR API é alimentada por IA e pode capturar, categorizar e extrair dados de documentos não estruturados de forma segura em segundos. Com Nanonets, você pode automatizar a entrada manual de dados, reduzindo o esforço manual necessário.

Nanonets entende documentos usando aprendizado de máquina, mesmo aqueles que não seguem um modelo padrão. Você pode enviar qualquer documento não estruturado e capturar apenas as informações desejadas com base em diferentes campos. Ao contrário do OCR tradicional, o modelo OCR do Nanonets pode ser treinado para obter melhores resultados. À medida que sua empresa cresce, o modelo OCR de processamento inteligente de documentos do Nanonets também cresce e aprende com cada novo documento, proporcionando resultados rápidos e precisos.

Além disso, Nanonets fornece um pacote Python que permite integração fácil e captura de dados em aplicações Python sem exigir solicitações de API. Outros recursos incluem:

  • Conformidade com GDPR
  • Captura de dados automatizada
  • Validação de dados extraídos
  • Capacidades de treinamento e re-treinamento de modelos
  • Tempo de resposta rápido da API
  • Implantação no local disponível em vários idiomas
  • Modelo de aprendizado contínuo de IA
  • Não é necessário configurar modelos
  • Várias opções de exportação disponíveis

O restante do artigo segue da seguinte forma:

  1. Criando o Projeto Visual Studio
  2. Instalando IronOCR
  3. Instalando Nanonets OCR API
  4. Imagem para Texto
  5. Código de Barras e QR para Texto
  6. PDF para Texto
  7. Licenciamento
  8. Conclusão

1. Criando o Projeto Visual Studio

Neste tutorial, vamos usar a versão mais recente do Visual Studio 2022. Se você ainda não o baixou e instalou, pode fazê-lo no site do Visual Studio.

Agora, precisamos criar um projeto de console para começar com ambas as bibliotecas. Siga as etapas para criar um projeto:

  • Abra seu Visual Studio 2022.
  • Clique em Criar um novo Projeto.

    Uma Comparação Entre IronOCR e Nanonets OCR: Figura 1

  • Selecione Aplicativo de Console C# nas opções fornecidas.

    Uma Comparação Entre IronOCR e Nanonets OCR: Figura 2

  • Configure seu novo projeto com um nome e localização. Por exemplo, chame-o de "OCRProject".
  • Clique em Avançar.

    Uma Comparação Entre IronOCR e Nanonets OCR: Figura 3

  • Sob informações adicionais, selecione .NET 6.0 Framework, pois é a versão mais estável.

    Uma Comparação Entre IronOCR e Nanonets OCR: Figura 4

  • Agora, clique em Criar e o projeto será criado na localização especificada.

Em seguida, vamos instalar as bibliotecas em nosso projeto para comparação.

2. Instalando IronOCR

Existem várias maneiras de instalar a biblioteca IronOCR. Vamos analisá-los um por um.

2.1. Usando o Gerenciador de Pacotes NuGet do Visual Studio

NuGet é o gerenciador de pacotes para download e instalação de dependências no seu projeto. Seus pacotes contêm código compilado e (DLLs) e o arquivo manifesto. Acesse-o usando o seguinte método:

  • Clique na guia ferramentas.
  • Expanda a opção Gerenciador de Pacotes NuGet.
  • Clique em Gerenciar Pacotes NuGet para Soluções.

    Uma Comparação Entre IronOCR e Nanonets OCR: Figura 5

Alternativamente:

  • Clique com o botão direito no Explorador de Soluções.
  • Clique em Gerenciar Pacotes NuGet.

    Uma Comparação Entre IronOCR e Nanonets OCR: Figura 6

Agora, a janela do Gerenciador de Pacotes NuGet será aberta. Procure por IronOCR e clique em Instalar.

Uma Comparação Entre IronOCR e Nanonets OCR: Figura 7

2.2. Baixar do Site do NuGet

O IronOCR também pode ser baixado diretamente do site oficial do NuGet. Siga estas etapas:

  1. Visite o site do NuGet.
  2. Clique na opção "baixar pacote" no lado direito da página.
  3. Abra o pacote baixado para iniciar a instalação.
  4. Finalmente, recarregue a solução e está pronto.

2.3. Baixar usando a Página da Web IronOCR

Visite o site da Iron Software e navegue até a página do IronOCR for .NET. Role até o final e clique em Baixar DLL ou Baixar instalador do Windows.

Uma Comparação Entre IronOCR e Nanonets OCR: Figura 8

Um arquivo zip será baixado. Extraia o arquivo do projeto ou execute o instalador do Windows. Siga as etapas abaixo para adicioná-lo ao seu projeto.

  1. Clique com o botão direito nas dependências do projeto no Visual Studio a partir do explorador de soluções.
  2. Selecione a opção Adicionar Referência de Projeto.
  3. Navegue até o local do arquivo DLL baixado.
  4. Finalmente, clique em OK para adicionar uma referência ao projeto.

2.4. Usando o Command prompt no Visual Studio

  1. Navegue até a aba Ferramentas no Visual Studio.
  2. Expanda a opção Gerenciador de Pacotes NuGet.
  3. Selecione Console do Gerenciador de Pacotes e digite o seguinte comando:
Install-Package IronOcr

Isso baixará e instalará automaticamente o IronOCR no seu projeto.

Agora, estamos prontos para usar o IronOCR em nosso projeto.

2.5. Adicionando os Namespaces Necessários do IronOCR

Há apenas um namespace necessário, que precisa ser adicionado no topo do arquivo de código-fonte onde precisamos acessar as funções do IronOCR.

using IronOcr;
using IronOcr;
$vbLabelText   $csharpLabel

Agora, vamos instalar a API Nanonets OCR.

3. Instalando Nanonets OCR

Nanonets pode ser usado de várias maneiras para capturar dados. Ele fornece uma facilidade de OCR online que pode ser usada para extração instantânea de dados, reduzindo os tempos de resposta. Como uma API REST, ele pode ser integrado a várias linguagens de programação. Aqui, demonstraremos como integrá-lo a uma linguagem de programação C#.

Para automatizar a captura de dados usando a API Nanonets OCR em C#, você precisará do seguinte:

  1. Inscreva-se no Nanonets - Você pode se inscrever para um teste gratuito usando sua conta do Gmail ou um e-mail registrado no Nanonets.
  2. Crie um Modelo de OCR - Isso gerará um ID de modelo que será usado posteriormente ao fazer chamadas de API.
  3. Obtenha uma chave API gratuita - Vá para a aba Accounts Info e clique em API Keys. Aqui, você pode adicionar novas chaves ou usar uma existente.

3.1. Adicionando o Namespace RestSharp

RestSharp é uma biblioteca cliente simples para Rest e HTTP for .NET. Ela é usada para enviar e receber solicitações de API e lidar com respostas. Esta biblioteca é necessária para executar o código da API Nanonets, pois ele também é uma API REST.

Para instalar RestSharp, abra o Gerenciador de Pacotes NuGet para sua solução, procure por RestSharp e instale. Alternativamente, você pode abrir o Console do Gerenciador de Pacotes e digitar o seguinte comando:

Install-Package RestSharp

Agora, tudo está configurado e pronto para uso.

4. Imagens para Texto

Ler dados de imagens pode ser uma tarefa bastante tediosa. Resolução e qualidade da imagem desempenham um papel importante ao extrair conteúdo. Tanto o IronOCR quanto o Nanonets fornecem funcionalidades de reconhecimento óptico de caracteres para extrair texto das imagens.

4.1. Usando IronOCR

IronOCR facilita muito para os desenvolvedores ler o conteúdo de um arquivo de imagem com sua poderosa classe IronTesseract. Usaremos o seguinte código para ler texto de um arquivo de imagem PNG:

var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
  Input.AddImage("test-files/employmentapp.png");
  var Result = Ocr.Read(Input);
  Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
  Input.AddImage("test-files/employmentapp.png");
  var Result = Ocr.Read(Input);
  Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

Imagem de Entrada

Uma Comparação Entre IronOCR e Nanonets OCR: Figura 9

Saída

Uma Comparação Entre IronOCR e Nanonets OCR: Figura 10

A saída do IronOCR corresponde à imagem original fornecida a ele. O código é limpo e fácil de entender sem quaisquer tecnicalidades.

4.2. Usando Nanonets OCR

Nanonets também oferece a facilidade de extrair texto de imagens. Para fazer isso, é feita uma chamada de API com a chave de autenticação, e então a imagem é enviada para o servidor Nanonets. A ferramenta de OCR rápida então retornará o texto extraído como uma resposta para a aplicação. Aqui está um exemplo do código:

var client = new RestClient("https://app.nanonets.com/api/v2/OCR/FullText");
client.Timeout = -1;
var request = new RestRequest(Method.POST);
request.AddHeader("Authorization", "Basic " + Convert.ToBase64String(Encoding.Default.GetBytes("REPLACE_YOUR_API_KEY:")));
request.AddFile("file", "FILE_PATH");
RestResponse response = client.Execute(request);
Console.WriteLine(response.Content);
var client = new RestClient("https://app.nanonets.com/api/v2/OCR/FullText");
client.Timeout = -1;
var request = new RestRequest(Method.POST);
request.AddHeader("Authorization", "Basic " + Convert.ToBase64String(Encoding.Default.GetBytes("REPLACE_YOUR_API_KEY:")));
request.AddFile("file", "FILE_PATH");
RestResponse response = client.Execute(request);
Console.WriteLine(response.Content);
$vbLabelText   $csharpLabel

Uma Comparação Entre IronOCR e Nanonets OCR: Figura 11

A saída não é perfeita. A imagem continha dados estruturados, dos quais apenas alguns foram recuperados corretamente. Com outra imagem de texto simples, a saída foi boa. Observe que o modelo pode ser treinado para obter resultados mais precisos.

5. Código de Barras e Código QR para Texto

5.1. Usando IronOCR

IronOCR oferece um recurso útil para leitura de imagens que inclui a capacidade de detectar e ler códigos de barras e códigos QR. Para habilitar este recurso, defina a propriedade de configuração ReadBarcodes como verdadeira antes de processar a imagem. Uma vez concluído o processamento OCR, percorra os resultados do OCR para extrair o valor de cada código de barras detectado. Abaixo está um exemplo de trecho de código para leitura de códigos de barras com IronOCR:

var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput()) {    
    input.AddImage("test-files/Barcode.png");    
    var Result = Ocr.Read(input);    
    foreach (var Barcode in Result.Barcodes){
        Console.WriteLine(Barcode.Value);
    }
}
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput()) {    
    input.AddImage("test-files/Barcode.png");    
    var Result = Ocr.Read(input);    
    foreach (var Barcode in Result.Barcodes){
        Console.WriteLine(Barcode.Value);
    }
}
$vbLabelText   $csharpLabel

IMAGEM DE ENTRADA

Nanonets Ocr Api Csharp Alternatives 12 related to IMAGEM DE ENTRADA

SAÍDA

Nanonets Ocr Api Csharp Alternatives 13 related to SAÍDA

Todos os três códigos de barras na imagem de entrada são lidos com sucesso, e seu texto oculto é exibido.

5.2. Usando Nanonets OCR

A API do Nanonets OCR fornece a funcionalidade para detectar códigos QR. No entanto, essa funcionalidade está disponível apenas no plano Enterprise, e você precisará entrar em contato com as vendas para usá-la. Além disso, o Nanonets permite detectar partes específicas de documentos ou recibos. Também oferece outros recursos, como contas a pagar, processamento de faturas e automação contábil.

6. PDF para Texto

6.1. Usando IronOCR

Ler arquivos PDF é tão simples quanto ler arquivos de imagem com o IronOCR. A única alteração necessária é usar o método AddPdf em vez de AddImage no código para ler imagens. O código é o seguinte:

var Ocr = new IronTesseract();
using (var Input = new OcrInput()) {
    Input.AddPdf("test-files/example.pdf");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput()) {
    Input.AddPdf("test-files/example.pdf");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

O texto extraído está no mesmo formato que o arquivo PDF.

Nanonets Ocr Api Csharp Alternatives 14 related to 6.1. Usando IronOCR

6.2. Usando Nanonets OCR

A leitura de dados de arquivos PDF também está disponível na API do Nanonets OCR. O código é quase idêntico ao código de detecção de texto de imagem, exceto pelo URL usado na solicitação. Vamos dar uma olhada no código:

var client = new RestClient("https://app.nanonets.com/api/v2/OCR/Model/{{model_id}}/LabelFile/?async=false");
var request = new RestRequest(Method.POST);
request.AddHeader("Authorization", "Basic " + Convert.ToBase64String(Encoding.Default.GetBytes("REPLACE_YOUR_API_KEY:")));
request.AddHeader("Accept", "Multipart/form-data");
request.AddFile("file", "test-files/example.pdf");
RestResponse response = client.Execute(request);
Console.WriteLine(response.Content);
var client = new RestClient("https://app.nanonets.com/api/v2/OCR/Model/{{model_id}}/LabelFile/?async=false");
var request = new RestRequest(Method.POST);
request.AddHeader("Authorization", "Basic " + Convert.ToBase64String(Encoding.Default.GetBytes("REPLACE_YOUR_API_KEY:")));
request.AddHeader("Accept", "Multipart/form-data");
request.AddFile("file", "test-files/example.pdf");
RestResponse response = client.Execute(request);
Console.WriteLine(response.Content);
$vbLabelText   $csharpLabel

No código acima, substitua o model_id pelo ID do seu modelo de OCR. Além disso, substitua a chave da API pela sua própria chave da API. Em seguida, substitua o caminho do arquivo PDF pelo caminho para o seu próprio arquivo.

Nanonets Ocr Api Csharp Alternatives 15 related to 6.2. Usando Nanonets OCR

A saída é semelhante ao IronOCR, mas com espaços extras e novas linhas incluídas na saída do Nanonets OCR.

7. Licenciamento

IronOCR é gratuito para fins de desenvolvimento, mas precisa ser licenciado para uso comercial. Ele também oferece um teste gratuito para testar todo o seu potencial para suas necessidades. O pacote lite começa em $799 com uma garantia de devolução do dinheiro em 30 dias. IronOCR fornece um ano de suporte ao produto e atualizações gratuitamente, e depois $399 por ano. Todas as licenças são perpétuas, o que significa que há apenas uma compra única e sem cobranças ocultas. Você também pode escolher a cobertura de redistribuição livre de royalties para produtos SaaS e OEM por apenas uma compra única de $1999. Para obter mais informações sobre pacotes de licenças e planos de preços, visite o seguinte link.

Aws Ocr Alternatives 14 related to 7. Licenciamento

A API do Nanonets OCR oferece três pacotes diferentes. Você pode se inscrever gratuitamente para o seu pacote inicial. As primeiras 500 páginas são gratuitas, após as quais é cobrado $0,30 por página. Você paga apenas pelo que usar. Para mais informações detalhadas sobre preços, você pode visitar este link.

Nanonets Ocr Api Csharp Alternatives 17 related to 7. Licenciamento

8. Conclusão

Nanonets Ocr Api Csharp Alternatives 18 related to 8. Conclusão

IronOCR fornece aos desenvolvedores C# a avançada API Tesseract disponível na maioria das plataformas. Ele pode ser implantado no Windows, Linux, Mac, Azure, AWS e Lambda, e suporta projetos .NET Framework, assim como .NET Standard e .NET Core. IronOCR também permite ler códigos de barras em varreduras de OCR e até exportar OCR como HTML e PDFs pesquisáveis. Para mais informações sobre C# Tesseract OCR, clique aqui.

A API do Nanonets OCR oferece uma variedade de ferramentas OCR. Ela fornece soluções OCR prontas para uso para diversos tipos de documentos, como faturas, recibos, contas, formulários e carteiras de identidade, para automatizar a captura de dados. Não é necessário configurar modelos, não há cobranças ocultas, e permite economia de tempo de 90% e produtividade 10x usando a API do Nanonets OCR.

Licenças do IronOCR são baseadas em desenvolvedores, o que significa que você deve sempre adquirir uma licença com base no número de desenvolvedores que usarão o produto. Os planos de preços do Nanonets são baseados no número de imagens ou páginas PDF para extrair informações e analisar os dados. Os planos Pro e Enterprise são mensais por modelo, e os preços aumentam quando o número de modelos e páginas aumenta em comparação com as licenças do IronOCR. Além disso, as licenças do IronOCR são uma compra única e podem ser usadas para toda a vida, e suportam distribuição OEM e SaaS.

Em comparação geral, ambas as APIs oferecem funcionalidades OCR baseadas em IA e ML. IronOCR tem uma ligeira vantagem sobre o Nanonets porque pode ser usado offline e fornece resultados mais confiáveis, mesmo para documentos não estruturados. IronOCR oferece a facilidade de usar dados treinados personalizado com integração rápida para resultados mais precisos. Nanonets OCR fornece a facilidade de treinar o modelo com base em campos-chave, e pode ser difícil de detectar se não for treinado corretamente. Além disso, IronOCR oferece suporte multilíngue e suporta mais de 125 idiomas internacionais.

Agora você pode obter cinco produtos Iron pelo preço de dois como parte do conjunto completo Iron Suite. Visite este link para explorar mais.

IronOCR também oferece uma versão de teste gratuita com garantia de reembolso. Você pode baixar o IronOCR deste link.

ObserveA API do Nanonets OCR é uma marca registrada de seu respectivo proprietário. Este site não está afiliado, patrocinado ou endossado pela API do Nanonets OCR. Todos os nomes de produtos, logotipos e marcas são propriedade de seus respectivos proprietários. As comparações são apenas para fins informativos e refletem informações disponíveis publicamente no momento da redação.

Perguntas frequentes

Qual é a melhor alternativa à API OCR da Nanonets para aplicações C#?

IronOCR é uma alternativa altamente recomendada à API OCR da Nanonets para aplicações C#. Ela oferece uma biblioteca .NET robusta com suporte para mais de 125 idiomas, leitura de códigos de barras e QR codes, e pode ser usada offline.

Como posso integrar a funcionalidade de OCR em minha aplicação C#?

Você pode integrar a funcionalidade de OCR em seu aplicativo C# usando o IronOCR, que permite converter imagens e PDFs em texto legível por máquina com seu mecanismo Tesseract 5 personalizado.

Quais são as vantagens de usar o IronOCR em vez da API OCR da Nanonets?

O IronOCR oferece diversas vantagens em relação à API OCR da Nanonets, incluindo funcionalidades offline, um modelo de licenciamento com compra única, amplo suporte a idiomas e alta precisão para documentos não estruturados.

Como o IronOCR lida com o processamento OCR multilíngue?

O IronOCR realiza o processamento OCR multilíngue, suportando mais de 125 idiomas, o que permite o reconhecimento preciso de texto em vários idiomas dentro do mesmo documento.

O IronOCR consegue ler códigos de barras e códigos QR em imagens?

Sim, o IronOCR consegue detectar e ler códigos de barras e códigos QR a partir de arquivos de imagem, tornando-se uma ferramenta versátil para aplicações que exigem reconhecimento tanto de texto quanto de código.

Quais são as opções de licenciamento disponíveis para o IronOCR?

O IronOCR oferece um período de teste gratuito para fins de desenvolvimento. Para uso comercial, é necessária uma licença de compra única, que permite o uso perpétuo sem taxas recorrentes.

Como se compara o modelo de preços da IronOCR ao da Nanonets?

A IronOCR utiliza um modelo de compra única para seu licenciamento, permitindo que os usuários evitem custos contínuos, enquanto a Nanonets cobra com base no uso, com um pacote inicial gratuito seguido de taxas por página.

Quais são os passos de instalação necessários para usar o IronOCR em um projeto C#?

Para usar o IronOCR em um projeto C#, você precisa instalar o pacote NuGet IronOCR em seu ambiente de desenvolvimento, após o qual poderá começar imediatamente a implementar funcionalidades de OCR.

Como o OCR pode melhorar os fluxos de trabalho empresariais?

O OCR aprimora os fluxos de trabalho empresariais ao converter imagens e PDFs em texto pesquisável e editável, o que automatiza os processos de entrada de dados e aumenta a eficiência em diversas operações comerciais.

O que torna o IronOCR adequado para uso offline?

O IronOCR é adequado para uso offline, pois não requer uma conexão constante com a internet para executar tarefas de OCR, tornando-o ideal para aplicações que precisam de desempenho confiável em ambientes com conectividade limitada.

Kannaopat Udonpant
Engenheiro de Software
Antes de se tornar Engenheiro de Software, Kannapat concluiu um doutorado em Recursos Ambientais pela Universidade de Hokkaido, no Japão. Durante o doutorado, Kannapat também integrou o Laboratório de Robótica Veicular, que faz parte do Departamento de Engenharia de Bioprodução. Em 2022, ele utilizou suas habilidades ...
Leia mais

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me