Ir para o conteúdo do rodapé

Comece a usar exemplos de OCR for .NET

C# + VB.NET: AutoOcr AutoOcr
using IronOcr;

string imageText = new IronTesseract().Read(@"images\image.png").Text;
Install-Package IronOcr

IronOCR é único em sua capacidade de detectar automaticamente e ler texto de imagens escaneadas imperfeitamente e documentos PDF. A classe IronTesseract fornece a API mais simples.

Experimente outros exemplos de código para obter controle fino de suas operações de OCR em C#.

IronOCR proporciona a construção mais avançada de Tesseract conhecida em qualquer lugar, em qualquer plataforma, com velocidade aumentada, precisão e uma DLL e API nativas.

Suporta Tesseract 3, Tesseract 4, e Tesseract 5 for .NET Framework, Standard, Core, Xamarin, e Mono.

Explore the IronTesseract C# OCR How-To Guide

C# + VB.NET: Línguas internacionais Línguas internacionais
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

ocrTesseract.Language = OcrLanguage.Arabic;

using (var ocrInput = new OcrInput())
{
    ocrInput.LoadImage(@"images\arabic.gif");
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}

// Example with a Custom Trained Font Being used:

var ocrTesseractCustomerLang = new IronTesseract();
ocrTesseractCustomerLang.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
ocrTesseractCustomerLang.AddSecondaryLanguage(OcrLanguage.EnglishBest);

using (var ocrInput = new OcrInput())
{
    ocrInput.LoadPdf(@"images\mixed-lang.pdf");
    var ocrResult = ocrTesseractCustomerLang.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
Install-Package IronOcr

Suporte a idiomas do IronOCR

O IronOCR suporta 125 idiomas internacionais. Além do inglês, que é instalado por padrão, pacotes de idiomas adicionais podem ser adicionados ao seu projeto .NET via NuGet ou baixados da nossa página de idiomas .

A maioria dos idiomas está disponível nas qualidades Rápida, Padrão (recomendada) e Melhor. A opção de melhor qualidade pode oferecer resultados mais precisos, mas também terá um tempo de processamento mais lento.

Explore o OCR em vários idiomas com o IronOCR.

C# + VB.NET: Objetos de resultados Objetos de resultados
using IronOcr;
using IronSoftware.Drawing;

// We can delve deep into OCR results as an object model of
// Pages, Barcodes, Paragraphs, Lines, Words and Characters
// This allows us to explore, export and draw OCR content using other APIs/
var ocrTesseract = new IronTesseract();

ocrTesseract.Configuration.ReadBarCodes = true;

using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);

OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    // Page object
    int PageNumber = page.PageNumber;
    string PageText = page.Text;
    int PageWordCount = page.WordCount;
    // null if we dont set Ocr.Configuration.ReadBarCodes = true;
    OcrResult.Barcode[] Barcodes = page.Barcodes;
    AnyBitmap PageImage = page.ToBitmap(ocrInput);
    double PageWidth = page.Width;
    double PageHeight = page.Height;
    double PageRotation = page.Rotation; // angular correction in degrees from OcrInput.Deskew()

    foreach (var paragraph in page.Paragraphs)
    {
        // Pages -> Paragraphs
        int ParagraphNumber = paragraph.ParagraphNumber;
        string ParagraphText = paragraph.Text;
        AnyBitmap ParagraphImage = paragraph.ToBitmap(ocrInput);
        int ParagraphX_location = paragraph.X;
        int ParagraphY_location = paragraph.Y;
        int ParagraphWidth = paragraph.Width;
        int ParagraphHeight = paragraph.Height;
        double ParagraphOcrAccuracy = paragraph.Confidence;
        OcrResult.TextFlow paragrapthText_direction = paragraph.TextDirection;
        foreach (var line in paragraph.Lines)
        {
            // Pages -> Paragraphs -> Lines
            int LineNumber = line.LineNumber;
            string LineText = line.Text;
            AnyBitmap LineImage = line.ToBitmap(ocrInput);
            int LineX_location = line.X;
            int LineY_location = line.Y;
            int LineWidth = line.Width;
            int LineHeight = line.Height;
            double LineOcrAccuracy = line.Confidence;
            double LineSkew = line.BaselineAngle;
            double LineOffset = line.BaselineOffset;
            foreach (var word in line.Words)
            {
                // Pages -> Paragraphs -> Lines -> Words
                int WordNumber = word.WordNumber;
                string WordText = word.Text;
                AnyBitmap WordImage = word.ToBitmap(ocrInput);
                int WordX_location = word.X;
                int WordY_location = word.Y;
                int WordWidth = word.Width;
                int WordHeight = word.Height;
                double WordOcrAccuracy = word.Confidence;
                foreach (var character in word.Characters)
                {
                    // Pages -> Paragraphs -> Lines -> Words -> Characters
                    int CharacterNumber = character.CharacterNumber;
                    string CharacterText = character.Text;
                    AnyBitmap CharacterImage = character.ToBitmap(ocrInput);
                    int CharacterX_location = character.X;
                    int CharacterY_location = character.Y;
                    int CharacterWidth = character.Width;
                    int CharacterHeight = character.Height;
                    double CharacterOcrAccuracy = character.Confidence;
                    // Output alternative symbols choices and their probability.
                    // Very useful for spellchecking
                    OcrResult.Choice[] Choices = character.Choices;
                }
            }
        }
    }
}
Install-Package IronOcr

IronOCR retorna um objeto de resultado avançado para cada página que escaneia usando Tesseract 5. Isso contém dados de localização, imagens, texto, confiança estatística, escolhas alternativas de símbolos, nomes de fonte, tamanhos de fonte, decoração, pesos de fonte e posição para cada:

  • Page
  • Paragraph
  • Linha de Texto
  • Word
  • Caractere Individual
  • Barcode

Explore como ler resultados de OCR com IronOCR

Human Support related to OCR no .NET Core

Suporte humano diretamente da nossa equipe de desenvolvimento.

Seja para dúvidas sobre produtos, integração ou licenciamento, a equipe de desenvolvimento de produtos da Iron está à disposição para ajudar com todas as suas perguntas. Entre em contato e inicie um diálogo com a Iron para aproveitar ao máximo nossa biblioteca em seu projeto.

Faça uma pergunta
Image To Text related to OCR no .NET Core

Mecanismo de leitura de reconhecimento óptico de caracteres (OCR) — Imagem para texto no SDK .NET de OCR

A biblioteca IronOCR (Reconhecimento Óptico de Caracteres) permite que os desenvolvedores obtenham resultados rápidos e eficientes na conversão de imagens em texto. O IronOCR funciona com .NET, VB.NET e C#. Nossos principais aplicativos .NET para frameworks .NET são projetados especificamente para você, desenvolvedor, para ajudá-lo a alcançar o desempenho ideal em seus projetos.

O OCR recebe e reconhece arquivos de texto, códigos de barras, conteúdo de QR Code e muito mais. No entanto, o IronOCR também oferece diversos métodos que permitem adicionar leitura de OCR e texto a partir de imagens em projetos .NET para web, desktop Windows ou console, com suporte para uma gama praticamente ilimitada de formatos e arquivos de imagem, como JPG, PNG, GIF, TIFF, BMP, JPEG ou PDF.

Por dentro do IronOCR: resultados perfeitos

Embora os resultados do reconhecimento de texto simples, caracteres, linhas e parágrafos a partir de imagens possam não parecer óbvios à primeira vista, você descobrirá que o funcionamento interno do IronOCR é, na verdade, mais simples do que você imaginava. O IronOCR escaneia a imagem para alinhamento, utiliza sua ferramenta de remoção de ruído e filtros para verificar a qualidade e a resolução. Ele analisa suas propriedades, otimiza o mecanismo de OCR e usa uma rede de inteligência artificial treinada para, então, reconhecer o texto (a partir de imagens) tão bem quanto um ser humano.

O reconhecimento óptico de caracteres (OCR) não é um processo simples, nem mesmo para um computador. No entanto, o IronOCR torna todo o processo de criação de documentos pesquisáveis mais rápido e direto, com 100% de precisão e um mínimo de linhas de código.

Funciona com .NET, VB.NET, C#

Leia o tutorial
Support For Languages related to OCR no .NET Core

Trabalha com vários idiomas internacionais.

O software não se limita a fronteiras geográficas — as empresas operam além-fronteiras e dependem de vários idiomas para alcançar seus resultados. Da mesma forma, uma ferramenta de reconhecimento óptico de caracteres (OCR) que realiza o reconhecimento de documentos em apenas um idioma é um grande NÃO em todos os sentidos!

O que significa para você o suporte a OCR multilíngue?

Com uma biblioteca OCR multilíngue que oferece diversas funcionalidades de OCR, você se beneficia da criação de um documento PDF pesquisável a partir de um PDF ou imagem digitalizada em vários idiomas (do francês ao chinês!). Seu tempo e esforço são otimizados com um documento PDF dinâmico e pesquisável por palavras, que você, seus clientes ou sua organização podem usar e reutilizar sem limites.

Com foco em você, no seu negócio e nas suas necessidades de OCR, seja com recursos integrados ou sob demanda, a biblioteca IronOCR oferece suporte a uma ampla variedade de linguagens. Seu próximo projeto .NET estará livre de preocupações com compatibilidade de idiomas!

Seja árabe, espanhol, francês, alemão, hebraico, italiano, japonês, chinês simplificado, chinês tradicional (mandarim), dinamarquês, inglês, finlandês, português, russo, espanhol ou sueco, basta especificar os idiomas e nós os fornecemos! Você pode baixar os pacotes de idiomas de sua preferência ou entrar em contato com nosso suporte 24 horas por dia, 7 dias por semana, para obter mais idiomas.

O primeiro passo é usar nosso instalador de pacotes NuGet para Windows Visual Studio.

Baixar pacotes de idiomas
Advanced Image related to OCR no .NET Core

Processamento de imagens para leitura precisa de digitalizações imperfeitas

Como o IronOCR se diferencia de seus concorrentes? Além de permitir que você adicione facilmente funcionalidades de OCR, extraia texto e digitalize imagens rotacionadas, ele também tem a capacidade de realizar OCR a partir de digitalizações imperfeitas! Em contraste, muitos dos diversos produtos prontos para uso disponíveis no mercado atualmente são frequentemente rígidos e imprecisos, fadados ao fracasso em aplicações reais, sejam elas individuais ou corporativas, já que a maioria deles trabalha com texto impresso em alta resolução e perfeitamente alinhado.

O IronOCR amplia as capacidades do Google Tesseract com sua poderosa DLL IronTesseract — uma biblioteca OCR nativa em C# com estabilidade aprimorada e maior precisão do que a biblioteca gratuita Tesseract.

Prossiga sem preocupações - o IronOCR te dá toda a assistência necessária!

Com a melhor ferramenta em mãos, mesmo que você tenha uma imagem digitalizada com qualidade inferior ou uma imagem armazenada em sua pasta, a conversão da biblioteca de processamento de imagens do IronOCR remove ruídos, rotaciona, reduz distorções e desalinhamentos, além de melhorar a resolução e o contraste. As configurações avançadas de Reconhecimento Óptico de Caracteres (OCR) fornecem a você — o programador — as ferramentas e o código para gerar os melhores resultados de busca possíveis, sempre.

Pesquise as palavras que você precisa e nunca se decepcione com os resultados de 99,8 a 100% de precisão e o suporte ilimitado para documentos PDF, arquivos TIFF multiframe, JPEG e JPEG2000, GIF, PNG, BMP, WBMP, System.Drawing.Image, System.Drawing.Bitmap, System.IO.Streams de imagens, dados binários de imagem (byte[]) e muito mais!

Uma alternativa ao Tesseract
Fast And Polite Behavior related to OCR no .NET Core

Rápido e preciso — de PDFs digitalizados a imagens digitalizadas rotacionadas.

Ao contrário de outros aplicativos .NET no framework .NET, você descobrirá que o Reconhecimento Óptico de Caracteres (OCR) avançado, presente no console do gerenciador de pacotes e no console de texto reconhecido do IronOCR, permite que seus usuários leiam diversas fontes (de Times New Roman a qualquer fonte sofisticada ou supostamente difícil de entender), pesos e estilos para uma leitura precisa de texto em imagens inteiras ou digitalizadas. Nossa capacidade de selecionar áreas específicas de uma imagem ajuda a melhorar a velocidade e a precisão. O processamento multithread, de algumas linhas a alguns parágrafos, acelera o mecanismo de OCR e permite a leitura de vários documentos em máquinas com múltiplos núcleos.

Com desempenho comprovado do início ao fim.

Nossas alegações de velocidade e precisão não se limitam ao processo de reconhecimento de caracteres. Na verdade, as melhorias começam já na instalação, pois o mecanismo OCR .NET do IronOCR é uma biblioteca de software .NET completa, bem documentada e fácil de instalar. Há uma única instalação via gerenciador de pacotes NuGet para o Visual Studio, além de compatibilidade com multithreading em aplicações MVC, WebApp, Desktop, Console e Servidor.

Você pode alcançar uma precisão de OCR de 99,8 a 100% sem serviços web externos, taxas recorrentes ou a necessidade de enviar documentos confidenciais pela internet. Sem a complexidade da programação em C++, o IronOCR é a escolha ideal quando você precisa de suporte completo para OCR em PDFs, abrangendo múltiplos caracteres, palavras, linhas, parágrafos, textos e documentos.

Oferecemos as melhores opções para desenvolvedores que buscam aperfeiçoar sua programação, pois o IronOCR funciona imediatamente, sem necessidade de ajustes de desempenho ou modificações significativas nas imagens de entrada. A versão mais recente do IronOCR é incrivelmente rápida — até dez vezes mais rápida e com mais de 250% menos erros do que as versões anteriores. Atualizamos nossas próprias versões para atender aos seus objetivos, fornecendo a plataforma perfeita para OCR!

Veja a lista completa de funções.
Output Content related to OCR no .NET Core

Exporte os dados de resultados do OCR diretamente para seu aplicativo.

Mesmo em dispositivos móveis, nossa biblioteca OCR .NET perfeita permite que os desenvolvedores programem sem preocupações, pois o IronOCR suporta a exportação de conteúdo como um conjunto simples de texto direto e complexo, texto codificado por máquina, dados de código de barras ou dados de modelo de objeto estruturado. Você pode dividir o conteúdo em parágrafos, linhas, palavras, caracteres e resultados de strings de imagem para uso direto em seus aplicativos .NET.

Exporte facilmente para seu aplicativo e formatos de destino — XHTML, Documento Pesquisável, HOCR e HTML.

Do código-fonte ao resultado final, os dados gerados seriam inúteis se você não pudesse exportá-los para sua aplicação. O IronOCR entende isso e permite exportar o resultado do OCR para XHTML, possibilitando o trabalho com um formato consistente em uma ampla gama de aplicações e a integração com sites complexos, além de tempos de carregamento mais rápidos!

No entanto, o suporte não termina aí. A capacidade de exportar OCR para documentos PDF pesquisáveis facilita o armazenamento e a recuperação de documentos PDF sempre que necessário, tanto para você quanto para seus clientes e organizações! Isso é especialmente vantajoso quando você tem um contrato de 30 páginas que pode ser encontrado em seu banco de dados com algumas palavras-chave, além de permitir que sua empresa demonstre conformidade com as normas, visto que documentos PDF pesquisáveis são comprovadamente benéficos para pessoas com deficiência visual.

Além do exposto acima, você pode exportar seus resultados para o formato OCR que representa a saída do OCR, informações de layout e estilo, e incorporar as informações relacionadas em HTML padrão.

Saber mais
Suporta:
  • O .NET Framework 4.0 e versões superiores suportam C#, VB e F#.
  • Ícone do Microsoft Visual Studio .NET Development IDE
  • Suporte do instalador NuGet para Visual Studio
  • Compatível com o assistente de linguagem C# JetBrains ReSharper
  • Compatível com a plataforma de hospedagem Microsoft Azure C# .NET

Licenciamento e Preços

Licenças gratuitas para desenvolvimento comunitário. Licenças comerciais a partir de US$ 749.

Licenciamento da biblioteca Project C# + VB.NET

Projeto

Licenciamento de biblioteca para desenvolvedores C# + VB.NET

Desenvolvedor

Licenciamento de biblioteca C# + VB.NET para organização

Organização

Licenciamento de biblioteca C# + VB.NET para agências

Agência

Licenciamento de biblioteca SaaS C# + VB.NET

SaaS

Licenciamento de biblioteca OEM C# + VB.NET

OEM

Veja as opções completas de licença.  

Tutoriais de OCR da nossa comunidade .NET

.NET Tesseract OCR | IronOCR

C# Tesseract OCR

Jim Baker é engenheiro de desenvolvimento na Iron e trabalha no desenvolvimento do produto OCR.

Comparação entre IronOCR e Tesseract em .NET

Jim tem sido uma figura fundamental no desenvolvimento do IronOCR. Ele projeta e constrói algoritmos de processamento de imagem e métodos de leitura para OCR.

Veja a comparação.
Texto para Imagem em .NET | Tutorial

C# OCR ASP.NET

Gemma Beckford - Engenheira de Soluções da Microsoft

Texto a partir de imagens for .NET

Aprenda como a equipe de Gemma usa o IronOCR para ler texto de imagens para seu software de arquivamento. Gemma compartilha seus próprios exemplos de código.

Tutorial .NET de conversão de imagem em texto
Milhares de desenvolvedores usam o IronOcr para...

Sistemas de Contabilidade e Finanças

  • # Recibos
  • # Relatórios
  • # Impressão de faturas
Adicionar suporte a PDF em sistemas de contabilidade e finanças ASP.NET

Digitalização de Negócios

  • # Documentação
  • # Encomendas e Etiquetagem
  • # Substituição de papel
Casos de uso de digitalização de negócios em C#

Gestão de Conteúdo Empresarial

  • # Produção de Conteúdo
  • # Gestão de Documentos
  • # Distribuição de conteúdo
Suporte a PDF no .NET CMS

Aplicações de dados e relatórios

  • # Monitoramento de desempenho
  • # Mapeamento de tendências
  • # Relatórios
Relatórios em PDF em C#
Desenvolvedores de componentes .NET para empresas da Iron Software

Milhares de empresas, governos, PMEs e desenvolvedores confiam nos produtos de software da Iron.

A equipe da Iron possui mais de 10 anos de experiência no mercado de componentes de software .NET.

GE
Vireq
Foley
Equinor
Maravilha
Medcode
ANZ
Nehudus

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me