Ir para o conteúdo do rodapé

Pré-processamento

Melhore a entrada de dados a partir de digitalizações e fotos de baixa qualidade. Use nossos filtros de pré-processamento para limpar, endireitar e aprimorar imagens complexas, obtendo a máxima precisão do OCR.

Icon Main related to Pré-processamento
Filtros de correção de cor de entrada

1

Binarizado

Binarize facilmente sua entrada diretamente no IronOCR, transformando imagens em versões nítidas em preto e branco. Este filtro isola o texto de fundos complexos com eficácia, reduzindo o ruído e tornando a extração de texto mais fácil e confiável.

Aprenda como: Corrigir as cores da imagem para leitura em .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply binarize affect
imageInput.Binarize();

// Export the modified image
imageInput.SaveAsImages("binarize.jpg");
C#
2

Escala de cinza

Converter uma imagem colorida em tons de cinza é uma etapa crucial na preparação de imagens para filtros de pré-processamento mais avançados.

Aprenda como: Corrigir as cores da imagem para leitura em .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply grayscale affect
imageInput.ToGrayScale();

// Export the modified image
imageInput.SaveAsImages("grayscale.jpg");
C#
3

Alterar cores dos pixels

Substitua intervalos de cores específicos em uma imagem, permitindo remover marcas d'água, fundos coloridos ou outros elementos que distraiam a atenção antes do OCR.

Aprenda como: Corrigir as cores da imagem para leitura em .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
IronSoftware.Drawing.Color currentColor = new IronSoftware.Drawing.Color("#DB645C");
IronSoftware.Drawing.Color newColor = IronSoftware.Drawing.Color.DarkCyan;

// Replace color
imageInput.ReplaceColor(currentColor, newColor, 80);

// Export the modified image
imageInput.SaveAsImages("replaceColor");
C#

Icon Main related to Pré-processamento
Operações Morfológicas de Entrada

1

Dilata

Aumentar a espessura dos caracteres em uma imagem pode ajudar a conectar linhas quebradas no texto e melhorar o reconhecimento de fontes tênues ou finas.

Aprenda como: Corrigir imagens usando filtros para leitura
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply Dilate filter
imageInput.Dilate();

// Export filtered image
imageInput.SaveAsImages("dilate.jpg");
C#
2

Erosão

Afina os caracteres em uma imagem, o que é útil para separar caracteres que estão se tocando ou se misturando.

Aprenda como: Corrigir imagens usando filtros para leitura
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply Erode filter
imageInput.Erode();

// Export filtered image
imageInput.SaveAsImages("erode.jpg");
C#
3

Alterar cores dos pixels

Substitua intervalos de cores específicos em uma imagem, permitindo remover marcas d'água, fundos coloridos ou outros elementos que distraiam a atenção antes do OCR.

Aprenda como: Corrigir as cores da imagem para leitura em .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
IronSoftware.Drawing.Color currentColor = new IronSoftware.Drawing.Color("#DB645C");
IronSoftware.Drawing.Color newColor = IronSoftware.Drawing.Color.DarkCyan;

// Replace color
imageInput.ReplaceColor(currentColor, newColor, 80);

// Export the modified image
imageInput.SaveAsImages("replaceColor");
C#

Icon Main related to Pré-processamento
Manipulação da orientação de entrada

1

Mesa

Detecta e corrige automaticamente imagens desalinhadas ou inclinadas, melhorando drasticamente a precisão do OCR em digitalizações imperfeitas.

Aprenda como: Corrigir a orientação da imagem para leitura em .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Apply Deskew filter
imageInput.Deskew();
C#
2

Girar

Rotacione as imagens programaticamente em qualquer ângulo para garantir que o texto esteja corretamente orientado para o mecanismo de OCR.

Aprenda como: Corrigir a orientação da imagem para leitura em .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Rotate the image 180 degrees clockwise
imageInput.Rotate(180);

// Export the modified image
imageInput.SaveAsImages("rotate");
C#
3

Detectar orientação

Determina automaticamente a orientação da página (0, 90, 180, 270 graus), útil para a correção de orientação antes do OCR. Garante alta precisão mesmo quando os documentos são digitalizados de cabeça para baixo.

Aprenda como: Detectar a rotação da página
using IronOcr;

using var input = new OcrInput();

// Load PDF document
input.LoadPdf("Clockwise90.pdf");

// Detect page rotation
var results = input.DetectPageOrientation();

// Ouput result
foreach(var result in results)
{
    Console.WriteLine(result.PageNumber);
    Console.WriteLine(result.HighConfidence);
    Console.WriteLine(result.RotationAngle);
}
C#

Icon Main related to Pré-processamento
Controle de resolução de entrada

1

Escala

Redimensione uma imagem para uma resolução ideal para OCR, aumentando significativamente a precisão em arquivos de origem de baixa resolução.

Aprenda como: Corrigir a orientação da imagem para leitura em .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Apply scale
imageInput.Scale(70);

// Export the modified image
imageInput.SaveAsImages("rotate");
C#
2

Configuração de DPI

Defina manualmente a resolução (DPI) para imagens de baixa resolução ou digitalizações onde faltam metadados. Fornecer um valor de DPI orienta o mecanismo de OCR e aumenta significativamente a qualidade do reconhecimento.

Aprenda como: C# Tesseract Image DPI
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.TargetDPI = 300;
ocrInput.LoadImage(@"images\image.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
3

Resolução aprimorada

Melhorar algoritmicamente a nitidez e a clareza de imagens de baixa resolução para recuperar textos de entradas desfocadas ou pixelizadas.

Aprenda como: Corrigir imagens usando filtros para leitura
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply enhance resolution filter
imageInput.EnhanceResolution();

// Export filtered image
imageInput.SaveAsImages("sharpen.jpg");
C#
4

Assistente de filtro

Aplique uma sequência selecionada de filtros de pré-processamento usando um único método inteligente. O Assistente de Filtros analisa automaticamente a imagem de entrada e aplica uma sequência ideal de correções para obter os melhores resultados de OCR possíveis.

Aprenda como usar o Assistente de Filtro :
using IronOcr;

var ocrTesseract = new IronTesseract();

// WIZARD - If you are unsure which filters to use,
// use the debug-wizard to test all combinations:
string codeToRun = OcrInputFilterWizard.Run(@"images\image.png", out double confidence, ocrTesseract);
Console.WriteLine($"Confidence: {confidence}");
Console.WriteLine(codeToRun);
C#
5

OCR de uma região de uma imagem

Economize tempo de processamento direcionando apenas a área específica de uma imagem que contém texto. Basta definir uma região retangular para isolar e extrair texto de formulários, tabelas ou fundos complexos.

Aprenda como: Realizar OCR com Tesseract em uma área específica de uma imagem usando C#
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var ContentArea = new Rectangle(x: 215, y: 1250, width: 1335, height: 280);
ocrInput.LoadImage("img/example.png", ContentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
Pronto para começar?
Nuget Downloads 5,525,971 | Versão: 2026.3 acaba de ser lançado
Still Scrolling Icon

Ainda está rolando a tela?

Quer provas rápidas? PM > Install-Package IronOcr
executar um exemplo Veja sua imagem se transformar em texto pesquisável.

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me