Saltar al pie de página

Preprocesamiento

Mejore la entrada de escaneos y fotos de baja calidad. Use nuestros filtros de preprocesamiento para limpiar, enderezar y mejorar imágenes difíciles para máxima precisión de OCR.

Icon Main related to Preprocesamiento
Filtros de corrección del color de entrada

1

Binarizado

Binarice fácilmente su entrada directamente dentro de IronOCR, transformando imágenes en versiones nítidas en blanco y negro. Este filtro aísla eficazmente el texto de fondos complejos, reduciendo el ruido y haciendo que la extracción de texto sea más fácil y fiable.

Aprenda a:Fijar colores de imagen para lectura en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply binarize affect
imageInput.Binarize();

// Export the modified image
imageInput.SaveAsImages("binarize.jpg");
C#
2

Escala de grises

Convertir una imagen en color a escala de grises: un paso crucial en la preparación de imágenes para filtros de preprocesamiento más avanzados.

Aprenda a:Fijar colores de imagen para lectura en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply grayscale affect
imageInput.ToGrayScale();

// Export the modified image
imageInput.SaveAsImages("grayscale.jpg");
C#
3

Cambiar los colores de los píxeles

Reemplaza gamas de color específicas en una imagen, lo que permite eliminar marcas de agua, fondos de color u otros elementos que distraigan la atención antes del OCR.

Aprenda a:Fijar colores de imagen para lectura en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
IronSoftware.Drawing.Color currentColor = new IronSoftware.Drawing.Color("#DB645C");
IronSoftware.Drawing.Color newColor = IronSoftware.Drawing.Color.DarkCyan;

// Replace color
imageInput.ReplaceColor(currentColor, newColor, 80);

// Export the modified image
imageInput.SaveAsImages("replaceColor");
C#

Icon Main related to Preprocesamiento
Operaciones morfológicas de entrada

1

Dilata

Aumentar el grosor de los caracteres de una imagen, lo que puede ayudar a conectar líneas discontinuas en el texto y mejorar el reconocimiento de fuentes débiles o finas.

Aprenda a:Corregir la imagen utilizando filtros para leer
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply Dilate filter
imageInput.Dilate();

// Export filtered image
imageInput.SaveAsImages("dilate.jpg");
C#
2

Erodes

Adelgaza los caracteres de una imagen, útil para separar caracteres que se tocan o sangran juntos.

Aprenda a:Corregir la imagen utilizando filtros para leer
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply Erode filter
imageInput.Erode();

// Export filtered image
imageInput.SaveAsImages("erode.jpg");
C#
3

Cambiar los colores de los píxeles

Reemplaza gamas de color específicas en una imagen, lo que permite eliminar marcas de agua, fondos de color u otros elementos que distraigan la atención antes del OCR.

Aprenda a:Fijar colores de imagen para lectura en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
IronSoftware.Drawing.Color currentColor = new IronSoftware.Drawing.Color("#DB645C");
IronSoftware.Drawing.Color newColor = IronSoftware.Drawing.Color.DarkCyan;

// Replace color
imageInput.ReplaceColor(currentColor, newColor, 80);

// Export the modified image
imageInput.SaveAsImages("replaceColor");
C#

Icon Main related to Preprocesamiento
Manipulación de la orientación de entrada

1

Deskew

Detecta y endereza automáticamente imágenes torcidas o inclinadas, mejorando drásticamente la precisión del OCR en escaneados imperfectos.

Aprenda a:Corregir la orientación de la imagen para la lectura en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Apply Deskew filter
imageInput.Deskew();
C#
2

Gire

Gira las imágenes de forma programática en cualquier grado para garantizar que el texto esté correctamente orientado para el motor de OCR.

Aprenda a:Corregir la orientación de la imagen para la lectura en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Rotate the image 180 degrees clockwise
imageInput.Rotate(180);

// Export the modified image
imageInput.SaveAsImages("rotate");
C#
3

Detectar orientación

Determina automáticamente la orientación de la página (0, 90, 180, 270 grados), útil para la corrección de la orientación antes del OCR. Garantiza una alta precisión incluso cuando los documentos se escanean al revés.

Aprenda a:Detectar la rotación de página
using IronOcr;

using var input = new OcrInput();

// Load PDF document
input.LoadPdf("Clockwise90.pdf");

// Detect page rotation
var results = input.DetectPageOrientation();

// Ouput result
foreach(var result in results)
{
    Console.WriteLine(result.PageNumber);
    Console.WriteLine(result.HighConfidence);
    Console.WriteLine(result.RotationAngle);
}
C#

Icon Main related to Preprocesamiento
Control de la resolución de entrada

1

Escala

Cambia el tamaño de una imagen a una resolución óptima para el OCR, aumentando significativamente la precisión en archivos de origen de baja resolución.

Aprenda a:Corregir la orientación de la imagen para la lectura en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Apply scale
imageInput.Scale(70);

// Export the modified image
imageInput.SaveAsImages("rotate");
C#
2

Configuración de PPP

Establezca manualmente los puntos por pulgada (PPP) para imágenes de baja resolución o escaneados en los que falten metadatos. Proporcionar un valor de PPP guía al motor de OCR y aumenta significativamente la calidad del reconocimiento.

Aprenda a:C# Tesseract Image DPI
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.TargetDPI = 300;
ocrInput.LoadImage(@"images\image.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
3

Resolución mejorada

Mejorar algorítmicamente la nitidez y claridad de imágenes de baja resolución para rescatar texto de entradas borrosas o pixeladas.

Aprenda a:Corregir la imagen utilizando filtros para leer
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply enhance resolution filter
imageInput.EnhanceResolution();

// Export filtered image
imageInput.SaveAsImages("sharpen.jpg");
C#
4

Asistente de Filtro

Aplique una cadena curada de filtros de preprocesamiento utilizando un método único e inteligente. El Asistente para filtros analiza automáticamente la imagen de entrada y aplica una secuencia óptima de correcciones para lograr los mejores resultados de OCR posibles.

Aprenda a:Asistente de filtrado
using IronOcr;

var ocrTesseract = new IronTesseract();

// WIZARD - If you are unsure which filters to use,
// use the debug-wizard to test all combinations:
string codeToRun = OcrInputFilterWizard.Run(@"images\image.png", out double confidence, ocrTesseract);
Console.WriteLine($"Confidence: {confidence}");
Console.WriteLine(codeToRun);
C#
5

OCR de una región de una imagen

Ahorre tiempo de procesamiento seleccionando únicamente el área específica de una imagen que contiene texto. Basta con definir una región rectangular para aislar y extraer texto de formularios, tablas o fondos desordenados.

Aprenda a:Tesseract OCR Specifc Area of an Image in C#
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var ContentArea = new Rectangle(x: 215, y: 1250, width: 1335, height: 280);
ocrInput.LoadImage("img/example.png", ContentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
¿Listo para empezar?
Nuget Descargas 5,167,857 | Version: 2025.11 recién lanzado