Cómo utilizar el asistente de filtrado en C# para un mejor OCR

Actualizado:14 de diciembre de 2025

Translated

View the article in English

El asistente de filtros de IronOCR prueba automáticamente todas las combinaciones de filtros de preprocesamiento en su imagen para encontrar los ajustes óptimos de OCR, devolviendo tanto la puntuación de confianza más alta como el código C# exacto necesario para reproducir los resultados.

El preprocesamiento de imágenes para OCR puede resultar complicado. Los filtros múltiples pueden mejorar el reconocimiento, pero encontrar la combinación adecuada requiere mucho ensayo y error. Cada imagen presenta retos únicos, lo que hace que las pruebas manuales lleven mucho tiempo. Esto es especialmente cierto cuando se trabaja con escaneos de baja calidad o imágenes con distintos niveles de ruido y distorsión.

El OcrInputFilterWizard de IronOCR resuelve este problema. El Asistente para filtros evalúa automáticamente las combinaciones de filtros para maximizar la confianza y la precisión del OCR. Realiza pruebas exhaustivas para encontrar la configuración óptima y devuelve la mejor combinación de filtros como un fragmento de código, lo que permite reproducir fácilmente los resultados. Esta función se integra perfectamente con la clase OcrInput, simplificando la aplicación de filtros a sus imágenes.

Esta guía muestra cómo funciona el Asistente para filtros y expone los fragmentos de código y los parámetros que utiliza. Para obtener más información sobre la optimización del flujo de trabajo de OCR, consulta nuestra guía sobre corrección de la calidad de imagen.

Inicio rápido: Descubre automáticamente tu cadena de filtros de imagen ideal

Utilice el asistente de filtros de IronOCR para probar todas las combinaciones de filtros de preprocesamiento y obtener el fragmento de código de mejor rendimiento. Una línea devuelve su puntuación de confianza más alta y la cadena de filtros exacta de C# para imágenes similares.

Instalar IronOCR con el gestor de paquetes NuGet

PM > Install-Package IronOcr

Copie y ejecute este fragmento de código.

string code = OcrInputFilterWizard.Run("image.png", out double confidence, new IronTesseract());

Despliegue para probar en su entorno real

Empieza a utilizar IronOCR en tu proyecto hoy mismo con una prueba gratuita

Prueba gratuita de 30 días

### Flujo de trabajo mínimo (5 pasos)

Descargue una biblioteca de C# para usar el asistente de filtros
Crear una instancia del motor IronTesseract
Cargue la imagen de entrada en OcrInputFilterWizard
Run el asistente de filtros y revise los resultados, como la confianza
Utilice el código proporcionado y aplíquelo a la imagen de entrada y verifique los resultados.

¿Cómo funciona el Asistente para filtros?

El método OcrInputFilterWizard.Run toma tres parámetros: la imagen de entrada, un parámetro de salida para el nivel de confianza resultante y la instancia del motor Tesseract. Para el control avanzado del motor, consulte nuestra guía sobre Configuración detallada de Teseract.

Prueba múltiples combinaciones de filtros de preprocesamiento para lograr la mejor puntuación de confianza. La puntuación de confianza más alta determina qué conjunto de filtros aplicar a la imagen de entrada. Este enfoque funciona eficazmente con imágenes difíciles que requieren corrección de la orientación de la imagen u otros pasos complejos de preprocesamiento.

El asistente de filtros no tiene preajustes ni límites de combinación. Se centra en lograr la mejor puntuación de confianza posible mediante pruebas de filtrado exhaustivas. Para obtener información en tiempo real durante el procesamiento, implemente seguimiento del progreso para supervisar las operaciones del asistente.

Filtros disponibles en pruebas combinadas:

input.Contrast() - Ajusta el contraste para mayor claridad del texto
input.Sharpen() - Mejora la definición de los bordes
input.Binarize() - Convierte a blanco y negro
input.ToGrayScale() - Elimina la información de color
input.Invert() - Invierte los colores
input.Deskew() - Corrige texto torcido
input.Scale(...) - Cambia el tamaño a las dimensiones óptimas
input.Denoise() - Elimina el ruido de píxeles
input.DeepCleanBackgroundNoise() - Eliminación avanzada de ruido
input.EnhanceResolution() - Mejora la resolución de baja calidad
input.Dilate(), input.Erode() - Operaciones de refinamiento de texto

Para obtener información detallada sobre filtros, consulte este tutorial sobre filtros de imagen. Encontrará más técnicas de preprocesamiento en la guía filtros de corrección de imágenes.

Este método de prueba exhaustiva requiere tiempo de procesamiento. Para operaciones a gran escala, utilice soporte multihilo para procesar varias imágenes simultáneamente.

¿Qué tipo de imagen debo utilizar para las pruebas?

Este ejemplo utiliza una captura de pantalla con mucho ruido artificial para demostrar la funcionalidad del asistente de filtros. El Asistente para filtros maneja con eficacia diversos tipos de imágenes, desde documentos escaneados hasta fotos con texto.

A la hora de seleccionar imágenes de prueba, tenga en cuenta estos factores:

Resolución de la imagen: Las imágenes con un mayor número de PPP suelen dar mejores resultados. Consulte nuestra guía sobre Configuración del DPI para obtener consejos de optimización.
Tipo de documento: Los distintos tipos de documentos se benefician de combinaciones de filtros específicas. Los documentos de identidad pueden requerir un preprocesamiento diferente al de los documentos de texto estándar.
Calidad de la fuente: El Asistente para filtros destaca con imágenes problemáticas, pero comienza con la fuente de mayor calidad disponible siempre que sea posible.

¿Cómo puedo ejecutar el asistente de filtrado en mi código?

:path=/static-assets/ocr/content-code-examples/how-to/filter-wizard-process.cs

using IronOcr;
using System;

// Initialize the Tesseract engine
var ocr = new IronTesseract();

// 1. Pass the image path ("noise.png").
// 2. Pass an 'out' variable to store the best confidence score found.
// 3. Pass the tesseract instance to be used for testing.
string codeToRun = OcrInputFilterWizard.Run("noise.png", out double confidence, ocr);

// The 'confidence' variable is now populated with the highest score achieved.
Console.WriteLine($"Best Confidence Score: {confidence}");

// 'codeToRun' holds the exact C# code snippet that achieved this score.
// The returned string is the code you can use to filter similar images.
Console.WriteLine("Recommended Filter Code:");
Console.WriteLine(codeToRun);

Imports IronOcr
Imports System

' Initialize the Tesseract engine
Dim ocr As New IronTesseract()

' 1. Pass the image path ("noise.png").
' 2. Pass an 'out' variable to store the best confidence score found.
' 3. Pass the tesseract instance to be used for testing.
Dim confidence As Double
Dim codeToRun As String = OcrInputFilterWizard.Run("noise.png", confidence, ocr)

' The 'confidence' variable is now populated with the highest score achieved.
Console.WriteLine($"Best Confidence Score: {confidence}")

' 'codeToRun' holds the exact C# code snippet that achieved this score.
' The returned string is the code you can use to filter similar images.
Console.WriteLine("Recommended Filter Code:")
Console.WriteLine(codeToRun)

$vbLabelText $csharpLabel

El asistente de filtrado procesa varios formatos de entrada. Para obtener información sobre los formatos compatibles, consulte nuestra guía sobre imágenes de entrada. También puede procesar archivos PDF o trabajar directamente con streams para fuentes de imágenes dinámicas.

Para situaciones de procesamiento por lotes, considere este ejemplo ampliado:

/* :path=/static-assets/ocr/content-code-examples/how-to/filter-wizard-batch.cs */
using IronOcr;
using System;
using System.IO;

// Process multiple similar images
var ocr = new IronTesseract();
string[] imageFiles = Directory.GetFiles(@"C:\Images", "*.png");

// Run Filter Wizard on first image to discover optimal settings
string optimalCode = OcrInputFilterWizard.Run(imageFiles[0], out double baselineConfidence, ocr);
Console.WriteLine($"Baseline confidence: {baselineConfidence:P2}");
Console.WriteLine($"Optimal filter sequence discovered");

// Apply discovered filters to all images
foreach (string imagePath in imageFiles)
{
    using (var input = new OcrImageInput(imagePath))
    {
        // Apply the filter sequence discovered by the wizard
        // The actual filters would be applied here based on the wizard output
        var result = ocr.Read(input);
        Console.WriteLine($"Processed: {Path.GetFileName(imagePath)} - Confidence: {result.Confidence:P2}");
    }
}

/* :path=/static-assets/ocr/content-code-examples/how-to/filter-wizard-batch.cs */
using IronOcr;
using System;
using System.IO;

// Process multiple similar images
var ocr = new IronTesseract();
string[] imageFiles = Directory.GetFiles(@"C:\Images", "*.png");

// Run Filter Wizard on first image to discover optimal settings
string optimalCode = OcrInputFilterWizard.Run(imageFiles[0], out double baselineConfidence, ocr);
Console.WriteLine($"Baseline confidence: {baselineConfidence:P2}");
Console.WriteLine($"Optimal filter sequence discovered");

// Apply discovered filters to all images
foreach (string imagePath in imageFiles)
{
    using (var input = new OcrImageInput(imagePath))
    {
        // Apply the filter sequence discovered by the wizard
        // The actual filters would be applied here based on the wizard output
        var result = ocr.Read(input);
        Console.WriteLine($"Processed: {Path.GetFileName(imagePath)} - Confidence: {result.Confidence:P2}");
    }
}

Imports IronOcr
Imports System
Imports System.IO

' Process multiple similar images
Dim ocr As New IronTesseract()
Dim imageFiles As String() = Directory.GetFiles("C:\Images", "*.png")

' Run Filter Wizard on first image to discover optimal settings
Dim baselineConfidence As Double
Dim optimalCode As String = OcrInputFilterWizard.Run(imageFiles(0), baselineConfidence, ocr)
Console.WriteLine($"Baseline confidence: {baselineConfidence:P2}")
Console.WriteLine("Optimal filter sequence discovered")

' Apply discovered filters to all images
For Each imagePath As String In imageFiles
    Using input As New OcrImageInput(imagePath)
        ' Apply the filter sequence discovered by the wizard
        ' The actual filters would be applied here based on the wizard output
        Dim result = ocr.Read(input)
        Console.WriteLine($"Processed: {Path.GetFileName(imagePath)} - Confidence: {result.Confidence:P2}")
    End Using
Next

$vbLabelText $csharpLabel

¿Qué resultados arrojará el asistente de filtrado?

El resultado del asistente de filtrado muestra un 65% de confianza como el mejor resultado posible para esta imagen en concreto. Las puntuaciones de confianza son métricas cruciales para evaluar la precisión del OCR. Más información sobre confianza en los resultados en nuestra guía específica.

La imagen de entrada contiene una distorsión extrema y ruido artificial. Esto demuestra las capacidades del Asistente de filtro en situaciones difíciles. Para el uso en producción, comience con imágenes de origen de mayor calidad siempre que sea posible.

El fragmento de código generado proporciona:

Secuencia exacta de filtrado: el orden de las operaciones importa para obtener resultados óptimos
Encadenamiento de métodos: Código limpio, legible y fácil de implementar
Sin parámetros que adivinar: Cada filtro está configurado para obtener el mejor rendimiento

¿Cómo aplico la combinación de filtros recomendada?

Después de ejecutar el asistente de filtrado, aplica los ajustes del fragmento de código proporcionado a tu imagen de entrada para verificar los resultados y la confianza. Esto garantiza resultados reproducibles en imágenes similares en su proceso de procesamiento de documentos.

¿Cómo implementar el código recomendado?

:path=/static-assets/ocr/content-code-examples/how-to/filter-wizard-best-combination.cs

using IronOcr;
using System;

// Initialize the Tesseract engine
var ocrTesseract = new IronTesseract();

// Load the image into an OcrInput object
using (var input = new OcrImageInput("noise.png"))
{
    // Apply the exact filter chain recommended by the Wizard's output
    input.Invert();
    input.DeNoise();
    input.Contrast();
    input.AdaptiveThreshold();

    // Run OCR on the pre-processed image
    OcrResult result = ocrTesseract.Read(input);

    // Print the final result and confidence
    Console.WriteLine($"Result: {result.Text}");
    Console.WriteLine($"Confidence: {result.Confidence}");
}

Imports IronOcr
Imports System

' Initialize the Tesseract engine
Dim ocrTesseract As New IronTesseract()

' Load the image into an OcrInput object
Using input As New OcrImageInput("noise.png")
    ' Apply the exact filter chain recommended by the Wizard's output
    input.Invert()
    input.DeNoise()
    input.Contrast()
    input.AdaptiveThreshold()

    ' Run OCR on the pre-processed image
    Dim result As OcrResult = ocrTesseract.Read(input)

    ' Print the final result and confidence
    Console.WriteLine($"Result: {result.Text}")
    Console.WriteLine($"Confidence: {result.Confidence}")
End Using

$vbLabelText $csharpLabel

El orden de aplicación de los filtros es muy importante. El Asistente para filtros determina tanto los filtros que deben utilizarse como su secuencia óptima. Esta secuenciación inteligente hace que el Asistente para filtros sea valioso para escenarios de preprocesamiento complejos.

Para mejorar el control sobre el proceso de OCR, considere la posibilidad de implementar la gestión y validación de errores:

/* :path=/static-assets/ocr/content-code-examples/how-to/filter-wizard-validation.cs */
using IronOcr;
using System;

var ocrEngine = new IronTesseract();

try
{
    using (var input = new OcrImageInput(@"C:\Images\document.png"))
    {
        // Apply Filter Wizard recommended sequence
        input.Invert();
        input.DeNoise();
        input.Contrast();
        input.AdaptiveThreshold();

        // Configure additional OCR settings
        ocrEngine.Configuration.ReadBarCodes = false;
        ocrEngine.Configuration.RenderSearchablePdf = true;

        // Perform OCR with timeout protection
        var result = ocrEngine.Read(input);

        // Validate results
        if (result.Confidence >= 0.6)
        {
            Console.WriteLine("OCR successful with high confidence");
            // Process the extracted text
        }
        else
        {
            Console.WriteLine("Low confidence result - consider manual review");
        }
    }
}
catch (Exception ex)
{
    Console.WriteLine($"OCR processing error: {ex.Message}");
}

/* :path=/static-assets/ocr/content-code-examples/how-to/filter-wizard-validation.cs */
using IronOcr;
using System;

var ocrEngine = new IronTesseract();

try
{
    using (var input = new OcrImageInput(@"C:\Images\document.png"))
    {
        // Apply Filter Wizard recommended sequence
        input.Invert();
        input.DeNoise();
        input.Contrast();
        input.AdaptiveThreshold();

        // Configure additional OCR settings
        ocrEngine.Configuration.ReadBarCodes = false;
        ocrEngine.Configuration.RenderSearchablePdf = true;

        // Perform OCR with timeout protection
        var result = ocrEngine.Read(input);

        // Validate results
        if (result.Confidence >= 0.6)
        {
            Console.WriteLine("OCR successful with high confidence");
            // Process the extracted text
        }
        else
        {
            Console.WriteLine("Low confidence result - consider manual review");
        }
    }
}
catch (Exception ex)
{
    Console.WriteLine($"OCR processing error: {ex.Message}");
}

Imports IronOcr
Imports System

Dim ocrEngine As New IronTesseract()

Try
    Using input As New OcrImageInput("C:\Images\document.png")
        ' Apply Filter Wizard recommended sequence
        input.Invert()
        input.DeNoise()
        input.Contrast()
        input.AdaptiveThreshold()

        ' Configure additional OCR settings
        ocrEngine.Configuration.ReadBarCodes = False
        ocrEngine.Configuration.RenderSearchablePdf = True

        ' Perform OCR with timeout protection
        Dim result = ocrEngine.Read(input)

        ' Validate results
        If result.Confidence >= 0.6 Then
            Console.WriteLine("OCR successful with high confidence")
            ' Process the extracted text
        Else
            Console.WriteLine("Low confidence result - consider manual review")
        End If
    End Using
Catch ex As Exception
    Console.WriteLine($"OCR processing error: {ex.Message}")
End Try

$vbLabelText $csharpLabel

¿Cuáles son los resultados finales del OCR tras aplicar los filtros?

IronOCR extrae la mayor parte del texto incluso en condiciones de gran distorsión. El nivel de confianza coincide con el informe del asistente de filtrado. Para obtener información detallada sobre el tratamiento de los resultados del OCR, consulte nuestra guía sobre salida de datos.

¿Qué consejos avanzados de uso debo tener en cuenta?

Tenga en cuenta estas prácticas recomendadas cuando utilice el Asistente para filtros en producción:

Procesamiento por lotes: Pruebe en muestras representativas y, a continuación, aplique la cadena de filtros a imágenes similares.
Optimización del rendimiento: El Asistente para filtros es minucioso pero requiere mucho tiempo. Para obtener un OCR más rápido, consulte configuración de OCR rápido.
Soporte para idiomas personalizados: Para textos que no sean en inglés, explore múltiples idiomas para optimizar el reconocimiento.
Integración de API: Visite nuestra Referencia API para obtener documentación completa.
Optimización específica del documento: Los distintos tipos de documentos se benefician de enfoques especializados:
- Para los formularios, considere leer tablas
- Para contenido mixto, active lectura de códigos de barras
- Para documentos de varias páginas, explore procesamiento TIFF
Gestión de memoria: Disponer correctamente de los objetos OcrInput utilizando la sentencia using.
Recuperación de errores: Implementar estrategias de emergencia para resultados de baja confianza. Considere la revisión manual de los documentos críticos.

El asistente de filtrado proporciona un potente descubrimiento automatizado de preprocesamiento para obtener resultados óptimos de OCR. Al encontrar automáticamente la mejor canalización de preprocesamiento para sus imágenes específicas, elimina las conjeturas de la preparación de imágenes y garantiza una extracción de texto coherente y de alta calidad en todas sus aplicaciones.

Preguntas Frecuentes

¿Qué es el Asistente para filtros OCR y cómo ayuda en el preprocesamiento de imágenes?

El asistente de filtros de IronOCR es una herramienta automatizada que prueba todas las combinaciones posibles de filtros de preprocesamiento en su imagen para encontrar los ajustes óptimos de OCR. Elimina el proceso manual de prueba y error al evaluar automáticamente varias combinaciones de filtros para maximizar la confianza y precisión del OCR, y luego devuelve la mejor combinación de filtros como un fragmento de código C# listo para usar.

¿Cómo puedo utilizar el Asistente para filtros en mi aplicación de C#?

Usar el Asistente de Filtrado de IronOCR es simple - simplemente llame a OcrInputFilterWizard.Run() con la ruta de su imagen, un parámetro de salida para la puntuación de confianza, y una instancia de IronTesseract. Por ejemplo: string code = OcrInputFilterWizard.Run("image.png", out double confidence, new IronTesseract());

¿Qué parámetros acepta el método OcrInputFilterWizard.Run?

El método OcrInputFilterWizard.Run en IronOCR toma tres parámetros: la imagen de entrada (como una ruta de archivo), un parámetro de salida que devuelve el nivel de confianza resultante, y una instancia del motor IronTesseract para el procesamiento.

¿Por qué debería utilizar el Asistente para filtros en lugar de probar los filtros manualmente?

Las pruebas manuales de filtros de preprocesamiento llevan mucho tiempo y suponen un reto, especialmente con exploraciones de baja calidad o imágenes con niveles de ruido variables. El asistente de filtros de IronOCR automatiza este proceso probando exhaustivamente las combinaciones de filtros y devolviendo la puntuación de confianza más alta con el código C# exacto necesario, lo que ahorra un tiempo de desarrollo considerable.

¿Cómo determina el Asistente para filtros la mejor combinación de filtros?

El asistente de filtros de IronOCR prueba múltiples combinaciones de filtros de preprocesamiento en su imagen y mide la puntuación de confianza de OCR para cada combinación. A continuación, selecciona el conjunto de filtros que obtiene la puntuación de confianza más alta y devuelve esta combinación óptima como código C# ejecutable.

¿Puede funcionar el Asistente para filtros con imágenes de baja calidad o con ruido?

Sí, el asistente de filtrado de IronOCR es especialmente eficaz con imágenes difíciles, como escaneados de baja calidad e imágenes con distintos niveles de ruido y distorsión. Encuentra automáticamente la combinación óptima de preprocesamiento para maximizar la precisión del OCR incluso con material de origen difícil.

Curtis Chau

Chatea con el equipo de ingeniería ahora

Escritor Técnico

Curtis Chau tiene una licenciatura en Ciencias de la Computación (Carleton University) y se especializa en el desarrollo front-end con experiencia en Node.js, TypeScript, JavaScript y React. Apasionado por crear interfaces de usuario intuitivas y estéticamente agradables, disfruta trabajando con frameworks modernos y creando manuales bien ...

¿Listo para empezar?

Nuget Descargas 5,384,824 | Versión: 2026.2 recién lanzado

Ver Licencias

Destacado del Cliente:

Enfoque del Desarrollador:

Webinars:

Comenzar prueba gratuita de 30 días

En esta página

Cómo utilizar el asistente de filtrado en C# para un mejor OCR

Empieza a crear PDF con NuGet ahora:

Instalar IronOCR con el gestor de paquetes NuGet

Copie y ejecute este fragmento de código.

Despliegue para probar en su entorno real

¿Cómo funciona el Asistente para filtros?

¿Qué tipo de imagen debo utilizar para las pruebas?

¿Cómo puedo ejecutar el asistente de filtrado en mi código?

¿Qué resultados arrojará el asistente de filtrado?

¿Cómo aplico la combinación de filtros recomendada?

¿Cómo implementar el código recomendado?

¿Cuáles son los resultados finales del OCR tras aplicar los filtros?

¿Qué consejos avanzados de uso debo tener en cuenta?

Preguntas Frecuentes

¿Qué es el Asistente para filtros OCR y cómo ayuda en el preprocesamiento de imágenes?

¿Cómo puedo utilizar el Asistente para filtros en mi aplicación de C#?

¿Qué parámetros acepta el método OcrInputFilterWizard.Run?

¿Por qué debería utilizar el Asistente para filtros en lugar de probar los filtros manualmente?

¿Cómo determina el Asistente para filtros la mejor combinación de filtros?

¿Puede funcionar el Asistente para filtros con imágenes de baja calidad o con ruido?

Comenzar prueba gratuita de 30 días

En esta página

Cómo utilizar el asistente de filtrado en C# para un mejor OCR

Empieza a crear PDF con NuGet ahora:

Instalar IronOCR con el gestor de paquetes NuGet

Copie y ejecute este fragmento de código.

Despliegue para probar en su entorno real

¿Cómo funciona el Asistente para filtros?

¿Qué tipo de imagen debo utilizar para las pruebas?

¿Cómo puedo ejecutar el asistente de filtrado en mi código?

¿Qué resultados arrojará el asistente de filtrado?

¿Cómo aplico la combinación de filtros recomendada?

¿Cómo implementar el código recomendado?

¿Cuáles son los resultados finales del OCR tras aplicar los filtros?

¿Qué consejos avanzados de uso debo tener en cuenta?

Preguntas Frecuentes

¿Qué es el Asistente para filtros OCR y cómo ayuda en el preprocesamiento de imágenes?

¿Cómo puedo utilizar el Asistente para filtros en mi aplicación de C#?

¿Qué parámetros acepta el método OcrInputFilterWizard.Run?

¿Por qué debería utilizar el Asistente para filtros en lugar de probar los filtros manualmente?

¿Cómo determina el Asistente para filtros la mejor combinación de filtros?

¿Puede funcionar el Asistente para filtros con imágenes de baja calidad o con ruido?

Próximo paso: Comenzar prueba gratuita de 30 días

Próximo paso: Comenzar prueba gratuita de 30 días

Confiado por millones de ingenieros en todo el mundo