Cómo Arreglar Colores de Imagen para Lectura en C# | IronOCR

Cómo arreglar los colores de las imágenes para leerlas en C#

This article was translated from English: Does it need improvement?
Translated
View the article in English

Corrige los colores de las imágenes en C# utilizando los métodos de binarización, escala de grises, inversión y sustitución de color de IronOCR para mejorar la legibilidad del texto y la precisión del OCR. Lea los colores de texto específicos para la extracción dirigida.

Inicio rápido: Aislar colores de texto específicos

Utilice el método SelectTextColor de IronOCR para centrar el OCR en colores de texto específicos, sin necesidad de manipular imágenes complejas. Cargue una imagen, elija el color del texto y la tolerancia, y extraiga sólo ese texto para obtener resultados de OCR precisos.

using IronPdf;cs:title=Arreglar el color del texto rápidamente con IronOCR new IronTesseract().Read(new IronOcr.OcrImageInput("sample.jpg").SelectTextColor(new IronSoftware.Drawing.Color("#DB645C"), 60)); using IronPdf;


¿Cómo binarizar una imagen para mejorar el reconocimiento óptico de caracteres?

La binarización convierte las imágenes a un formato de dos colores, normalmente blanco y negro. De este modo se separa el texto del fondo y se reduce el ruido, con lo que el texto se distingue mejor y es más fácil de leer.

¿Por qué la binarización mejora la precisión del OCR?

Aplique la binarización mediante el método Binarize. El OCR funciona mejor con imágenes de alto contraste con texto negro sobre fondo blanco. Este método crea una clara distinción entre el fondo y los caracteres.

La binarización es excelente con documentos escaneados que tienen una iluminación desigual o ruido de fondo. El algoritmo analiza las imágenes y determina los umbrales óptimos para separar el texto en primer plano del fondo. Para conocer las técnicas avanzadas de preprocesamiento, consulte la guía OCR Image Optimization Filters.

¿Cuál es la implementación de código para la binarización?

using IronPdf;csharp :path=/static-assets/ocr/content-code-examples/how-to/image-color-correction-binarize-image.cs using IronPdf;

Para el procesamiento por lotes, combine la binarización con otros filtros. Utilice el Asistente para filtros para determinar la mejor combinación de filtros para sus imágenes.

¿Cómo puedo exportar y comparar resultados?

Exporte imágenes modificadas utilizando el método SaveAsImages. Compara las imágenes antes y después de la binarización.

Sample image with red and black text on blue-gray background showing OCR challenges before binarization
Binarized version showing clear black text on pure white background for optimal OCR processing

¿Cómo convertir imágenes a escala de grises para leerlas mejor?

La conversión de las imágenes a escala de grises reduce el desorden visual y mejora la legibilidad. Esto ayuda cuando los colores originales distraen del contenido.

¿Cuándo debería utilizar la escala de grises en lugar de otros métodos?

Aplica la escala de grises con el método ToGrayScale. El proceso promedia los valores R, G y B.

La escala de grises funciona bien con fondos de color o marcas de agua que interfieran con el reconocimiento de texto. A diferencia de la binarización, la escala de grises conserva los detalles en imágenes con variaciones sutiles. Utilízalo para fotografías con texto incrustado o diseños complejos. Para escaneos de baja calidad, consulte Fijación de escaneos e imágenes de baja calidad.

¿Cuál es el código simple para la conversión a escala de grises?

using IronPdf;csharp :path=/static-assets/ocr/content-code-examples/how-to/image-color-correction-grayscale-image.cs using IronPdf;

Para obtener distintas calidades de imagen, combine la escala de grises con otros pasos de preprocesamiento. La documentación de OcrInput Class explica el encadenamiento de varios filtros.

¿Cómo se compara la escala de grises con el original?

Sample text with red headers and black body text showing multiple colors before grayscale conversion
Grayscale document with clear text about tech executives, demonstrating improved readability after conversion

¿Cuándo debo invertir los colores de una imagen?

Invertir los colores mejora el contraste. Convertir texto blanco sobre fondo negro en texto negro sobre fondo blanco mejora la legibilidad.

¿Cómo implementar la inversión del color?

Utilice el método Invert para invertir colores. Pase un valor booleano para eliminar los canales de color y devolver la escala de grises.

La inversión del color se encarga de las imágenes negativas o de las capturas de pantalla de temática oscura. Las aplicaciones modernas utilizan interfaces de modo oscuro que suponen un reto para el OCR tradicional. La inversión de estas imágenes garantiza un reconocimiento óptimo. Para varios tipos de imágenes, consulte la Guía de configuración de Fast OCR.

using IronPdf;csharp :path=/static-assets/ocr/content-code-examples/how-to/image-color-correction-invert-image.cs using IronPdf;

Para el procesamiento por lotes con tipos de documentos mixtos, implemente la detección automática de fondo oscuro. las funciones Computer Vision de IronOCR identifican cuándo es necesaria la inversión.

¿Cuál es la diferencia entre las opciones de inversión?

Compara el método Invertir con y sin escala de grises:

Color-inverted document maintaining original color channels with reversed values
Business text with inverted colors showing white text on dark background demonstrating color inversion effect

¿Cómo puedo reemplazar colores específicos en una imagen?

Reemplace colores específicos para resaltar o restar énfasis a los elementos. Utilícelo para mejorar la prominencia del texto o corregir contrastes problemáticos.

¿Por qué es importante la tolerancia en la sustitución de colores?

El método ReplaceColor requiere el color actual, el nuevo color y el valor de tolerancia. Mayor tolerancia maneja mejor las imágenes borrosas.

La tolerancia determina hasta qué punto los píxeles deben coincidir con el color de destino. Los valores bajos (0-50) se adaptan a colores uniformes. Los valores más altos (100-200) se refieren a texto con antialiasing o artefactos de compresión. Esto ayuda con los documentos escaneados en los que el sangrado de la tinta o la textura del papel crean variaciones.

¿Cómo implementar la sustitución de colores?

using IronPdf;csharp :path=/static-assets/ocr/content-code-examples/how-to/image-color-correction-replace-color.cs using IronPdf;

¿Cómo se manejan los escenarios avanzados de sustitución de colores?

Cadena de sustituciones múltiples para escenarios complejos:

using IronPdf;cs / :path=/static-assets/ocr/content-code-examples/how-to/image-color-correction-multiple-replacements.cs / // Replace multiple colors in sequence using var imageInput = new OcrImageInput("multi-color-document.jpg");

// Replace red text with black imageInput.ReplaceColor(IronSoftware.Drawing.Color.Red, IronSoftware.Drawing.Color.Black, 70);

// Replace blue headers with dark gray imageInput.ReplaceColor(IronSoftware.Drawing.Color.Blue, IronSoftware.Drawing.Color.DarkGray, 60);

// Replace light yellow background with white imageInput.ReplaceColor(new IronSoftware.Drawing.Color("#FFFACD"), IronSoftware.Drawing.Color.White, 40);

// Perform OCR on the cleaned image var result = ocrTesseract.Read(imageInput); using IronPdf;

Para sustituciones de color complejas, consulte Filtros de corrección de imágenes para conocer técnicas de preprocesamiento adicionales.

¿Cuáles son los resultados visuales de la sustitución de colores?

Text sample with orange-red colored names and content on blue background showing original colors before replacement
Document after color replacement showing dark cyan headers replacing original orange-red text

¿Cómo puedo leer solo determinados colores de texto?

Leer colores de texto específicos utilizando el método SelectTextColor. Especifique el color de destino y la tolerancia (0-255). La tolerancia representa las diferencias admisibles entre el píxel y el color seleccionado para los valores R, G y B.

¿Cómo afecta la tolerancia de color a los resultados?

using IronPdf;csharp :path=/static-assets/ocr/content-code-examples/how-to/image-color-correction-select-text-color.cs using IronPdf;

Utilice la lectura selectiva de colores para formularios con secciones codificadas por colores, extraer texto resaltado o leer mensajes de advertencia específicos. Para la extracción de datos estructurados, véase OcrResult Class para el procesamiento avanzado.

¿Qué resultados puedo esperar de la selección de colores?

El resultado del OCR solo lee texto de color naranja:

Consola de depuración que muestra el texto naranja extraído del OCR: MASAYOSHI SON y YASUMITSU SHIGETA del documento comercial

¿Cómo puedo guardar archivos PDF modificados con filtros aplicados?

IronOCR guarda PDF modificados con o sin filtros. El segundo parámetro del método SaveAsSearchablePdf especifica si se debe guardar con filtros aplicados.

¿Cuál es la implementación de los PDF con función de búsqueda?

using IronPdf;cs :path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-searchable-pdf.cs using IronPdf;

¿Cuándo debo aplicar filtros al PDF guardado?

Aplique filtros para crear documentos más limpios y legibles. Esto ayuda a archivar o compartir documentos entre distintos dispositivos. Para obtener más información, consulte Create Searchable PDFs by OCR.

Para documentos complejos con tablas, explore Leer tabla en documento para una extracción especializada. Para el procesamiento de grandes volúmenes, consulte Multithreaded Tesseract OCR para optimizar la aplicación del filtro en varios documentos.

Preguntas Frecuentes

¿Cómo puedo corregir los colores deficientes de las imágenes que afectan a la precisión del OCR?

IronOCR ofrece varios métodos de corrección del color, como la binarización, la conversión a escala de grises, la inversión y la sustitución del color. Estos filtros ayudan a mejorar la legibilidad del texto al mejorar el contraste entre el texto y el fondo, lo que facilita que el motor de OCR extraiga con precisión el texto de imágenes con mala calidad de color.

¿Qué es la binarización y cuándo debo utilizarla para el OCR?

La binarización convierte imágenes a formato de dos colores (normalmente blanco y negro) utilizando el método Binarize de IronOCR. Es particularmente eficaz para documentos escaneados con iluminación irregular o ruido de fondo, ya que crea una clara distinción entre el texto y el fondo mediante el análisis de la imagen y la determinación de umbrales óptimos para la separación.

¿Cómo extraigo de una imagen sólo el texto de un color específico?

El método SelectTextColor de IronOCR le permite centrar el OCR en colores de texto específicos sin una manipulación compleja de la imagen. Simplemente especifique el color de destino y el nivel de tolerancia - por ejemplo, SelectTextColor(new IronSoftware.Drawing.Color("#DB645C"), 60) - para extraer sólo texto en ese rango de color.

¿Cuándo debo convertir imágenes a escala de grises en lugar de utilizar la binarización?

Utilice el método ToGrayScale de IronOCR cuando trabaje con fondos de color o marcas de agua que interfieran con el reconocimiento de texto. A diferencia de la binarización, la escala de grises conserva los detalles en imágenes con variaciones sutiles, por lo que es ideal cuando se necesita mantener la calidad de la imagen al tiempo que reduce el desorden visual.

¿Puedo exportar imágenes corregidas para ver los resultados de los filtros de color?

Sí, IronOCR proporciona el método SaveAsImages para exportar imágenes modificadas después de aplicar correcciones de color. Esto le permite comparar los resultados antes y después, ayudándole a determinar qué métodos de corrección de color funcionan mejor para sus imágenes específicas.

¿Cómo puedo determinar cuál es el mejor filtro de corrección del color para mis imágenes?

IronOCR incluye una herramienta de asistente de filtros que ayuda a determinar la combinación de filtros óptima para sus imágenes. Para el procesamiento por lotes, puede combinar varios filtros como la binarización con otras técnicas de preprocesamiento para lograr los mejores resultados de OCR para su tipo de documento.

Curtis Chau
Escritor Técnico

Curtis Chau tiene una licenciatura en Ciencias de la Computación (Carleton University) y se especializa en el desarrollo front-end con experiencia en Node.js, TypeScript, JavaScript y React. Apasionado por crear interfaces de usuario intuitivas y estéticamente agradables, disfruta trabajando con frameworks modernos y creando manuales bien ...

Leer más
Revisado por
Jeff Fritz
Jeffrey T. Fritz
Gerente Principal de Programas - Equipo de la Comunidad .NET
Jeff también es Gerente Principal de Programas para los equipos de .NET y Visual Studio. Es el productor ejecutivo de la serie de conferencias virtuales .NET Conf y anfitrión de 'Fritz and Friends', una transmisión en vivo para desarrolladores que se emite dos veces a la semana donde habla sobre tecnología y escribe código junto con la audiencia. Jeff escribe talleres, presentaciones, y planifica contenido para los eventos de desarrolladores más importantes de Microsoft, incluyendo Microsoft Build, Microsoft Ignite, .NET Conf y la Cumbre de Microsoft MVP.
¿Listo para empezar?
Nuget Descargas 5,299,091 | Versión: 2025.12 recién lanzado