Cómo establecer DPI en OCR usando C#
Establezca la propiedad TargetDPI en OcrInput de IronOCR para aumentar la resolución de las imágenes de baja resolución y mejorar la precisión del OCR. Esta configuración puede mejorar significativamente el reconocimiento de texto en documentos borrosos o pixelados, incluso con resoluciones tan bajas como 100 PPP.
Los puntos por pulgada (PPP) miden la calidad de la imagen y determinan el nivel de detalle de los documentos escaneados o las fotografías digitales. Aunque escanear documentos es rápido y eficaz, el proceso suele dar como resultado archivos de baja resolución, sobre todo si se utiliza la configuración predeterminada o de escaneado rápido. La falta de detalle hace que el texto aparezca borroso o pixelado, lo que crea obstáculos para la extracción de datos.
El rendimiento del OCR depende de la calidad de la imagen. Los motores de OCR analizan las formas y patrones de los caracteres para convertirlos en texto legible por máquina. Cuando una imagen tiene un DPI bajo, no hay suficientes píxeles para definir claramente cada letra, lo que hace que se pierdan detalles finos y se obtengan resultados imprecisos. Para los desarrolladores que trabajan con documentos escaneados o sistemas de digitalización heredados, comprender la optimización de PPP es crucial para una extracción de texto fiable.
IronOCR supera estos retos con eficacia. Consigue una gran precisión en escaneados con resoluciones tan bajas como 225 PPP. Las funciones de preprocesamiento de imágenes de la biblioteca detectan y compensan automáticamente varios problemas de calidad de imagen, lo que la hace adecuada para procesar documentos de diversas fuentes. Tanto si se implementa un sencillo OCR en una línea de código como si se construyen complejas canalizaciones de procesamiento de documentos, la optimización de PPP sigue siendo un factor crítico.
Guía Rápida: Establecer TargetDPI para Resultados de OCR más Afilados
Configure IronOCR para escalar imágenes de baja resolución en una línea, mejorando la claridad y el reconocimiento del texto con el mínimo esfuerzo.
Empieza a crear PDF con NuGet ahora:
Instalar IronOCR con el gestor de paquetes NuGet
Copie y ejecute este fragmento de código.
var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrInput { TargetDPI = 300 }.LoadImage("low-res.png"));Despliegue para probar en su entorno real
Empieza a utilizar IronOCR en tu proyecto hoy mismo con una prueba gratuita
Flujo de trabajo mínimo (5 pasos)
- Descargue una biblioteca de C# para configurar la configuración de DPI para OCR
- Crear una instancia de un nuevo
OcrInput - Configure el
TargetDPIpara adaptarlo a sus necesidades - Cargue la imagen deseada en
- Leer y extraer datos de la imagen usando
Read
¿Cómo ajustar los PPP para obtener mejores resultados de OCR?
Este ejemplo utiliza una imagen de muestra con una resolución baja de aproximadamente 100 PPP y añade ruido artificial para demostrar la eficacia de la función TargetDPI. Entender cómo configurar los ajustes de PPP es esencial cuando se trabaja con la clase OcrInput, que proporciona un control exhaustivo sobre el preprocesamiento de imágenes.
El texto real en la imagen es: "Testando testando testando ejemplo de texto borroso ejemplo ejemplo ejemplo".

¿Qué código necesito para aumentar los PPP de una imagen?
En este ejemplo, estableceremos el TargetDPI en 300 para aumentar la resolución de la imagen. A continuación, cargaremos la imagen de entrada e imprimiremos el texto extraído con Texto y el nivel de confianza con Confianza. El ajuste óptimo de PPP suele oscilar entre 250 y 400 PPP, dependiendo del caso de uso y de la calidad del material de origen. Para situaciones avanzadas en las que intervienen varios filtros de imagen, consulte nuestra guía sobre Filtros de optimización de imágenes OCR.
:path=/static-assets/ocr/content-code-examples/how-to/dpi-setting.csusing IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// Set the target DPI to 300 for better OCR accuracy
ocrInput.TargetDPI = 300;
ocrInput.LoadImage(@"images\image.png");
// Perform OCR on the image with the specified DPI
var ocrResult = ocrTesseract.Read(ocrInput);
// Display the text extracted from the image
Console.WriteLine(ocrResult.Text);
// Display the confidence level of the OCR result
Console.WriteLine(ocrResult.Confidence);IRON VB CONVERTER ERROR developers@ironsoftware.com¿Qué resultados puedo esperar con Upscaled DPI?

El resultado muestra que IronOCR alcanza una puntuación de confianza del 85%. A pesar del importante ruido y de los bajos PPP iniciales de la imagen original, el resultado es preciso, lo que demuestra la eficacia de la función de ampliación. Este nivel de precisión es superior al de las soluciones de OCR tradicionales, que tienen dificultades con las entradas de baja calidad. Para aplicaciones que requieran una precisión aún mayor, considere la posibilidad de implementar seguimiento del progreso para supervisar los niveles de confianza en tiempo real y ajustar la configuración de forma dinámica.
IronOCR incluye funciones integradas que mejoran automáticamente las imágenes de baja resolución aumentándolas de escala dentro de una única biblioteca. Este enfoque elimina la necesidad de herramientas externas de procesamiento de imágenes, agilizando el flujo de trabajo y reduciendo las dependencias. Para los desarrolladores que empiezan a utilizar IronOCR en Windows, esta función funciona inmediatamente sin necesidad de configuración adicional.
¿Cómo afecta la configuración de PPP a la precisión del OCR?
Para ilustrar la diferencia, aquí está el resultado de procesar la misma imagen de baja resolución sin establecer la propiedad TargetDPI. Esta comparación demuestra por qué una configuración de PPP adecuada es crucial para una extracción de texto fiable.
Encontrar el DPI correcto requiere equilibrio. Los DPI altos proporcionan más precisión pero un procesamiento más lento; un DPI bajo es más rápido pero menos confiable. En caso de duda, deja que el preprocesamiento automático de IronTesseract determine la configuración óptima. Puede desactivar el escalado automático estableciendo la propiedad TargetDPI en 0. Para aplicaciones especializadas, explore nuestra guía sobre Optimización de PPP de imágenes de Teseract.
¿Qué ocurre sin el aumento de PPP?

Sin escalado, la puntuación de confianza disminuye al 79%, y el texto extraído es significativamente menos preciso. Esta comparación muestra cómo el establecimiento de un TargetDPI mejora los resultados de OCR en imágenes de baja calidad. La diferencia se acentúa cuando se trata de documentos complejos que contienen tablas, formularios o diseños de varias columnas.
¿Cómo configurar los PPP de los documentos PDF?
Al procesar un PDF, IronOCR ajusta todo el documento a los PPP de destino, no sólo las imágenes que contiene. Este enfoque integral garantiza una calidad uniforme en todo el documento, lo cual es importante para la extracción de texto mediante OCR de PDF en aplicaciones empresariales. Para el procesamiento avanzado de PDF, como el trabajo con ficheros PDF con función de búsqueda, la configuración adecuada de los PPP es aún más importante.
Aunque un mayor número de PPP suele dar mejores resultados de OCR, la configuración óptima varía según el PDF. Si no está seguro de qué valor utilizar, deje los PPP en su configuración predeterminada y permita que IronOCR determine la mejor configuración automáticamente. Los algoritmos de la biblioteca analizan las características del documento, como el tamaño de la fuente, la calidad de la imagen y la densidad del contenido, para seleccionar los parámetros de preprocesamiento adecuados.
// Example: Processing a PDF with custom DPI settings
using IronOcr;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// Configure DPI specifically for PDF processing
ocrInput.TargetDPI = 250; // Lower DPI often works well for PDFs
// Load a multi-page PDF document
ocrInput.LoadPdf(@"documents\scanned-report.pdf");
// Optional: Process only specific pages
// ocrInput.LoadPdf(@"documents\scanned-report.pdf", PageSelection: new int[] {1, 3, 5});
// Apply additional filters if needed
ocrInput.DeNoise(); // Remove digital noise
ocrInput.Sharpen(); // Enhance text edges
// Perform OCR with confidence tracking
var ocrResult = ocrTesseract.Read(ocrInput);
// Process results page by page
foreach (var page in ocrResult.Pages)
{
Console.WriteLine($"Page {page.PageNumber}: {page.Confidence}% confidence");
Console.WriteLine(page.Text);
}// Example: Processing a PDF with custom DPI settings
using IronOcr;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// Configure DPI specifically for PDF processing
ocrInput.TargetDPI = 250; // Lower DPI often works well for PDFs
// Load a multi-page PDF document
ocrInput.LoadPdf(@"documents\scanned-report.pdf");
// Optional: Process only specific pages
// ocrInput.LoadPdf(@"documents\scanned-report.pdf", PageSelection: new int[] {1, 3, 5});
// Apply additional filters if needed
ocrInput.DeNoise(); // Remove digital noise
ocrInput.Sharpen(); // Enhance text edges
// Perform OCR with confidence tracking
var ocrResult = ocrTesseract.Read(ocrInput);
// Process results page by page
foreach (var page in ocrResult.Pages)
{
Console.WriteLine($"Page {page.PageNumber}: {page.Confidence}% confidence");
Console.WriteLine(page.Text);
}IRON VB CONVERTER ERROR developers@ironsoftware.comTargetDPI es 32,766. Establecer un DPI superior a este límite provocará una excepción. Esto sucede porque las dimensiones resultantes de la imagen excederían el tamaño máximo soportado por Tesseract de 32,767 x 32,767 píxeles. Si se excede el límite, recibirá el siguiente mensaje de error: 'El TargetDPI es demasiado alto y resultaría en una imagen demasiado grande ({new_width} x {new_height}) para Tesseract. El tamaño máximo de imagen para Tesseract es 32767 x 32767'Para las aplicaciones empresariales que procesan grandes volúmenes de documentos, considere la posibilidad de implementar una estrategia de ajuste dinámico de PPP. Comience con un ajuste moderado (300 PPP) y ajústelo en función de las puntuaciones de confianza. Este enfoque equilibra la velocidad de procesamiento con la precisión, garantizando un rendimiento óptimo en diversos tipos de documentos. La combinación de la optimización de DPI con otras técnicas de preprocesamiento puede dar mejores resultados en documentos complejos.
Al trabajar con tipos de documentos específicos, los requisitos de PPP pueden variar. Por ejemplo, leer matrículas suele requerir una configuración de PPP más alta debido al pequeño tamaño de los caracteres y a la posible distorsión de la imagen por los ángulos de la cámara. Del mismo modo, el procesamiento de cheques MICR se beneficia de configuraciones de PPP específicas para capturar con precisión caracteres de fuentes MICR especializadas.
Para los desarrolladores que integran OCR en aplicaciones web o servicios en la nube, comprender la optimización de DPI resulta crucial para gestionar los tiempos de procesamiento y los recursos del servidor. La posibilidad de ajustar la configuración de PPP permite optimizar el equilibrio entre precisión y rendimiento en función de los requisitos específicos de la aplicación y las limitaciones de la infraestructura.
Preguntas Frecuentes
¿Qué son los PPP y por qué son importantes para la precisión del OCR?
DPI (puntos por pulgada) mide la calidad de la imagen y determina el nivel de detalle de los documentos escaneados. Para la precisión del OCR, una mayor DPI significa una definición más clara de los caracteres. IronOCR puede manejar imágenes con resoluciones tan bajas como 225 DPI manteniendo una alta precisión, gracias a sus capacidades avanzadas de preprocesamiento de imágenes.
¿Cómo puedo mejorar los resultados del OCR en imágenes de baja resolución?
Establezca la propiedad TargetDPI en la clase OcrInput de IronOCR para aumentar la resolución de las imágenes de baja resolución. Por ejemplo, establecer TargetDPI a 300 puede mejorar significativamente el reconocimiento de texto en documentos borrosos o pixelados, incluso en aquellos con resoluciones tan bajas como 100 DPI.
¿Cuál es la forma más rápida de configurar los PPP para OCR en C#?
Puede configurar DPI en una línea de código utilizando IronOCR: var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrInput { TargetDPI = 300 }.LoadImage("low-res.png")). Esto aumenta automáticamente la escala de la imagen para mejorar la claridad y el reconocimiento del texto.
¿Puede funcionar eficazmente el OCR en documentos escaneados con baja resolución?
Sí, IronOCR se ha diseñado específicamente para tratar con eficacia documentos escaneados de baja resolución. Alcanza una gran precisión en escaneos con resoluciones tan bajas como 225 PPP e incluye funciones automáticas de preprocesamiento de imágenes que detectan y compensan diversos problemas de calidad.
¿Cuáles son los pasos básicos para implementar la configuración de PPP para OCR?
El proceso consta de cinco pasos: 1) Descargar la librería IronOCR, 2) Instanciar un nuevo objeto OcrInput, 3) Establecer la propiedad TargetDPI al valor deseado, 4) Cargar la imagen utilizando el método LoadImage, y 5) Extraer el texto utilizando el método Read.
¿Por qué la configuración predeterminada del escáner suele dar lugar a un rendimiento deficiente del OCR?
Los ajustes de escaneado rápido o por defecto suelen producir archivos de baja resolución para ahorrar tiempo y espacio de almacenamiento. El resultado es un texto borroso o pixelado en el que se pierden los detalles finos, lo que dificulta que los motores de OCR identifiquen con precisión las formas de los caracteres. La función TargetDPI de IronOCR ayuda a superar esta limitación.






