Cómo corregir imágenes con filtros de lectura
Los filtros de corrección de imágenes son técnicas de tratamiento digital de imágenes que se utilizan para mejorar la calidad y las características de una imagen, en particular con el fin de mejorar el reconocimiento y la extracción de texto. Los filtros de corrección de imagen disponibles en IronOcr son nitidez, mejora de la resolución, eliminación de ruido, dilatación y erosión.
Estos filtros de corrección de imágenes desempeñan un papel fundamental en el preprocesamiento de imágenes antes del OCR, ya que ayudan a optimizar la imagen para una extracción de texto precisa mejorando la calidad y la visibilidad del texto y reduciendo el ruido o los artefactos no deseados.
Cómo corregir imágenes con filtros de lectura
- Descargar una biblioteca C# para la corrección de imágenes mediante filtros
- Importar el documento PDF y las imágenes para su lectura
- Aplique los filtros que desee, como nitidez, mejora de la resolución, eliminación de ruido, dilatación y erosión.
- Exportar la imagen corregida para su visualización
- Utilice el
Leer
método de procesamiento OCR
Instalar con NuGet
Install-Package IronOcr
Descargar DLL
Instalar manualmente en su proyecto
Instalar con NuGet
Install-Package IronOcr
Descargar DLL
Instalar manualmente en su proyecto
Comience a usar IronPDF en su proyecto hoy con una prueba gratuita.
Echa un vistazo IronOCR en Nuget para una instalación y despliegue rápidos. Con más de 8 millones de descargas, está transformando OCR con C#.
Install-Package IronOcr
Considere instalar el IronOCR DLL directamente. Descárguelo e instálelo manualmente para su proyecto o forma GAC: IronOcr.zip
Instalar manualmente en su proyecto
Descargar DLLEjemplo de filtro de enfoque
Este filtro aumenta el contraste a lo largo de los bordes de la imagen, dándoles un aspecto más definido. Mejora la claridad del texto y los detalles, lo que facilita al software OCR el reconocimiento de caracteres.
Para aplicar el filtro de nitidez, basta con invocar el método Sharpen
del objeto OcrImageInput.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-sharpen-filter.cs
using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Apply sharpen filter
imageInput.Sharpen();
// Export filtered image
imageInput.SaveAsImages("sharpen");
Imports IronOcr
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("sample.jpg")
' Apply sharpen filter
imageInput.Sharpen()
' Export filtered image
imageInput.SaveAsImages("sharpen")
Para mayor comodidad, puede exportar la imagen filtrada utilizando el método SaveAsImages
. A continuación se muestra una comparación de la imagen antes y después de aplicar el filtro de nitidez.
Antes de
En
Ejemplo de filtro de mejora de la resolución
Este filtro está diseñado para aumentar la densidad de píxeles de una imagen, mejorando eficazmente su nitidez y claridad. Puede ser especialmente útil para mejorar la legibilidad del texto en imágenes de baja resolución.
Del mismo modo, puede invocar el método EnhanceResolution
para aplicar el filtro de resolución mejorada. Este método también acepta el objetivo deseado, con 225 PPP como valor por defecto.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-enhance-resolution-filter.cs
// Apply enhance resolution filter
imageInput.EnhanceResolution();
' Apply enhance resolution filter
imageInput.EnhanceResolution()
Antes de
En
Ejemplo de filtro de eliminación de ruido
Los filtros de eliminación de ruido reducen el nivel de ruido o artefactos no deseados en una imagen. La reducción del ruido es crucial para el OCR, ya que ayuda a aislar el texto de las interferencias del fondo, lo que permite un reconocimiento más limpio y preciso.
Para aplicar el filtro de eliminación de ruido, utilice el método DeNoise
. La morfología por defecto es 2x2, y pasando 'true' al método se habilitará una morfología 3x3. Si elige la opción 3x3, se aplicará un algoritmo de eliminación de ruido más potente.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-denoise-filter.cs
// Apply denoise filter
imageInput.DeNoise();
' Apply denoise filter
imageInput.DeNoise()
Antes de
En
Ejemplo de filtro de dilatación
La dilatación es un filtro que expande las regiones más brillantes(primer plano) en una imagen. Ayuda a engrosar y realzar el texto, haciéndolo más prominente y más fácil de interpretar para el software OCR.
Para aplicar el filtro de dilatación, utilice el método Dilate
. Similar al método DeNoise
, la morfología por defecto es 2x2, y pasando true
se activará la opción 3x3.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-dilate-filter.cs
// Apply dilate filter
imageInput.Dilate();
' Apply dilate filter
imageInput.Dilate()
Antes de
En
Ejemplo de filtro Erode
La erosión, por su parte, reduce el tamaño de las regiones brillantes de una imagen. Esto puede ser útil para refinar caracteres y líneas, sobre todo cuando son gruesos o están ligeramente distorsionados.
Utilice el método Erode
para aplicar el filtro de erosión. Similar a los dos métodos anteriores, 2x2 es la morfología y pasar true habilitará la opción 3x3.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-erode-filter.cs
// Apply erode filter
imageInput.Erode();
' Apply erode filter
imageInput.Erode()
Antes de
En