Comment corriger les images à l'aide de filtres pour la lecture

This article was translated from English: Does it need improvement?
Translated
View the article in English

par Chaknith Bin

Les filtres de correction d'image sont des techniques de traitement d'images numériques utilisées pour améliorer la qualité et les caractéristiques d'une image, en particulier dans le but d'améliorer la reconnaissance et l'extraction de texte. Les filtres de correction d'image disponibles dans IronOCR sont l'accentuation, l'amélioration de la résolution, le débruitage, la dilatation et l'érosion.

Ces filtres de correction d'image jouent un rôle essentiel dans le prétraitement des images avant l'OCR, car ils permettent d'optimiser l'image pour une extraction précise du texte en améliorant la qualité et la visibilité du texte et en réduisant le bruit ou les artefacts indésirables.


Bibliothèque NuGet C# pour OCR

Installer avec NuGet

Install-Package IronOcr
ou
Java PDF JAR

Télécharger DLL

Télécharger la DLL

Installation manuelle dans votre projet

Bibliothèque NuGet C# pour OCR

Installer avec NuGet

Install-Package IronOcr
ou
Java PDF JAR

Télécharger DLL

Télécharger la DLL

Installation manuelle dans votre projet

Commencez à utiliser IronPDF dans votre projet dès aujourd'hui avec un essai gratuit.

Première étape :
green arrow pointer

Découvrez IronOCR sur NuGet pour une installation rapide et un déploiement facile. Avec plus de 8 millions de téléchargements, il transforme OCR avec C#.

Bibliothèque NuGet C# pour OCR nuget.org/packages/IronOcr/
Install-Package IronOcr

Envisagez d'installer le IronOCR DLL directement. Téléchargez et installez-le manuellement pour votre projet ou sous forme de GAC : {{lienDllAfficher}}

Installation manuelle dans votre projet

Télécharger la DLL

Exemple de filtre de netteté

Ce filtre augmente le contraste le long des bords de l'image, leur donnant un aspect plus défini. Il améliore la clarté du texte et des détails, ce qui facilite la reconnaissance des caractères par les logiciels d'OCR.

Pour appliquer le filtre d'accentuation, il suffit d'invoquer la méthode Sharpen de l'objet OcrImageInput.

:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-sharpen-filter.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Apply sharpen filter
imageInput.Sharpen();

// Export filtered image
imageInput.SaveAsImages("sharpen");
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.jpg")
' Apply sharpen filter
imageInput.Sharpen()

' Export filtered image
imageInput.SaveAsImages("sharpen")
VB   C#

Pour plus de facilité, vous pouvez exporter l'image filtrée en utilisant la méthode SaveAsImages. Vous trouverez ci-dessous une comparaison de l'image avant et après l'application du filtre d'accentuation de la netteté.

Exemple d'image
Application d'un filtre de netteté

Exemple de filtre d'amélioration de la résolution

Ce filtre est conçu pour augmenter la densité des pixels d'une image, améliorant ainsi sa netteté et sa clarté. Il peut être particulièrement utile pour améliorer la lisibilité du texte dans les images à faible résolution.

De même, vous pouvez invoquer la méthode EnhanceResolution pour appliquer le filtre de résolution améliorée. Cette méthode accepte également la cible souhaitée, la valeur par défaut étant 225 DPI.

:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-enhance-resolution-filter.cs
// Apply enhance resolution filter
imageInput.EnhanceResolution();
' Apply enhance resolution filter
imageInput.EnhanceResolution()
VB   C#
Exemple d'image
Application d'un filtre d'amélioration de la résolution

Exemple de filtre de débruitage

Les filtres de débruitage réduisent le niveau de bruit ou d'artefacts indésirables dans une image. La réduction du bruit est essentielle pour l'OCR car elle permet d'isoler le texte des interférences de l'arrière-plan, ce qui conduit à une reconnaissance plus nette et plus précise.

Pour appliquer le filtre de débruitage, utilisez la méthode DeNoise. La morphologie par défaut est 2x2, et le fait de passer "true" à la méthode permet d'activer une morphologie 3x3. En choisissant l'option 3x3, vous appliquerez un algorithme de débruitage plus puissant.

:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-denoise-filter.cs
// Apply denoise filter
imageInput.DeNoise();
' Apply denoise filter
imageInput.DeNoise()
VB   C#
Exemple d'image
Filtre de débruitage appliqué

Exemple de filtre dilaté

La dilatation est un filtre qui élargit les régions les plus lumineuses (premier plan) dans une image. Il permet d'épaissir et de rehausser le texte, le rendant plus visible et plus facile à interpréter par les logiciels d'OCR.

Pour appliquer le filtre de dilatation, utilisez la méthode Dilate. Similaire à la méthode DeNoise, la morphologie par défaut est 2x2, et passer 'true' activera l'option 3x3.

:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-dilate-filter.cs
// Apply dilate filter
imageInput.Dilate();
' Apply dilate filter
imageInput.Dilate()
VB   C#
Exemple d'image
Filtre de dilution appliqué

Exemple de filtre d'érosion

L'érosion, quant à elle, rétrécit ou réduit la taille des zones lumineuses d'une image. Cela peut être utile pour affiner les caractères et les lignes, en particulier lorsqu'ils sont épais ou légèrement déformés.

Utilisez la méthode Erode pour appliquer le filtre d'érosion. Comme pour les deux méthodes précédentes, 2x2 est la morphologie et le fait de passer à true activera l'option 3x3.

:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-erode-filter.cs
// Apply erode filter
imageInput.Erode();
' Apply erode filter
imageInput.Erode()
VB   C#
Exemple d'image
Filtre d'érosion appliqué

Chaknith Bin

Ingénieur logiciel

Chaknith est le Sherlock Holmes des développeurs. C'est en s'amusant à relever des défis de code qu'il s'est rendu compte pour la première fois qu'il pourrait avoir un avenir dans le domaine de l'ingénierie logicielle. Il se concentre sur IronXL et IronBarcode, mais il est fier d'aider les clients avec chaque produit. Chaknith tire parti des connaissances qu'il a acquises en discutant directement avec les clients pour améliorer les produits eux-mêmes. Ses commentaires anecdotiques vont au-delà des tickets Jira et soutiennent le développement de produits, la documentation et le marketing, afin d'améliorer l'expérience globale des clients.Quand il n'est pas au bureau, on peut le trouver en train d'apprendre sur l'apprentissage automatique, le codage et la randonnée.