Comment corriger les images à l'aide de filtres pour la lecture
Les filtres de correction d'image sont des techniques de traitement d'images numériques utilisées pour améliorer la qualité et les caractéristiques d'une image, en particulier dans le but d'améliorer la reconnaissance et l'extraction de texte. Les filtres de correction d'image disponibles dans IronOCR sont l'accentuation, l'amélioration de la résolution, le débruitage, la dilatation et l'érosion.
Ces filtres de correction d'image jouent un rôle essentiel dans le prétraitement des images avant l'OCR, car ils permettent d'optimiser l'image pour une extraction précise du texte en améliorant la qualité et la visibilité du texte et en réduisant le bruit ou les artefacts indésirables.
Comment corriger les images à l'aide de filtres pour la lecture
- Télécharger une bibliothèque C# pour la correction d'images à l'aide de filtres
- Importer le document PDF et les images pour la lecture
- Appliquer les filtres souhaités, tels que l'accentuation de la netteté, l'amélioration de la résolution, le débruitage, la dilatation et l'érosion
- Exporter l'image corrigée pour la visualiser
- Utiliser le
Lire
méthode de traitement OCR
Installer avec NuGet
Install-Package IronOcr
Télécharger DLL
Installation manuelle dans votre projet
Installer avec NuGet
Install-Package IronOcr
Télécharger DLL
Installation manuelle dans votre projet
Commencez à utiliser IronPDF dans votre projet dès aujourd'hui avec un essai gratuit.
Découvrez IronOCR sur NuGet pour une installation rapide et un déploiement facile. Avec plus de 8 millions de téléchargements, il transforme OCR avec C#.
Install-Package IronOcr
Envisagez d'installer le IronOCR DLL directement. Téléchargez et installez-le manuellement pour votre projet ou sous forme de GAC : {{lienDllAfficher}}
Installation manuelle dans votre projet
Télécharger la DLLExemple de filtre de netteté
Ce filtre augmente le contraste le long des bords de l'image, leur donnant un aspect plus défini. Il améliore la clarté du texte et des détails, ce qui facilite la reconnaissance des caractères par les logiciels d'OCR.
Pour appliquer le filtre d'accentuation, il suffit d'invoquer la méthode Sharpen
de l'objet OcrImageInput.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-sharpen-filter.cs
using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Apply sharpen filter
imageInput.Sharpen();
// Export filtered image
imageInput.SaveAsImages("sharpen");
Imports IronOcr
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("sample.jpg")
' Apply sharpen filter
imageInput.Sharpen()
' Export filtered image
imageInput.SaveAsImages("sharpen")
Pour plus de facilité, vous pouvez exporter l'image filtrée en utilisant la méthode SaveAsImages
. Vous trouverez ci-dessous une comparaison de l'image avant et après l'application du filtre d'accentuation de la netteté.
Avant
Après
Exemple de filtre d'amélioration de la résolution
Ce filtre est conçu pour augmenter la densité des pixels d'une image, améliorant ainsi sa netteté et sa clarté. Il peut être particulièrement utile pour améliorer la lisibilité du texte dans les images à faible résolution.
De même, vous pouvez invoquer la méthode EnhanceResolution
pour appliquer le filtre de résolution améliorée. Cette méthode accepte également la cible souhaitée, la valeur par défaut étant 225 DPI.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-enhance-resolution-filter.cs
// Apply enhance resolution filter
imageInput.EnhanceResolution();
' Apply enhance resolution filter
imageInput.EnhanceResolution()
Avant
Après
Exemple de filtre de débruitage
Les filtres de débruitage réduisent le niveau de bruit ou d'artefacts indésirables dans une image. La réduction du bruit est essentielle pour l'OCR car elle permet d'isoler le texte des interférences de l'arrière-plan, ce qui conduit à une reconnaissance plus nette et plus précise.
Pour appliquer le filtre de débruitage, utilisez la méthode DeNoise
. La morphologie par défaut est 2x2, et le fait de passer "true" à la méthode permet d'activer une morphologie 3x3. En choisissant l'option 3x3, vous appliquerez un algorithme de débruitage plus puissant.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-denoise-filter.cs
// Apply denoise filter
imageInput.DeNoise();
' Apply denoise filter
imageInput.DeNoise()
Avant
Après
Exemple de filtre dilaté
La dilatation est un filtre qui élargit les régions les plus lumineuses (premier plan) dans une image. Il permet d'épaissir et de rehausser le texte, le rendant plus visible et plus facile à interpréter par les logiciels d'OCR.
Pour appliquer le filtre de dilatation, utilisez la méthode Dilate
. Similaire à la méthode DeNoise
, la morphologie par défaut est 2x2, et passer 'true' activera l'option 3x3.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-dilate-filter.cs
// Apply dilate filter
imageInput.Dilate();
' Apply dilate filter
imageInput.Dilate()
Avant
Après
Exemple de filtre d'érosion
L'érosion, quant à elle, rétrécit ou réduit la taille des zones lumineuses d'une image. Cela peut être utile pour affiner les caractères et les lignes, en particulier lorsqu'ils sont épais ou légèrement déformés.
Utilisez la méthode Erode
pour appliquer le filtre d'érosion. Comme pour les deux méthodes précédentes, 2x2 est la morphologie et le fait de passer à true activera l'option 3x3.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-erode-filter.cs
// Apply erode filter
imageInput.Erode();
' Apply erode filter
imageInput.Erode()
Avant
Après