Filtres de correction d'images C# pour une meilleure lecture OCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

Les filtres de correction d'image sont des techniques de traitement d'image numérique utilisées pour améliorer la qualité et les caractéristiques d'une image, notamment dans le but d'améliorer la reconnaissance et l'extraction de texte. Les filtres de correction d'image disponibles dans IronOcr sont : netteté, amélioration de la résolution, réduction du bruit, dilatation et érosion.

Ces filtres de correction d'image jouent un rôle essentiel dans le prétraitement des images avant la reconnaissance optique de caractères (OCR), car ils contribuent à optimiser l'image pour une extraction de texte précise en améliorant la qualité et la visibilité du texte et en réduisant le bruit ou les artefacts indésirables.

Démarrage rapide : Appliquer le filtre Netteté pour un texte clair

Utilisez OcrImageInput d'IronOCR pour améliorer la netteté d'une image floue en une seule ligne de code. Ce guide de démarrage rapide vous montre à quelle vitesse vous pouvez améliorer la netteté de l'image et vous préparer à une reconnaissance optique de caractères (OCR) précise avec un minimum d'effort.

Nuget IconCommencez dès maintenant à créer des PDF avec NuGet :

  1. Installez IronOCR avec le gestionnaire de packages NuGet

    PM > Install-Package IronOcr

  2. Copiez et exécutez cet extrait de code.

    new IronOcr.OcrImageInput("sample.png").Sharpen().SaveAsImages("output.png");
  3. Déployez pour tester sur votre environnement de production.

    Commencez à utiliser IronOCR dans votre projet dès aujourd'hui grâce à un essai gratuit.
    arrow pointer


Exemple de filtre Sharpen

Ce filtre augmente le contraste le long des contours de l'image, leur donnant un aspect plus net. Cela améliore la clarté du texte et des détails, facilitant ainsi la reconnaissance des caractères par les logiciels de reconnaissance optique de caractères (OCR).

Pour appliquer le filtre de netteté, appelez la méthode Sharpen de l'objet OcrImageInput.

:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-sharpen-filter.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Apply sharpen filter
imageInput.Sharpen();

// Export filtered image
imageInput.SaveAsImages("sharpen.jpg");
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.jpg")
' Apply sharpen filter
imageInput.Sharpen()

' Export filtered image
imageInput.SaveAsImages("sharpen.jpg")
$vbLabelText   $csharpLabel

Pour plus de facilité, exportez l'image filtrée avec la méthode SaveAsImages. Vous trouverez ci-dessous une comparaison de l'image avant et après application du filtre de netteté.

Sample image
Sharpen filter applied

Exemple de filtre d'amélioration de la résolution

Ce filtre est conçu pour augmenter la densité de pixels d'une image, améliorant ainsi sa netteté et sa clarté. Cela peut s'avérer particulièrement utile pour améliorer la lisibilité du texte dans les images basse résolution.

Invoquez la méthode EnhanceResolution pour appliquer le filtre de résolution améliorée. Cette méthode accepte la résolution DPI cible, la valeur par défaut étant de 225 DPI.

:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-enhance-resolution-filter.cs
// Apply enhance resolution filter
imageInput.EnhanceResolution();
' Apply enhance resolution filter
imageInput.EnhanceResolution()
$vbLabelText   $csharpLabel
Sample image
Enhance resolution filter applied

Exemple de filtre de débruitage

Les filtres de débruitage réduisent le niveau de bruit ou d'artefacts indésirables dans une image. La réduction du bruit est cruciale pour la reconnaissance optique de caractères (OCR) car elle permet d'isoler le texte des interférences de fond, ce qui conduit à une reconnaissance plus nette et plus précise.

Pour appliquer le filtre de débruitage, utilisez la méthode DeNoise . La morphologie par défaut est 2x2. Pour appliquer un algorithme de débruitage plus performant, passez la valeur " true " pour activer une morphologie 3x3.

:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-denoise-filter.cs
// Apply denoise filter
imageInput.DeNoise();
' Apply denoise filter
imageInput.DeNoise()
$vbLabelText   $csharpLabel
Sample image
Denoise filter applied

Exemple de filtre dilaté

La dilatation agrandit les régions plus claires (premier plan) d'une image. Cela permet d'épaissir et d'améliorer le texte, le rendant plus lisible et plus facile à interpréter pour les logiciels de reconnaissance optique de caractères (OCR).

Pour appliquer le filtre de dilatation, utilisez la méthode Dilate . La morphologie par défaut est 2x2, et le réglage " true " active l'option 3x3.

:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-dilate-filter.cs
// Apply dilate filter
imageInput.Dilate();
' Apply dilate filter
imageInput.Dilate()
$vbLabelText   $csharpLabel
Sample image
Dilate filter applied

Exemple de filtre érodé

L'érosion réduit la taille des zones claires d'une image, ce qui est utile pour affiner les caractères et les lignes, notamment lorsqu'ils sont épais ou déformés.

Utilisez la méthode Erode pour appliquer le filtre d'érosion. Comme pour les méthodes précédentes, la morphologie par défaut est 2x2, et le réglage " true " active 3x3.

:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-erode-filter.cs
// Apply erode filter
imageInput.Erode();
' Apply erode filter
imageInput.Erode()
$vbLabelText   $csharpLabel
Sample image
Erode filter applied

PDF consultables

Outre les options de filtrage d'images, IronOcr offre aux développeurs la possibilité d'enregistrer le PDF modifié avec les filtres activés ou désactivés. La méthode SaveAsSearchablePdf permet de prendre un indicateur booléen comme deuxième paramètre afin de déterminer si vous souhaitez enregistrer avec des filtres ou non.

:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-searchable-pdf.cs
using IronOcr;

var ocr = new IronTesseract();
var ocrInput = new OcrInput();

// Load a PDF file
ocrInput.LoadPdf("invoice.pdf");

// Apply gray scale filter
ocrInput.ToGrayScale();
OcrResult result = ocr.Read(ocrInput);

// Save the result as a searchable PDF with filters applied
result.SaveAsSearchablePdf("outputGrayscale.pdf", true);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Questions Fréquemment Posées

Comment puis-je améliorer la qualité de l'image pour de meilleurs résultats OCR ?

Vous pouvez améliorer la qualité d'image pour de meilleurs résultats d'OCR en utilisant IronOCR en appliquant divers filtres de correction d'image comme aiguiser, améliorer la résolution, supprimer le bruit, dilater et éroder. Ces filtres améliorent la clarté du texte et réduisent le bruit, facilitant une extraction de texte plus précise.

Quels sont les avantages d'utiliser des filtres de sharpening dans le prétraitement d'image ?

Les filtres de sharpening dans IronOCR augmentent le contraste des bords, améliorant la clarté et la lisibilité du texte dans les images. Cette amélioration est cruciale pour améliorer la précision de la reconnaissance de texte OCR.

Comment augmenter la résolution d'une image pour le traitement OCR ?

Pour augmenter la résolution d'une image pour le traitement OCR dans IronOCR, utilisez le filtre d'amélioration de la résolution, qui augmente la densité de pixels, améliorant la netteté et la clarté des images à basse résolution.

Quelles étapes dois-je suivre pour réduire le bruit dans les images avant l'OCR ?

Pour réduire le bruit dans les images avant l'OCR avec IronOCR, appliquez la méthode `DeNoise`. Pour une réduction de bruit plus forte, vous pouvez activer une morphologie 3x3 en réglant l'option à 'true'.

Comment le filtrage de dilatation affecte-t-il la visibilité du texte dans les images ?

Le filtrage de dilatation dans IronOCR étend les régions plus lumineuses d'une image, rendant le texte plus proéminent et aidant le processus OCR à interpréter les caractères plus efficacement.

Quelle est la méthode pour affiner le texte en utilisant des filtres d'érosion ?

Pour affiner le texte en utilisant des filtres d'érosion dans IronOCR, utilisez la méthode `Erode`. Ce filtre réduit la taille des régions lumineuses, aidant à affiner les caractères et lignes épaisses ou déformées dans l'image.

Quel réglage de DPI est recommandé pour améliorer la résolution de l'image ?

Le paramètre DPI par défaut pour le filtre d'amélioration de la résolution dans IronOCR est de 225 DPI. Cependant, vous pouvez spécifier un DPI différent en fonction de vos besoins pour optimiser la clarté d'image.

Est-il possible d'ajuster l'intensité de l'effet de dilatation dans IronOCR ?

Oui, vous pouvez ajuster l'intensité de l'effet de dilatation dans IronOCR en activant une morphologie 3x3 plus forte lors de l'application du filtre de dilatation, ce qui se fait en réglant l'option à 'true'.

Comment puis-je commencer à utiliser des filtres de correction d'image en .NET C# ?

Pour utiliser des filtres de correction d'image en .NET C#, téléchargez IronOCR via NuGet, importez vos images, appliquez les filtres souhaités, puis exportez les images améliorées pour OCR.

Chaknith Bin
Ingénieur logiciel
Chaknith travaille sur IronXL et IronBarcode. Il a une expertise approfondie en C# et .NET, aidant à améliorer le logiciel et à soutenir les clients. Ses idées issues des interactions avec les utilisateurs contribuent à de meilleurs produits, documentation et expérience globale.
Prêt à commencer?
Nuget Téléchargements 5,167,857 | Version: 2025.11 vient de sortir