Comment utiliser l'assistant de filtre en C# pour une meilleure reconnaissance optique de caractères (OCR)

This article was translated from English: Does it need improvement?
Translated
View the article in English

Le prétraitement et la préparation d'une image pour le processus OCR peuvent s'avérer complexes. Plusieurs filtres peuvent être appliqués à une image ; Cependant, il peut être compliqué de tester quelle combinaison convient le mieux à votre image, car il s'agit souvent d'un cas par cas. Le processus lui-même peut être incroyablement long, car il faut essayer différentes combinaisons à plusieurs reprises pour vérifier quelle méthode donne les meilleurs résultats.

Cependant, IronOCR offre une solution efficace et simple pour gérer ce problème grâce à l'introduction de l' OcrInputFilterWizard . L'assistant de filtrage évalue automatiquement les combinaisons de filtres de prétraitement afin de maximiser la fiabilité et la précision de la reconnaissance optique de caractères (OCR). Il effectue une analyse exhaustive des paramètres optimaux et renvoie en outre la meilleure combinaison de filtres sous forme d'extrait de code, permettant ainsi aux développeurs de reproduire facilement le résultat.

Dans ce guide pratique, nous allons rapidement passer en revue un exemple de fonctionnement de l'assistant de filtre et présenter les extraits de code et les paramètres qu'il utilise.

Démarrage rapide : découvrez automatiquement votre chaîne de filtres d'image idéale

Utilisez l'assistant de filtrage d'IronOCR pour exécuter rapidement toutes les combinaisons de filtres de prétraitement et obtenir l'extrait de code le plus performant, sans avoir à deviner. Une seule ligne de code vous permet d'obtenir à la fois votre score de confiance maximal et la chaîne de filtres C# exacte à utiliser pour des images similaires.

Nuget IconCommencez dès maintenant à créer des PDF avec NuGet :

  1. Installez IronOCR avec le gestionnaire de packages NuGet

    PM > Install-Package IronOcr

  2. Copiez et exécutez cet extrait de code.

    string code = OcrInputFilterWizard.Run("image.png", out double confidence, new IronTesseract());
  3. Déployez pour tester sur votre environnement de production.

    Commencez à utiliser IronOCR dans votre projet dès aujourd'hui grâce à un essai gratuit.
    arrow pointer

Exemple d'assistant de filtre

La méthode OcrInputFilterWizard.Run prend trois paramètres : l'image d'entrée, un paramètre de sortie pour le niveau de confiance résultant et l'instance du moteur Tesseract.

Elle fonctionne par une méthode de force brute, en combinant de manière répétée différentes combinaisons de filtres de prétraitement pour obtenir le meilleur score de confiance. Le score de confiance le plus élevé à la fin détermine l'ensemble de filtres de prétraitement d'image que vous devriez idéalement appliquer à votre image d'entrée.

Veuillez noter qu'il n'y a pas de préréglages dans l'assistant de filtre et qu'il n'y a pas de limite au nombre de combinaisons qu'il peut essayer. L'objectif principal de l'assistant de filtrage est d'obtenir le meilleur score de confiance possible en testant différentes combinaisons de filtres d'image.

Voici la liste de tous les filtres qu'il peut utiliser dans ses combinaisons. Notez que toutes ces méthodes de filtrage sont disponibles dans la bibliothèque IronOCR :

  • input.Contrast()
  • input.Sharpen()
  • input.Binarize()
  • input.ToGrayScale()
  • input.Invert()
  • input.Deskew()
  • input.Scale(...)
  • input.Denoise()
  • input.DeepCleanBackgroundNoise()
  • input.EnhanceResolution()
  • input.Dilate() , input.Erode()

Pour une analyse plus détaillée du rôle de chaque filtre, veuillez consulter notre tutoriel complet sur les filtres d'image.

Comme il s'agit d'une méthode par force brute, cette opération prendra un certain temps car elle teste de nombreuses possibilités afin de trouver le meilleur résultat pour votre image.

Entrée

Pour cet exemple, nous utiliserons une capture d'écran avec beaucoup de bruit artificiel afin d'illustrer le fonctionnement de l'assistant de filtre.

Image d'entrée

Code

:path=/static-assets/ocr/content-code-examples/how-to/filter-wizard-process.cs
using IronOcr;
using System;

// Initialize the Tesseract engine
var ocr = new IronTesseract();

// 1. Pass the image path ("noise.png").
// 2. Pass an 'out' variable to store the best confidence score found.
// 3. Pass the tesseract instance to be used for testing.
string codeToRun = OcrInputFilterWizard.Run("noise.png", out double confidence, ocr);

// The 'confidence' variable is now populated with the highest score achieved.
Console.WriteLine($"Best Confidence Score: {confidence}");

// 'codeToRun' holds the exact C# code snippet that achieved this score.
// The returned string is the code you can use to filter similar images.
Console.WriteLine("Recommended Filter Code:");
Console.WriteLine(codeToRun);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Sortie

Sortie de l'assistant de filtre

Comme vous pouvez le constater d'après son résultat, l'assistant de filtrage a déterminé que, parmi toutes les combinaisons possibles, un niveau de confiance de 65 % est le meilleur qu'il puisse obtenir avec cette image spécifique.

L'image d'entrée est fortement déformée et fortement affectée par du bruit artificiel. Il s'agit d'un cas extrême destiné à illustrer comment l'assistant de filtrage d'IronOCR peut être utile, même dans des situations difficiles.

Meilleure combinaison de l'assistant de filtrage

Une fois l'assistant de filtrage exécuté, nous pouvons alors suivre l'extrait de code qu'il a fourni. Nous appliquons ces paramètres exacts à notre image d'entrée afin de vérifier le résultat et d'en confirmer la fiabilité.

Code

:path=/static-assets/ocr/content-code-examples/how-to/filter-wizard-best-combination.cs
using IronOcr;
using System;

// Initialize the Tesseract engine
var ocrTesseract = new IronTesseract();

// Load the image into an OcrInput object
using (var input = new OcrImageInput("noise.png"))
{
    // Apply the exact filter chain recommended by the Wizard's output
    input.Invert();
    input.DeNoise();
    input.Contrast();
    input.AdaptiveThreshold();

    // Run OCR on the pre-processed image
    OcrResult result = ocrTesseract.Read(input);

    // Print the final result and confidence
    Console.WriteLine($"Result: {result.Text}");
    Console.WriteLine($"Confidence: {result.Confidence}");
}
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Sortie

Sortie de l'image

Comme vous pouvez le constater, IronOCR parvient à déchiffrer la majeure partie du texte même dans ces conditions de forte distorsion, et le niveau de confiance correspond à celui indiqué par l'assistant de filtrage.

Questions Fréquemment Posées

Qu'est-ce que l'Assistant Filtre dans IronOCR ?

L'Assistant Filtre dans IronOCR est un outil conçu pour améliorer la précision de l'OCR en générant du code de traitement d'image sur mesure adapté à des types d'images spécifiques.

Comment l'Assistant Filtre améliore-t-il la précision de l'OCR ?

L'Assistant Filtre améliore la précision de l'OCR en permettant aux utilisateurs de créer des filtres de traitement d'image sur mesure qui peuvent être appliqués aux images avant la réalisation de l'OCR, garantissant ainsi de meilleurs résultats de reconnaissance de texte.

Puis-je utiliser l'Assistant Filtre pour différents types d'images ?

Oui, l'Assistant Filtre peut être utilisé pour générer du code de traitement sur mesure pour une variété de types d'images, le rendant polyvalent pour différents besoins OCR.

L'Assistant Filtre est-il difficile à utiliser pour les débutants ?

L'Assistant Filtre est conçu en pensant à la convivialité, le rendant accessible aux débutants comme aux utilisateurs expérimentés pour améliorer leurs projets OCR.

Quels sont les avantages de l'utilisation de code de traitement d'image sur mesure en OCR ?

L'utilisation de code de traitement d'image sur mesure peut améliorer considérablement la précision de l'extraction de texte, surtout dans des conditions difficiles telles que les images à faible contraste ou les images avec du bruit.

Ai-je besoin de compétences en programmation pour utiliser l'Assistant Filtre ?

Bien que des compétences en programmation puissent être bénéfiques, l'Assistant Filtre simplifie le processus de génération de code de traitement d'image, le rendant abordable pour les utilisateurs avec des niveaux techniques variés.

L'Assistant Filtre peut-il gérer le traitement par lot ?

L'Assistant Filtre est capable de générer du code qui peut être intégré dans des flux de travail de traitement par lot, permettant de gérer efficacement plusieurs images.

Quels types d'images bénéficient le plus de l'Assistant Filtre ?

Les images avec un faible contraste, du bruit ou des arrière-plans complexes bénéficient significativement des capacités de traitement sur mesure de l'Assistant Filtre, conduisant à une amélioration des résultats OCR.

Comment puis-je accéder à l'Assistant Filtre dans IronOCR ?

L'Assistant Filtre est accessible au sein de la suite IronOCR, fournissant aux utilisateurs des outils pour personnaliser le traitement d'image pour une performance OCR optimisée.

Y a-t-il un support disponible pour l'utilisation de l'Assistant Filtre ?

IronOCR offre de la documentation et des ressources de support pour aider les utilisateurs à utiliser efficacement l'Assistant Filtre pour leurs tâches OCR.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Prêt à commencer?
Nuget Téléchargements 5,167,857 | Version: 2025.11 vient de sortir