How to use the Filter Wizard

This article was translated from English: Does it need improvement?
Translated
View the article in English

Le prétraitement et la préparation d'une image pour le processus d'OCR peuvent s'avérer décourageants. Plusieurs filtres peuvent être utilisés sur une image ; cependant, il peut être compliqué de tester la combinaison qui convient le mieux à votre image, car il s'agit souvent d'une question de cas par cas. Le processus lui-même peut prendre énormément de temps, car vous devez essayer différentes combinaisons à plusieurs reprises pour vérifier quelle méthode donne les meilleurs résultats.

Cependant, IronOcr fournit un moyen efficace et facile de gérer cela en introduisant le OcrInputFilterWizard. L'assistant de filtre évalue automatiquement les combinaisons de filtres de prétraitement pour maximiser la confiance et la précision de l'OCR. Elle effectue une analyse "brute" des paramètres optimaux et renvoie en outre la meilleure combinaison de filtres sous la forme d'un extrait de code, ce qui permet aux développeurs de reproduire facilement le résultat.

Dans ce guide pratique, nous allons rapidement passer en revue un exemple de fonctionnement de l'assistant de filtrage et présenter les extraits de code et les paramètres qu'il utilise.

Démarrage rapide : découvrez automatiquement votre chaîne de filtres d'images idéale

Utilisez l'assistant de filtre d'IronOcr pour exécuter rapidement toutes les combinaisons de filtres de prétraitement et obtenir l'extrait de code le plus performant, sans avoir à deviner. Une seule ligne permet d'obtenir à la fois votre score de confiance le plus élevé et la chaîne de filtrage C# exacte que vous devez utiliser pour des images similaires.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    string code = OcrInputFilterWizard.Run("image.png", out double confidence, new IronTesseract());
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer

Exemple d'assistant de filtre

La méthode OcrInputFilterWizard.Run prend trois paramètres : l'image d'entrée, un paramètre de sortie pour le niveau de confiance résultant, et l'instance du moteur Tesseract.

Il utilise une méthode de force brute en combinant de manière répétée différentes combinaisons de filtres de prétraitement afin d'obtenir le meilleur score de confiance. Le score de confiance le plus élevé à la fin détermine l'ensemble de filtres de prétraitement d'image que vous devriez idéalement appliquer à votre image d'entrée.

Notez qu'il n'y a pas de préréglages dans l'assistant de filtrage et qu'il n'y a pas de limite aux combinaisons qu'il peut essayer. L'objectif principal de l'assistant de filtrage est d'obtenir le meilleur score de confiance possible en testant diverses combinaisons de filtres d'image.

Voici une liste de tous les filtres qu'il peut utiliser dans ses combinaisons. Notez qu'il s'agit là de toutes les méthodes de filtrage disponibles au sein de la bibliothèque IronOcr :

  • input.Contrast()
  • input.Sharpen()
  • input.Binarize()
  • input.ToGrayScale()
  • input.Invert()
  • input.Deskew()
  • input.Scale(...)
  • input.Denoise()
  • input.DeepCleanBackgroundNoise()
  • input.EnhanceResolution()
  • input.Dilate(), input.Erode()

Pour un aperçu plus approfondi de ce que fait chaque filtre individuel, veuillez vous référer à ce tutoriel complet sur les filtres d'image que nous avons.

[{w :( Comme il s'agit d'une méthode de force brute, cette opération prendra un certain temps car elle teste de nombreuses possibilités pour trouver le meilleur résultat pour votre image.)}]]

Entrée

Pour cette entrée, nous utiliserons une capture d'écran avec un bruit artificiel important pour illustrer la fonctionnalité de l'assistant de filtrage.

Input Image

Code

:path=/static-assets/ocr/content-code-examples/how-to/filter-wizard-process.cs
using IronOcr;
using System;

// Initialize the Tesseract engine
var ocr = new IronTesseract();

// 1. Pass the image path ("noise.png").
// 2. Pass an 'out' variable to store the best confidence score found.
// 3. Pass the tesseract instance to be used for testing.
string codeToRun = OcrInputFilterWizard.Run("noise.png", out double confidence, ocr);

// The 'confidence' variable is now populated with the highest score achieved.
Console.WriteLine($"Best Confidence Score: {confidence}");

// 'codeToRun' holds the exact C# code snippet that achieved this score.
// The returned string is the code you can use to filter similar images.
Console.WriteLine("Recommended Filter Code:");
Console.WriteLine(codeToRun);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Sortie

Sortie de l'assistant de filtre

Comme vous pouvez le voir dans son résultat, l'assistant de filtrage a déterminé que, parmi toutes les combinaisons, 65 % de confiance est le meilleur résultat qu'il puisse obtenir avec cette image spécifique.

{w :(L'image d'entrée est fortement déformée et fortement affectée par le bruit artificiel. Il s'agit d'un cas extrême destiné à illustrer la façon dont l'assistant de filtrage d'IronOcr peut aider, même dans des scénarios difficiles.)}]

L'assistant de filtrage : la meilleure combinaison

Une fois l'assistant de filtrage exécuté, nous pouvons suivre l'extrait de code qu'il fournit. Nous appliquons ces paramètres exacts à notre image d'entrée pour vérifier le résultat et la confiance.

Code

:path=/static-assets/ocr/content-code-examples/how-to/filter-wizard-best-combination.cs
using IronOcr;
using System;

// Initialize the Tesseract engine
var ocrTesseract = new IronTesseract();

// Load the image into an OcrInput object
using (var input = new OcrImageInput("noise.png"))
{
    // Apply the exact filter chain recommended by the Wizard's output
    input.Invert();
    input.DeNoise();
    input.Contrast();
    input.AdaptiveThreshold();

    // Run OCR on the pre-processed image
    OcrResult result = ocrTesseract.Read(input);

    // Print the final result and confidence
    Console.WriteLine($"Result: {result.Text}");
    Console.WriteLine($"Confidence: {result.Confidence}");
}
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Sortie

Sortie de l'image

Comme vous pouvez le constater, IronOcr parvient à distinguer la majeure partie du texte, même dans ces conditions de forte distorsion, et le niveau de confiance correspond à ce qui a été indiqué par l'assistant de filtrage.

Questions Fréquemment Posées

Qu'est-ce que l'Assistant Filtre dans IronOCR ?

L'Assistant Filtre dans IronOCR est un outil conçu pour améliorer la précision de l'OCR en générant du code de traitement d'image sur mesure adapté à des types d'images spécifiques.

Comment l'Assistant Filtre améliore-t-il la précision de l'OCR ?

L'Assistant Filtre améliore la précision de l'OCR en permettant aux utilisateurs de créer des filtres de traitement d'image sur mesure qui peuvent être appliqués aux images avant la réalisation de l'OCR, garantissant ainsi de meilleurs résultats de reconnaissance de texte.

Puis-je utiliser l'Assistant Filtre pour différents types d'images ?

Oui, l'Assistant Filtre peut être utilisé pour générer du code de traitement sur mesure pour une variété de types d'images, le rendant polyvalent pour différents besoins OCR.

L'Assistant Filtre est-il difficile à utiliser pour les débutants ?

L'Assistant Filtre est conçu en pensant à la convivialité, le rendant accessible aux débutants comme aux utilisateurs expérimentés pour améliorer leurs projets OCR.

Quels sont les avantages de l'utilisation de code de traitement d'image sur mesure en OCR ?

L'utilisation de code de traitement d'image sur mesure peut améliorer considérablement la précision de l'extraction de texte, surtout dans des conditions difficiles telles que les images à faible contraste ou les images avec du bruit.

Ai-je besoin de compétences en programmation pour utiliser l'Assistant Filtre ?

Bien que des compétences en programmation puissent être bénéfiques, l'Assistant Filtre simplifie le processus de génération de code de traitement d'image, le rendant abordable pour les utilisateurs avec des niveaux techniques variés.

L'Assistant Filtre peut-il gérer le traitement par lot ?

L'Assistant Filtre est capable de générer du code qui peut être intégré dans des flux de travail de traitement par lot, permettant de gérer efficacement plusieurs images.

Quels types d'images bénéficient le plus de l'Assistant Filtre ?

Les images avec un faible contraste, du bruit ou des arrière-plans complexes bénéficient significativement des capacités de traitement sur mesure de l'Assistant Filtre, conduisant à une amélioration des résultats OCR.

Comment puis-je accéder à l'Assistant Filtre dans IronOCR ?

L'Assistant Filtre est accessible au sein de la suite IronOCR, fournissant aux utilisateurs des outils pour personnaliser le traitement d'image pour une performance OCR optimisée.

Y a-t-il un support disponible pour l'utilisation de l'Assistant Filtre ?

IronOCR offre de la documentation et des ressources de support pour aider les utilisateurs à utiliser efficacement l'Assistant Filtre pour leurs tâches OCR.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Prêt à commencer?
Nuget Téléchargements 5,044,537 | Version : 2025.11 vient de sortir