How to use the Filter Wizard

This article was translated from English: Does it need improvement?
Translated
View the article in English

Wenn es darum geht, ein Bild für den OCR-Prozess vorzubereiten und vorzubereiten, kann es entmutigend sein. Mehrere Filter können auf ein Bild angewendet werden; es kann jedoch kompliziert sein zu testen, welche Kombination am besten zu Ihrem Bild passt, da es oft von Fall zu Fall unterschiedlich ist. Der Prozess selbst kann unglaublich zeitaufwendig sein, da Sie immer wieder verschiedene Kombinationen ausprobieren, um zu überprüfen, welche Methode die besten Ergebnisse liefert.

IronOCR bietet jedoch eine effektive und einfache Möglichkeit, dies zu handhaben, indem es den OcrInputFilterWizard einführt. Der Filterassistent bewertet automatisch Kombinationen von Vorverarbeitungsfiltern, um die OCR-Zuverlässigkeit und -Genauigkeit zu maximieren. Es führt einen "Brute-Force"-Scan für optimale Einstellungen durch und gibt zusätzlich die beste Filterkombination als Code-Snippet zurück, damit Entwickler das Ergebnis einfach reproduzieren können.

In dieser Anleitung gehen wir schnell durch ein Beispiel, wie der Filterassistent funktioniert, und zeigen die Code-Snippets und Parameter, die er verwendet.

Schnellstart: Ihre ideale Bildfilterkette automatisch entdecken

Verwenden Sie den Filterassistenten von IronOCR, um schnell alle Vorverarbeitungsfilterkombinationen durchzuführen und das leistungsstärkste Code-Snippet zu erhalten – kein Rätselraten erforderlich. Nur eine Zeile liefert sowohl Ihre höchste Vertrauenswertung als auch die genaue C#-Filterkette, die Sie für ähnliche Bilder verwenden sollten.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    string code = OcrInputFilterWizard.Run("image.png", out double confidence, new IronTesseract());
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer
class="hsg-featured-snippet">

Minimaler Arbeitsablauf (5 Schritte)

  1. Laden Sie eine C#-Bibliothek herunter, um den Filterassistenten zu verwenden
  2. Instanziieren Sie die IronTesseract-Engine
  3. Laden Sie das Eingangsbild in den OcrInputFilterWizard
  4. Starten Sie den Filterassistenten und überprüfen Sie die Ergebnisse, wie z. B. das Vertrauen
  5. Verwenden Sie den bereitgestellten Code und wenden Sie ihn auf das Eingangsbild an und überprüfen Sie die Ergebnisse

Filterassistent-Beispiel

Die OcrInputFilterWizard.Run-Methode nimmt drei Parameter entgegen: das Eingabebild, einen Ausgabeparameter für die resultierende Vertrauensebene und die Tesseract-Engine-Instanz.

Es funktioniert mit einer Brute-Force-Methode, indem es wiederholt verschiedene Kombinationen von Vorverarbeitungsfiltern kombiniert, um die beste Vertrauensbewertung zu erzielen. Die höchste Vertrauensbewertung am Ende bestimmt, welche Vorverarbeitungs-Bildfilter Sie idealerweise auf Ihr Eingangsbild anwenden sollten.

Beachten Sie, dass es im Filterassistenten keine Voreinstellungen gibt und es keine Begrenzung für die Kombinationen gibt, die er ausprobieren kann. Der Hauptfokus des Filterassistenten liegt darauf, die bestmögliche Vertrauensbewertung zu erzielen, indem verschiedene Kombinationen von Bildfiltern getestet werden.

Hier ist eine Liste aller Filter, die es in seinen Kombinationen verwenden kann. Beachten Sie, dass dies alle Filtermethoden sind, die in der IronOCR-Bibliothek verfügbar sind:

  • input.Contrast()
  • input.Sharpen()
  • input.Binarize()
  • input.ToGrayScale()
  • input.Invert()
  • input.Deskew()
  • input.Scale(...)
  • input.Denoise()
  • input.DeepCleanBackgroundNoise()
  • input.EnhanceResolution()
  • input.Dilate(), input.Erode()

Für einen tieferen Einblick, was jeder einzelne Filter macht, schauen Sie sich bitte dieses umfangreiche Tutorial zu Bildfiltern an, das wir haben.

WarnungDa dies eine Brute-Force-Methode ist, wird dieser Vorgang einige Zeit in Anspruch nehmen, um abgeschlossen zu werden, da er viele Möglichkeiten testet, um das beste Ergebnis für Ihr Bild zu finden.

Eingabe

Für diesen Input verwenden wir einen Screenshot mit starkem künstlichem Rauschen, um die Funktionalität des Filterassistenten zu veranschaulichen.

class="content-img-align-center">
style="width=50%"> Eingangsbild

Code

:path=/static-assets/ocr/content-code-examples/how-to/filter-wizard-process.cs
using IronOcr;
using System;

// Initialize the Tesseract engine
var ocr = new IronTesseract();

// 1. Pass the image path ("noise.png").
// 2. Pass an 'out' variable to store the best confidence score found.
// 3. Pass the tesseract instance to be used for testing.
string codeToRun = OcrInputFilterWizard.Run("noise.png", out double confidence, ocr);

// The 'confidence' variable is now populated with the highest score achieved.
Console.WriteLine($"Best Confidence Score: {confidence}");

// 'codeToRun' holds the exact C# code snippet that achieved this score.
// The returned string is the code you can use to filter similar images.
Console.WriteLine("Recommended Filter Code:");
Console.WriteLine(codeToRun);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Ausgabe

class="content-img-align-center">
style="width=50%"> Ausgabe des Filterassistenten

Wie Sie aus der Ausgabe sehen können, hat der Filterassistent bestimmt, dass durch alle Kombinationen 65% Vertrauen das Beste ist, was er bei diesem spezifischen Bild erreichen kann.

WarnungDas Eingangsbild ist stark verzerrt und stark von künstlichem Rauschen beeinflusst. Dies ist ein Extremfall, der veranschaulichen soll, wie der Filterassistent von IronOCR helfen kann, selbst unter schwierigen Bedingungen.

Beste Kombination des Filterassistenten

Nachdem der Filterassistent ausgeführt wurde, können wir dann dem Code-Snippet folgen, das er bereitgestellt hat. Wir wenden diese genauen Einstellungen auf unser Eingangsbild an, um das Ergebnis und das Vertrauen zu überprüfen.

Code

:path=/static-assets/ocr/content-code-examples/how-to/filter-wizard-best-combination.cs
using IronOcr;
using System;

// Initialize the Tesseract engine
var ocrTesseract = new IronTesseract();

// Load the image into an OcrInput object
using (var input = new OcrImageInput("noise.png"))
{
    // Apply the exact filter chain recommended by the Wizard's output
    input.Invert();
    input.DeNoise();
    input.Contrast();
    input.AdaptiveThreshold();

    // Run OCR on the pre-processed image
    OcrResult result = ocrTesseract.Read(input);

    // Print the final result and confidence
    Console.WriteLine($"Result: {result.Text}");
    Console.WriteLine($"Confidence: {result.Confidence}");
}
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Ausgabe

class="content-img-align-center">
style="width=50%"> Ausgabe vom Bild

Wie Sie sehen können, kann IronOCR den größten Teil des Textes auch unter diesen stark verzerrten Bedingungen erkennen, und das Vertrauensniveau entspricht dem, was vom Filterassistenten gemeldet wurde.

Häufig gestellte Fragen

Was ist der Filter Wizard in IronOCR?

Der Filter Wizard in IronOCR ist ein Tool, das entwickelt wurde, um die OCR-Genauigkeit zu verbessern, indem benutzerdefinierter Bildverarbeitungscode für bestimmte Bildtypen generiert wird.

Wie verbessert der Filter Wizard die OCR-Genauigkeit?

Der Filter Wizard verbessert die OCR-Genauigkeit, indem Benutzer benutzerdefinierte Bildverarbeitungsfilter erstellen können, die vor der OCR auf Bilder angewendet werden, um bessere Texterkennungsergebnisse sicherzustellen.

Kann ich den Filter Wizard für verschiedene Bildtypen verwenden?

Ja, der Filter Wizard kann verwendet werden, um benutzerdefinierten Verarbeitungscode für eine Vielzahl von Bildtypen zu generieren, was ihn vielseitig für unterschiedliche OCR-Anforderungen macht.

Ist der Filter Wizard für Anfänger schwer zu verwenden?

Der Filter Wizard ist mit Benutzerfreundlichkeit im Hinterkopf entwickelt worden, was ihn sowohl für Anfänger als auch erfahrene Benutzer zugänglich macht, um ihre OCR-Projekte zu verbessern.

Welche Vorteile hat die Verwendung von benutzerdefiniertem Bildverarbeitungscode in der OCR?

Die Verwendung von benutzerdefiniertem Bildverarbeitungscode kann die Genauigkeit der Texterfassung erheblich verbessern, insbesondere unter schwierigen Bedingungen wie Bildern mit geringem Kontrast oder Bildern mit Rauschen.

Benötige ich Programmierkenntnisse, um den Filter Wizard zu verwenden?

Obwohl Programmierkenntnisse von Vorteil sein können, vereinfacht der Filter Wizard den Prozess der Erstellung von Bildverarbeitungscode, was ihn für Benutzer mit unterschiedlichem technischen Hintergrund zugänglich macht.

Kann der Filter Wizard Batch-Verarbeitung durchführen?

Der Filter Wizard ist in der Lage, Code zu generieren, der in Batch-Verarbeitungs-Workflows integriert werden kann, was die effiziente Handhabung mehrerer Bilder ermöglicht.

Welche Bildtypen profitieren am meisten vom Filter Wizard?

Bilder mit geringem Kontrast, Rauschen oder komplexen Hintergründen profitieren erheblich von den benutzerdefinierten Verarbeitungsmöglichkeiten des Filter Wizards, was zu verbesserten OCR-Ergebnissen führt.

Wie greife ich auf den Filter Wizard in IronOCR zu?

Der Filter Wizard kann innerhalb der IronOCR Suite aufgerufen werden, was Benutzern Werkzeuge zur Anpassung der Bildverarbeitung bietet, um die OCR-Leistung zu optimieren.

Gibt es Support für die Nutzung des Filter Wizards?

IronOCR bietet Dokumentation und Support-Ressourcen, um Benutzern bei der effektiven Nutzung des Filter Wizards für ihre OCR-Aufgaben zu helfen.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen
Bereit anzufangen?
Nuget Downloads 5,044,537 | Version: 2025.11 gerade veröffentlicht