Wie man Bilder mit Hilfe von Filtern zum Lesen korrigiert
Bildkorrekturfilter sind digitale Bildverarbeitungstechniken, die zur Verbesserung der Qualität und der Eigenschaften eines Bildes eingesetzt werden, insbesondere zur Verbesserung der Texterkennung und -extraktion. Die in IronOCR verfügbaren Bildkorrekturfilter sind Schärfen, Auflösung verbessern, Entschärfen, Dilatieren und Erodieren.
Diese Bildkorrekturfilter spielen eine entscheidende Rolle bei der Vorverarbeitung von Bildern vor der OCR, da sie dazu beitragen, das Bild für eine genaue Textextraktion zu optimieren, indem sie die Qualität und Sichtbarkeit des Textes verbessern und unerwünschtes Rauschen oder Artefakte reduzieren.
Legen Sie los mit IronOCR
Beginnen Sie noch heute mit der Verwendung von IronOCR in Ihrem Projekt mit einer kostenlosen Testversion.
Wie man Bilder mit Hilfe von Filtern zum Lesen korrigiert
- Laden Sie eine C#-Bibliothek für die Bildkorrektur mit Filtern herunter
- Importieren Sie das PDF-Dokument und die Bilder zum Lesen
- Wenden Sie die gewünschten Filter an, z. B. Schärfen, Verbessern der Auflösung, Rauschunterdrückung, Dehnung und Erosion
- Exportieren Sie das korrigierte Bild zur Ansicht
- Verwenden Sie die
Read
-Methode für die OCR-Verarbeitung
Beispiel für einen Scharfzeichnungsfilter
Dieser Filter erhöht den Kontrast an den Kanten des Bildes und verleiht ihnen ein klareres Aussehen. Sie verbessert die Klarheit des Textes und der Details, so dass OCR-Software die Zeichen leichter erkennen kann.
Um den Schärfefilter anzuwenden, rufen Sie einfach die Sharpen
-Methode des OcrImageInput-Objekts auf.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-sharpen-filter.cs
using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Apply sharpen filter
imageInput.Sharpen();
// Export filtered image
imageInput.SaveAsImages("sharpen.jpg");
Imports IronOcr
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("sample.jpg")
' Apply sharpen filter
imageInput.Sharpen()
' Export filtered image
imageInput.SaveAsImages("sharpen.jpg")
Für mehr Komfort können Sie das gefilterte Bild mit der SaveAsImages
-Methode exportieren. Nachfolgend sehen Sie einen Vergleich des Bildes vor und nach Anwendung des Schärfefilters.

Vor

Nach
Beispiel für Auflösungsfilter erweitern
Dieser Filter erhöht die Pixeldichte eines Bildes und verbessert so dessen Schärfe und Klarheit. Sie kann besonders nützlich sein, um die Lesbarkeit von Text in Bildern mit niedriger Auflösung zu verbessern.
Ähnlich können Sie die EnhanceResolution
-Methode aufrufen, um den Filter für die verbesserte Auflösung anzuwenden. Diese Methode akzeptiert auch das gewünschte Ziel, wobei 225 DPI der Standardwert ist.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-enhance-resolution-filter.cs
// Apply enhance resolution filter
imageInput.EnhanceResolution();
' Apply enhance resolution filter
imageInput.EnhanceResolution()

Vor

Nach
Denoise Filter Beispiel
Entrauschungsfilter reduzieren den Grad des Rauschens oder unerwünschter Artefakte in einem Bild. Die Rauschunterdrückung ist für die OCR von entscheidender Bedeutung, da sie hilft, den Text von Hintergrundstörungen zu isolieren, was zu einer saubereren und genaueren Erkennung führt.
Um den Denoise-Filter anzuwenden, verwenden Sie die DeNoise
-Methode. Die Standardmorphologie ist 2x2, und die Übergabe von 'true' an die Methode aktiviert eine 3x3-Morphologie. Wenn Sie die Option 3x3 wählen, wird ein stärkerer Entrauschungsalgorithmus angewendet.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-denoise-filter.cs
// Apply denoise filter
imageInput.DeNoise();
' Apply denoise filter
imageInput.DeNoise()

Vor

Nach
Beispiel eines Dilatationsfilters
Dilatation ist ein Filter, der die helleren Bereiche (Vordergrund) in einem Bild erweitert. Es trägt dazu bei, den Text zu verdichten und zu verbessern, so dass er deutlicher hervortritt und von OCR-Software leichter interpretiert werden kann.
Um den Dilation-Filter anzuwenden, verwenden Sie die Dilate
-Methode. Ähnlich der DeNoise
-Methode ist die Standardmorphologie 2x2, und das Übergeben von 'true' aktiviert die 3x3-Option.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-dilate-filter.cs
// Apply dilate filter
imageInput.Dilate();
' Apply dilate filter
imageInput.Dilate()

Vor

Nach
Beispiel für einen Erodierfilter
Bei der Erosion hingegen werden helle Bereiche in einem Bild verkleinert oder reduziert. Dies kann nützlich sein, um Zeichen und Linien zu verfeinern, insbesondere wenn sie dick oder leicht verzerrt sind.
Verwenden Sie die Erode
-Methode, um den Erode-Filter anzuwenden. Ähnlich wie bei den beiden vorangegangenen Methoden ist 2x2 die Morphologie und der Wert true aktiviert die Option 3x3.
:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-erode-filter.cs
// Apply erode filter
imageInput.Erode();
' Apply erode filter
imageInput.Erode()

Vor

Nach