Bildausrichtung zum Lesen korrigieren

Chaknith Bin

31. Oktober 2023

Aktualisiert 10. Dezember 2024

Teilen Sie:

Translated

View the article in English

Bei der Bildausrichtung im Rahmen der Bildverarbeitung geht es darum, ein Bild zu korrigieren, um sicherzustellen, dass es für bestimmte Zwecke, z. B. die Texterkennung, richtig ausgerichtet ist. IronOCR unterstützt die Fixierung der Bildausrichtung, einschließlich Drehung, Schräglagenkorrektur und Skalierung.

Diese Techniken sind für die Vorbereitung von Bildern für eine genaue Texterkennung unerlässlich, da sie sicherstellen, dass der Text für die Extraktion richtig ausgerichtet und in der richtigen Größe vorliegt.

Legen Sie los mit IronOCR

Beginnen Sie noch heute mit der Verwendung von IronOCR in Ihrem Projekt mit einer kostenlosen Testversion.

Erster Schritt:

Bildausrichtung zum Lesen korrigieren

Laden Sie eine C#-Bibliothek herunter, um die Bildausrichtung zu korrigieren
Importieren Sie das PDF-Dokument und die Bilder zum Lesen
Anwenden der gewünschten Ausrichtungskorrekturen, z. B. Drehung, Schrägstellung und Skalierung
Exportieren Sie das korrigierte Bild zur Ansicht
Verwenden Sie die Read-Methode für die OCR-Verarbeitung

Beispiel für das Drehen von Bildern

Das Drehen eines Bildes beinhaltet das Ändern seiner Ausrichtung um einen bestimmten Winkel (z.B. 90 Grad im Uhrzeigersinn oder gegen den Uhrzeigersinn), um sicherzustellen, dass der Text oder der Inhalt im Bild aufrecht und korrekt ausgerichtet ist.

Übergeben Sie einen Gradwert an die Rotate-Methode, um die Drehung durchzuführen. Ein positiver Gradwert dreht das Bild im Uhrzeigersinn, während ein negativer Gradwert das Bild gegen den Uhrzeigersinn dreht.

:path=/static-assets/ocr/content-code-examples/how-to/image-orientation-correction-rotate-image.cs

using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Rotate the image 180 degrees clockwise
imageInput.Rotate(180);

// Export the modified image
imageInput.SaveAsImages("rotate");

Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("paragraph_skewed.png")

' Rotate the image 180 degrees clockwise
imageInput.Rotate(180)

' Export the modified image
imageInput.SaveAsImages("rotate")

$vbLabelText $csharpLabel

Zur Bequemlichkeit können Sie das bearbeitete Bild mit der Methode SaveAsImages exportieren. Nachfolgend sehen Sie einen Vergleich des Bildes vor und nach der Drehung.

Vor

Nach

Beispiel für das Geraderücken von Bildern

Beim Entzerren wird ein Bild, das möglicherweise leicht geneigt oder schief ist, begradigt. Sie korrigiert jede Schräglage oder Fehlausrichtung und sorgt dafür, dass der Text oder Inhalt horizontal ausgerichtet erscheint.

Um die Bildentzerrung anzuwenden, verwenden Sie die Deskew-Methode. Diese Methode akzeptiert einen ganzzahligen Wert, der den maximalen Winkel der zu korrigierenden Schräglage angibt. Höhere Werte bieten zwar mehr Möglichkeiten zur Korrektur, können aber zu einer langsameren Verarbeitung und einem erhöhten Fehlerrisiko führen, einschließlich auf dem Kopf stehender Seiten.

:path=/static-assets/ocr/content-code-examples/how-to/image-orientation-correction-deskew-image.cs

// Apply deskew
imageInput.Deskew();

' Apply deskew
imageInput.Deskew()

$vbLabelText $csharpLabel

Vor

Nach

Beispiel für ein skaliertes Bild

Beim Skalieren wird die Größe eines Bildes auf ein bestimmtes Maß oder Seitenverhältnis angepasst. Dies kann nützlich sein, um Bildgrößen für eine einheitlichere Texterkennung zu standardisieren.

Um eine Skalierung auf das Bild anzuwenden, verwenden Sie die Scale-Methode. Die Methode Scale nimmt einen Prozentwert an, wobei 100 % keine Wirkung bedeutet. Der zweite Parameter ist der ScaleCropArea, welcher bestimmt, ob die zugehörigen Bearbeitungsbereiche ebenfalls proportional skaliert werden sollen (empfohlen als 'true').

:path=/static-assets/ocr/content-code-examples/how-to/image-orientation-correction-scale-image.cs

// Apply scale
imageInput.Scale(70);

' Apply scale
imageInput.Scale(70)

$vbLabelText $csharpLabel

Größenvergleich

Chaknith Bin

Jetzt mit dem Ingenieurteam chatten

Software-Ingenieur

Chaknith ist der Sherlock Holmes der Entwickler. Zum ersten Mal kam ihm der Gedanke, dass er eine Zukunft in der Softwareentwicklung haben könnte, als er zum Spaß an Code Challenges teilnahm. Sein Schwerpunkt liegt auf IronXL und IronBarcode, aber er ist stolz darauf, Kunden mit jedem Produkt zu helfen. Chaknith nutzt sein Wissen aus direkten Gesprächen mit Kunden, um die Produkte selbst weiter zu verbessern. Sein anekdotisches Feedback geht über Jira-Tickets hinaus und unterstützt die Produktentwicklung, die Dokumentation und das Marketing, um das Gesamterlebnis der Kunden zu verbessern.Wenn er nicht im Büro ist, lernt er über maschinelles Lernen, programmiert und wandert.