Wie man in C# einen bestimmten OCR-Bereich eines Bildes definiert

This article was translated from English: Does it need improvement?
Translated
View the article in English

Oftmals genügt es, Text aus einem kleinen Teil eines Bildes zu extrahieren, beispielsweise einen Gesamtbetrag auf einer Rechnung oder ein bestimmtes Feld aus einem Formular. Das Scannen des gesamten Dokuments ist ineffizient und kann zu Fehlern führen, da irrelevanter Text erfasst wird.

Mit IronOCR können Sie Präzision, Leistung und Genauigkeit verbessern, indem Sie den exakten rechteckigen Bereich zum Scannen festlegen. Dieser Leitfaden bietet eine Schritt-für-Schritt-Anleitung, wie Sie einen bestimmten OCR-Bereich definieren, Text daraus extrahieren und visuell überprüfen, ob Ihre Koordinaten für Ihre OCR-Aufgaben korrekt sind.

Erste Schritte mit IronOCR

Nutzen Sie IronOCR heute kostenlos in Ihrem Projekt.

Erster Schritt:
green arrow pointer


Führen Sie OCR auf einer bestimmten Region durch

Um einen bestimmten OCR-Bereich zu definieren, erstellen Sie ein Rectangle Objekt aus dem Namespace Iron Software.Drawing. Dieses Objekt benötigt vier Werte: die x-Koordinate, die y-Koordinate, die Breite und die Höhe, alle in Pixeln. Die (x, y)-Koordinaten stellen die obere linke Ecke des gewünschten Bereichs dar.

Wenn Sie Ihr Bild mit LoadImage laden, übergeben Sie dieses Rectangle als zweiten Parameter. IronOCR beschränkt seinen OCR-Prozess dann auf die Pixel innerhalb dieses Begrenzungsrahmens.

TippsUm die Koordinaten für Ihr Rechteck zu finden, können Sie einen einfachen Bildeditor wie MS Paint verwenden. Öffnen Sie Ihr Eingabebild, bewegen Sie den Mauszeiger über die obere linke und die untere rechte Ecke des angegebenen Bereichs und notieren Sie sich die (x, y)-Pixelkoordinaten. Anschließend können Sie die Eigenschaften des Rechtecks berechnen: (x1, y1, Breite, Höhe), wobei Breite = x2-x1 und Höhe = y2-y1.

OCR-Eingabe

Wir verwenden ein Beispielbild mit drei Absätzen. Unser Ziel ist es, nur den zweiten Absatz zu extrahieren und den restlichen Text zu ignorieren.

OCR-Eingabe

Code

:path=/static-assets/ocr/content-code-examples/how-to/ocr-region-of-an-image.cs
using IronOcr;
using IronSoftware.Drawing;
using System;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Define the specific region as a Rectangle
// (x, y) is the top-left corner.
var ContentArea = new Rectangle(x: 215, y: 1250, width: 1335, height: 280);

ocrInput.LoadImage("region-input.png", ContentArea);

var ocrResult = ocrTesseract.Read(ocrInput);

// Print the extracted text
Console.WriteLine(ocrResult.Text);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Ausgabe

Wie Sie der Konsolenausgabe entnehmen können, wird von der OCR nur der zweite Absatz verarbeitet.

OCR-Ausgabe

Überprüfung des OCR-Bereichs eines Bildes

Um sicherzustellen, dass Sie die richtigen Koordinaten für das Eingabebild ausgewählt haben, können Sie den von Ihnen definierten Inhaltsbereich visualisieren. Eine einfache Möglichkeit, dies zu tun, besteht darin, das Rechteck auf das Eingabebild zu zeichnen und es mit StampCropRectangleAndSaveAs als neue Datei zu speichern. Dies hilft Ihnen, die Koordinaten zu debuggen und für eine optimale Leistung zu optimieren.

Hier sehen Sie das Ergebnisbild, nachdem der angegebene Begrenzungsrahmen auf unser obiges Beispielbild gezeichnet wurde.

Code

:path=/static-assets/ocr/content-code-examples/how-to/ocr-region-of-an-image-highlighted.cs
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Define the specific rectangular area to scan within the image.
// The coordinates are in pixels: (x, y) is the top-left corner of the rectangle.
var ContentArea = new Rectangle(x: 4, y: 59, width: 365, height: 26);

ocrInput.LoadImage("region-input.png", ContentArea);

var ocrResult = ocrTesseract.Read(ocrInput);

// Draws the rectangle from above in a blue bounding box on the image for visualization.
ocrInput.StampCropRectangleAndSaveAs(ContentArea, Color.Aqua, "region-input.png");
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Ausgabe

OCR-hervorgehobene Ausgabe

Das hellblaue Rechteck bestätigt, dass wir den zweiten Absatz korrekt zur Weiterverarbeitung ausgewählt haben.

Häufig gestellte Fragen

Warum sollte ich einen bestimmten OCR-Bereich eines Bildes definieren?

Die Definition eines bestimmten OCR-Bereichs eines Bildes ist hilfreich, um die Präzision und Genauigkeit zu verbessern, indem man sich auf den relevanten Bereich konzentriert, beispielsweise auf den Gesamtbetrag einer Rechnung, anstatt das gesamte Dokument zu scannen, was zu Fehlern führen kann.

Wie kann ich mit IronOCR einen OCR-Bereich festlegen?

In IronOCR können Sie einen OCR-Bereich festlegen, indem Sie ein `Rectangle`-Objekt mit den gewünschten Koordinaten und Abmessungen erstellen. Dieses Rechteck übergeben Sie dann an die `LoadImage`-Methode, um die OCR-Verarbeitung auf diesen spezifischen Bereich zu beschränken.

Welche Parameter sind für die Definition einer OCR-Region erforderlich?

Um einen OCR-Bereich zu definieren, müssen Sie vier Parameter für das `Rectangle`-Objekt angeben: x-Koordinate, y-Koordinate, Breite und Höhe. Diese Parameter bestimmen die obere linke Ecke und die Größe des Bereichs.

Wie kann ich sicherstellen, dass die richtigen Koordinaten für die OCR ausgewählt werden?

Um die korrekten Koordinaten sicherzustellen, visualisieren Sie den definierten Inhaltsbereich, indem Sie mit `StampCropRectangleAndSaveAs` ein Rechteck auf das Eingabebild zeichnen. Dies erleichtert das Debuggen und die Feinabstimmung der Koordinaten.

Welche Werkzeuge kann ich verwenden, um die Koordinaten für meinen OCR-Bereich zu finden?

Sie können ein einfaches Bildbearbeitungsprogramm wie MS Paint verwenden, um die Koordinaten für Ihren OCR-Bereich zu ermitteln. Bewegen Sie den Mauszeiger über die obere linke und die untere rechte Ecke des gewünschten Bereichs, um die (x, y)-Pixelkoordinaten zu notieren.

Welchen Vorteil bietet die Verwendung von IronOCR für regionsspezifische OCR-Aufgaben?

IronOCR ermöglicht es Ihnen, Text effizient aus bestimmten Bereichen eines Bildes zu extrahieren, wodurch Fehler reduziert und die Leistung verbessert werden, indem die Erfassung von irrelevantem Text verhindert wird.

Kann ich den OCR-Bereich vor der Verarbeitung visuell überprüfen?

Ja, Sie können den OCR-Bereich visuell überprüfen, indem Sie ein Rechteck auf das Eingabebild zeichnen. Dies bestätigt, dass der richtige Bereich für die Verarbeitung isoliert ist und gewährleistet somit die Genauigkeit.

Welche Arten von Bildern kann ich mit IronOCR verarbeiten?

IronOCR kann eine Vielzahl von Bildformaten verarbeiten und ermöglicht es Ihnen, Text aus bestimmten Bereichen von Bildern zu extrahieren, die in Dokumenten, Formularen und Rechnungen verwendet werden.

Wie handhabt IronOCR den OCR-Prozess innerhalb einer bestimmten Region?

IronOCR beschränkt seinen OCR-Prozess auf Pixel innerhalb des angegebenen Begrenzungsrahmens und stellt so sicher, dass nur der Text innerhalb des definierten Bereichs extrahiert wird.

Welches Ausgabeformat liefert der OCR-Prozess in IronOCR?

Das Ausgabeformat des OCR-Prozesses in IronOCR ist über die `OcrResult`-Eigenschaft zugänglich, sodass Sie die extrahierten Daten nach Bedarf anzeigen und bearbeiten können.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen
Bereit anzufangen?
Nuget Downloads 5,167,857 | Version: 2025.11 gerade veröffentlicht