How to Define a Specific OCR Region of an Image

This article was translated from English: Does it need improvement?
Translated
View the article in English

Often, you only need to extract text from a small part of an image, such as a total amount on an invoice or a specific field from a form. Scanning the full document is inefficient and can introduce errors by capturing irrelevant text.

IronOCR allows you to improve precision, performance, and accuracy by specifying the exact rectangular region to scan. This guide provides a step-by-step walkthrough on how to define a specific OCR region, extract text from it, and visually verify that your coordinates are correct for your OCR tasks.

Get Started with IronOCR

Commencez à utiliser IronOCR dans votre projet aujourd'hui avec un essai gratuit.

Première étape :
green arrow pointer


Perform OCR on Specific Region

To define a specific OCR region, you create a Rectangle object from the IronSoftware.Drawing namespace. This object requires four values: the x-coordinate, the y-coordinate, the width, and the height, all in pixels. The (x, y) coordinates represent the top-left corner of your desired area.

When you load your image using LoadImage, you pass this Rectangle as the second parameter. IronOCR will then restrict its OCR process to only the pixels within that bounding box.

ConseilsTo find the coordinates for your Rectangle, you can use a simple image editor like MS Paint. Open your input image, hover your mouse over the top-left and bottom-right corners of the specified region, and note the (x, y) pixel coordinates. You can then calculate the rectangle's properties: (x1, y1, width, height), where width = x2-x1 and height = y2-y1.

OCR Input

We'll use a sample image with three paragraphs. Our goal is to extract only the second paragraph and ignore the rest of the text.

OCR Input

Code

:path=/static-assets/ocr/content-code-examples/how-to/ocr-region-of-an-image.cs
using IronOcr;
using IronSoftware.Drawing;
using System;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Define the specific region as a Rectangle
// (x, y) is the top-left corner.
var ContentArea = new Rectangle(x: 215, y: 1250, width: 1335, height: 280);

ocrInput.LoadImage("region-input.png", ContentArea);

var ocrResult = ocrTesseract.Read(ocrInput);

// Print the extracted text
Console.WriteLine(ocrResult.Text);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Output

As you can see from the console output, only the second paragraph is processed by the OCR.

OCR Output

Verifying the OCR region of an Image

To ensure you've selected the correct coordinates for the input image, you can visualize the ContentArea you defined. A simple way to do this is to draw the rectangle on the input image and save it as a new file with StampCropRectangleAndSaveAs. This helps you debug and fine-tune the coordinates for optimal performance.

Here is the output image after drawing the specified bounding box on our example input image from above.

Code

:path=/static-assets/ocr/content-code-examples/how-to/ocr-region-of-an-image-highlighted.cs
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Define the specific rectangular area to scan within the image.
// The coordinates are in pixels: (x, y) is the top-left corner of the rectangle.
var ContentArea = new Rectangle(x: 4, y: 59, width: 365, height: 26);

ocrInput.LoadImage("region-input.png", ContentArea);

var ocrResult = ocrTesseract.Read(ocrInput);

// Draws the rectangle from above in a blue bounding box on the image for visualization.
ocrInput.StampCropRectangleAndSaveAs(ContentArea, Color.Aqua, "region-input.png");
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Output

OCR Highlighted Output

The light blue rectangle confirms that we have correctly isolated the second paragraph for processing.

Questions Fréquemment Posées

Pourquoi dois-je définir une région OCR spécifique d'une image ?

Définir une région OCR spécifique d'une image est utile pour améliorer la précision et l'exactitude en se concentrant sur la zone d'intérêt, comme le montant total d'une facture, plutôt que de scanner l'intégralité du document, ce qui peut introduire des erreurs.

Comment puis-je spécifier une région OCR avec IronOCR ?

Dans IronOCR, vous pouvez définir une zone de reconnaissance optique de caractères (OCR) en créant un objet `Rectangle` avec les coordonnées et dimensions souhaitées. Vous transmettez ensuite ce rectangle à la méthode `LoadImage`, limitant ainsi le traitement OCR à cette zone spécifique.

Quels sont les paramètres requis pour définir une région OCR ?

Pour définir une zone de reconnaissance optique de caractères (OCR), vous devez fournir quatre paramètres à l'objet `Rectangle` : la coordonnée x, la coordonnée y, la largeur et la hauteur. Ces paramètres déterminent le coin supérieur gauche et la taille de la zone.

Comment puis-je m'assurer que les coordonnées correctes sont sélectionnées pour la reconnaissance optique de caractères (OCR) ?

Pour garantir l'exactitude des coordonnées, visualisez la zone de contenu définie en dessinant un rectangle sur l'image d'entrée à l'aide de `StampCropRectangleAndSaveAs`. Cela facilite le débogage et l'ajustement précis des coordonnées.

Quels outils puis-je utiliser pour trouver les coordonnées de ma région OCR ?

Vous pouvez utiliser un éditeur d'images simple comme MS Paint pour trouver les coordonnées de votre zone de reconnaissance optique de caractères (OCR). Placez votre curseur sur les coins supérieur gauche et inférieur droit de la zone souhaitée pour noter les coordonnées (x, y) en pixels.

Quel est l'avantage d'utiliser IronOCR pour les tâches OCR spécifiques à une région ?

IronOCR vous permet d'extraire efficacement du texte à partir de régions spécifiques d'une image, réduisant ainsi les erreurs et améliorant les performances en évitant la capture de texte non pertinent.

Puis-je vérifier visuellement la zone OCR avant le traitement ?

Oui, vous pouvez vérifier visuellement la zone de reconnaissance optique de caractères (OCR) en traçant un rectangle sur l'image d'entrée. Cela confirme que la zone correcte est isolée pour le traitement, garantissant ainsi l'exactitude de la reconnaissance.

Quels types d'images puis-je traiter avec IronOCR ?

IronOCR peut traiter divers formats d'image, vous permettant d'extraire du texte de régions spécifiques d'images utilisées dans des documents, des formulaires et des factures.

Comment IronOCR gère-t-il le processus OCR au sein d'une région spécifiée ?

IronOCR limite son processus OCR aux pixels situés à l'intérieur du cadre de délimitation spécifié, garantissant ainsi que seul le texte contenu dans la région définie est extrait.

Quel est le format de sortie du processus OCR dans IronOCR ?

Le format de sortie du processus OCR dans IronOCR est accessible via la propriété `OcrResult`, ce qui vous permet de visualiser et de manipuler les données extraites selon vos besoins.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Prêt à commencer?
Nuget Téléchargements 5,044,537 | Version : 2025.11 vient de sortir