Comment définir une région OCR spécifique d'une image en C

This article was translated from English: Does it need improvement?
Translated
View the article in English

Souvent, il suffit d'extraire du texte d'une petite partie d'une image, comme le montant total d'une facture ou un champ spécifique d'un formulaire. La numérisation de l'intégralité du document est inefficace et peut introduire des erreurs en capturant du texte non pertinent.

IronOCR vous permet d'améliorer la précision, les performances et l'exactitude en spécifiant la région rectangulaire exacte à scanner. Ce guide fournit une procédure pas à pas pour définir une région OCR spécifique, en extraire du texte et vérifier visuellement que vos coordonnées sont correctes pour vos tâches OCR.

Commencez avec IronOCR

Commencez à utiliser IronOCR dans votre projet aujourd'hui avec un essai gratuit.

Première étape :
green arrow pointer


Effectuer une reconnaissance optique de caractères (OCR) sur une région spécifique

Pour définir une région OCR spécifique, vous créez un objet Rectangle à partir de l'espace de noms Iron Software.Drawing. Cet objet nécessite quatre valeurs : la coordonnée x, la coordonnée y, la largeur et la hauteur, toutes en pixels. Les coordonnées (x, y) représentent le coin supérieur gauche de la zone souhaitée.

Lorsque vous chargez votre image à l'aide LoadImage , vous transmettez ce Rectangle comme deuxième paramètre. IronOCR limitera alors son processus OCR aux seuls pixels situés à l'intérieur de ce cadre de délimitation.

[{t:(Pour trouver les coordonnées de votre rectangle, vous pouvez utiliser un éditeur d'images simple comme MS Paint. Ouvrez votre image d'entrée, placez votre souris sur les coins supérieur gauche et inférieur droit de la région spécifiée et notez les coordonnées (x, y) des pixels. Vous pouvez ensuite calculer les propriétés du rectangle : (x1, y1, largeur, hauteur), où largeur = x2 - x1 et hauteur = y2 - y1.

Saisie OCR

Nous utiliserons une image d'exemple contenant trois paragraphes. Notre objectif est d'extraire uniquement le deuxième paragraphe et d'ignorer le reste du texte.

Entrée OCR

Code

:path=/static-assets/ocr/content-code-examples/how-to/ocr-region-of-an-image.cs
using IronOcr;
using IronSoftware.Drawing;
using System;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Define the specific region as a Rectangle
// (x, y) is the top-left corner.
var ContentArea = new Rectangle(x: 215, y: 1250, width: 1335, height: 280);

ocrInput.LoadImage("region-input.png", ContentArea);

var ocrResult = ocrTesseract.Read(ocrInput);

// Print the extracted text
Console.WriteLine(ocrResult.Text);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Sortie

Comme vous pouvez le constater dans la sortie de la console, seul le deuxième paragraphe est traité par l'OCR.

Sortie OCR

Vérification de la région OCR d'une image

Pour vous assurer que vous avez sélectionné les coordonnées correctes pour l'image d'entrée, vous pouvez visualiser la zone de contenu que vous avez définie. Une façon simple de procéder consiste à dessiner le rectangle sur l'image d'entrée et à l'enregistrer comme un nouveau fichier avec StampCropRectangleAndSaveAs . Cela vous permet de déboguer et d'affiner les coordonnées pour des performances optimales.

Voici l'image résultante après avoir tracé le cadre de délimitation spécifié sur notre image d'entrée d'exemple ci-dessus.

Code

:path=/static-assets/ocr/content-code-examples/how-to/ocr-region-of-an-image-highlighted.cs
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Define the specific rectangular area to scan within the image.
// The coordinates are in pixels: (x, y) is the top-left corner of the rectangle.
var ContentArea = new Rectangle(x: 4, y: 59, width: 365, height: 26);

ocrInput.LoadImage("region-input.png", ContentArea);

var ocrResult = ocrTesseract.Read(ocrInput);

// Draws the rectangle from above in a blue bounding box on the image for visualization.
ocrInput.StampCropRectangleAndSaveAs(ContentArea, Color.Aqua, "region-input.png");
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Sortie

Sortie OCR mise en évidence

Le rectangle bleu clair confirme que nous avons correctement isolé le deuxième paragraphe pour traitement.

Questions Fréquemment Posées

Pourquoi dois-je définir une région OCR spécifique d'une image ?

Définir une région OCR spécifique d'une image est utile pour améliorer la précision et l'exactitude en se concentrant sur la zone d'intérêt, comme le montant total d'une facture, plutôt que de scanner l'intégralité du document, ce qui peut introduire des erreurs.

Comment puis-je spécifier une région OCR avec IronOCR ?

Dans IronOCR, vous pouvez définir une zone de reconnaissance optique de caractères (OCR) en créant un objet `Rectangle` avec les coordonnées et dimensions souhaitées. Vous transmettez ensuite ce rectangle à la méthode `LoadImage`, limitant ainsi le traitement OCR à cette zone spécifique.

Quels sont les paramètres requis pour définir une région OCR ?

Pour définir une zone de reconnaissance optique de caractères (OCR), vous devez fournir quatre paramètres à l'objet `Rectangle` : la coordonnée x, la coordonnée y, la largeur et la hauteur. Ces paramètres déterminent le coin supérieur gauche et la taille de la zone.

Comment puis-je m'assurer que les coordonnées correctes sont sélectionnées pour la reconnaissance optique de caractères (OCR) ?

Pour garantir l'exactitude des coordonnées, visualisez la zone de contenu définie en dessinant un rectangle sur l'image d'entrée à l'aide de `StampCropRectangleAndSaveAs`. Cela facilite le débogage et l'ajustement précis des coordonnées.

Quels outils puis-je utiliser pour trouver les coordonnées de ma région OCR ?

Vous pouvez utiliser un éditeur d'images simple comme MS Paint pour trouver les coordonnées de votre zone de reconnaissance optique de caractères (OCR). Placez votre curseur sur les coins supérieur gauche et inférieur droit de la zone souhaitée pour noter les coordonnées (x, y) en pixels.

Quel est l'avantage d'utiliser IronOCR pour les tâches OCR spécifiques à une région ?

IronOCR vous permet d'extraire efficacement du texte à partir de régions spécifiques d'une image, réduisant ainsi les erreurs et améliorant les performances en évitant la capture de texte non pertinent.

Puis-je vérifier visuellement la zone OCR avant le traitement ?

Oui, vous pouvez vérifier visuellement la zone de reconnaissance optique de caractères (OCR) en traçant un rectangle sur l'image d'entrée. Cela confirme que la zone correcte est isolée pour le traitement, garantissant ainsi l'exactitude de la reconnaissance.

Quels types d'images puis-je traiter avec IronOCR ?

IronOCR peut traiter divers formats d'image, vous permettant d'extraire du texte de régions spécifiques d'images utilisées dans des documents, des formulaires et des factures.

Comment IronOCR gère-t-il le processus OCR au sein d'une région spécifiée ?

IronOCR limite son processus OCR aux pixels situés à l'intérieur du cadre de délimitation spécifié, garantissant ainsi que seul le texte contenu dans la région définie est extrait.

Quel est le format de sortie du processus OCR dans IronOCR ?

Le format de sortie du processus OCR dans IronOCR est accessible via la propriété `OcrResult`, ce qui vous permet de visualiser et de manipuler les données extraites selon vos besoins.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Prêt à commencer?
Nuget Téléchargements 5,167,857 | Version: 2025.11 vient de sortir