Comment extraire les résultats de lecture
Le résultat de la lecture ou de l'OCR comprend une multitude d'informations relatives aux paragraphes, lignes, mots et caractères individuels détectés. Pour chacun de ces éléments, le résultat fournit un ensemble complet de détails.
Pour chaque élément, il fournit le contenu texte, les coordonnées précises X et Y, les dimensions (largeur et hauteur), la direction du texte (de gauche à droite ou de haut en bas) et l'emplacement dans un objet CropRectangle.
Commencez avec IronOCR
Commencez à utiliser IronOCR dans votre projet dès aujourd'hui avec un essai gratuit.
Comment extraire les résultats de lecture
- Téléchargez une bibliothèque C# pour accéder aux résultats de lecture
- Préparer l'image cible et le document PDF
- Utilisez la méthode
Read
pour effectuer la reconnaissance optique de caractères sur le document importé - Accéder aux X, Y, à la largeur, à la hauteur et à la direction du texte du résultat
- Vérifiez les paragraphes détectés, les lignes, les mots et les comparaisons de caractères
Données dans OcrResult
La valeur du résultat ne contient pas seulement le texte extrait mais fournit également des informations sur les pages, les paragraphes, les lignes, les mots, les caractères et les codes-barres découverts dans le document PDF et l'image par IronOCR. Vous pouvez accéder à cette information à partir de l'objet retourné OcrResult en utilisant la méthode Read
.
:path=/static-assets/ocr/content-code-examples/how-to/read-results-output-information.cs
using IronOcr;
using System;
using static IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;
// Output information to console
Console.WriteLine($"Text: {paragraphs[0].Text}");
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
Console.WriteLine($"Width: {paragraphs[0].Width}");
Console.WriteLine($"Height: {paragraphs[0].Height}");
Console.WriteLine($"Text direction: {paragraphs[0].TextDirection}");

Pour chaque partie du texte, comme les paragraphes, les lignes, les mots et les caractères individuels, nous fournissons les informations suivantes :
- Texte : Le texte actuel sous forme de chaîne de caractères.
- X : La position par rapport au bord gauche de la page en pixels.
- Y : La position par rapport au bord supérieur de la page en pixels.
- Largeur : La largeur en pixels.
- Hauteur : La hauteur en pixels.
- Sens du texte : Le sens de lecture du texte, comme "de gauche à droite" ou "de haut en bas"
- Emplacement : Un rectangle indiquant l'emplacement du texte sur la page en pixels.
Comparaison de paragraphes, de lignes, de mots et de caractères
Vous trouverez ci-dessous la comparaison des paragraphes, lignes, mots et personnages détectés.
![]() Paragraph | ![]() Line |
![]() Word | ![]() Character |
Code-barres et code QR
C'est exact ! IronOCR peut lire les codes-barres et les codes QR. Bien que la fonctionnalité ne soit pas aussi robuste qu'IronBarcode, IronOcr offre un support pour les types de codes-barres courants. Pour activer la détection des codes-barres, définissez la propriété Configuration.ReadBarCodes sur true.
De plus, des informations précieuses peuvent être extraites du code-barres détecté, y compris son format, sa valeur, ses coordonnées (x, y), sa hauteur, sa largeur et son emplacement en tant qu'objet IronSoftware.Drawing.Rectangle. Cette classe Rectangle dans IronDrawing permet un positionnement précis sur le document.
:path=/static-assets/ocr/content-code-examples/how-to/read-results-barcodes.cs
using IronOcr;
using System;
using static IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = true;
// Add image
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Output information to console
foreach(var barcode in ocrResult.Barcodes)
{
Console.WriteLine("Format = " + barcode.Format);
Console.WriteLine("Value = " + barcode.Value);
Console.WriteLine("X = " + barcode.X);
Console.WriteLine("Y = " + barcode.Y);
}
Console.WriteLine(ocrResult.Text);
Sortie
