Passer au contenu du pied de page

Résultats OCR

Obtenez plus qu'un simple texte. Notre API fournit des données structurées, notamment des coordonnées, des indices de confiance et une hiérarchie complète du document (pages, lignes, mots).

Icon Main related to Résultats OCR
Sortie de données

1

Textes

IronOcr renvoie la sortie de texte pour les paragraphes, les lignes, les mots et les caractères sous forme d'objets structurés et de chaînes, ce qui permet aux développeurs d'accéder aux données et de les manipuler rapidement.

using IronOcr;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    // Page text
    string PageText = page.Text;
}
C#
2

Localisation des textes OCR

Obtenez les coordonnées X/Y précises et les dimensions du cadre de délimitation pour chaque paragraphe, ligne, mot et caractère, ce qui permet la mise en évidence du texte, l'OCR par zone et la validation des données.

Apprenez à :Extraire des résultats de lecture en .NET C#
using IronOcr;
using IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;

// Output Text location (X,Y) of the first paragraph
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
C#
3

Confiance de la sortie OCR

Obtenez une note de confiance pour les textes extraits. Marquer de manière programmée les résultats à faible degré de confiance pour une révision humaine afin de créer des flux de travail automatisés plus fiables.

Apprenez à :Gagner en confiance de lecture en .NET C#
using IronOcr;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();

// Load image from file
ocrInput.LoadImage("sameple.png");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Check Confidence level
Console.WriteLine($"Confidence: {ocrResult.Confidence}%");
C#
4

Images des éléments OCR

En plus du texte, exportez les éléments visuels des textes détectés par OCR à partir du document d'entrée sous forme de fichiers images distincts, utiles pour l'archivage ou le traitement de données non textuelles.

Apprenez à :Extraire des résultats de lecture en .NET C#
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage("sample.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    foreach (var word in page.Words)
    {
        word.ToBitmap(ocrInput).SaveAs($"page{page.PageNumber}_word{word.WordNumber}.png", AnyBitmap.ImageFormat.Png);
    }
}
C#

Icon Main related to Résultats OCR
Types de sortie

1

Texte

Accédez aux résultats de l'OCR par le biais d'une API structurée et hiérarchique. Naviguez facilement des grands paragraphes aux caractères individuels, ce qui vous donne un contrôle granulaire sur le texte extrait et ses métadonnées.

Apprenez à :Extraire des résultats de lecture en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Output the first detected paragraph text
Console.WriteLine($"Text: {ocrResult.Paragraphs[0].Text}");
C#
2

PDF consultables

Convertissez n'importe quel document ou image numérisé en un fichier PDF entièrement consultable. La mise en page originale est préservée, mais tout le texte devient sélectionnable, copiable et consultable.

Apprenez à :Enregistrer les résultats sous forme de PDF consultable
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as searchable PDF
ocrTesseract.Configuration.RenderSearchablePdf = true;

// Add image
using var imageInput = new OcrImageInput("sample.tiff");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf");
C#
3

hOCR

Les résultats sont exportés au format hOCR, une norme basée sur HTML qui fournit des métadonnées riches, y compris le texte, les informations de mise en page et les coordonnées de chaque mot, ce qui est idéal pour une analyse avancée des documents.

Apprenez à :Enregistrer les résultats sous forme de hOCR dans un fichier HTML
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as hOCR
ocrTesseract.Configuration.RenderHocr = true;

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
imageInput.Title = "Html Title";

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as HTML
ocrResult.SaveAsHocrFile("result.html");
C#
4

Mettre en évidence des textes sous forme d'images

Pour le débogage et la vérification, générez une image du document original avec tout le texte reconnu en surbrillance. Cela permet de vérifier visuellement et rapidement la précision du moteur d'OCR et l'emplacement du texte.

Apprenez à :C# Mettre en évidence les textes pour le débogage
using IronOcr;

IronTesseract ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_page_", ResultHighlightType.Paragraph);
C#
5

Valeurs des BarCodes et des codes QR

Extraire les valeurs de chaîne décodées de tous les codes-barres ou codes QR présents dans le document. L'API fournit ces données en même temps que les résultats textuels pour une solution complète de capture de données.

Apprenez à :Extraire des résultats de lecture en .NET C#
using IronOcr;
using IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = true;

// Load PDF file
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Output Barcode value
Console.WriteLine(ocrResult.Barcodes[0].Value);
C#
Prêt à commencer?
Nuget Téléchargements 5,167,857 | Version: 2025.11 vient de sortir