Comment utiliser les images d'entrée pour le traitement OCR en C#

How to Read Images

This article was translated from English: Does it need improvement?
Translated
View the article in English

L'OCR, ou reconnaissance optique de caractères, est une technologie utilisée pour reconnaître et extraire du texte à partir d'images. Cette technologie est particulièrement utile pour la numérisation de documents imprimés, car elle permet d'extraire et de travailler le contenu textuel de pages scannées, de photographies ou d'autres fichiers d'images.

IronOCR prend en charge différents formats d'image, notamment jpg, png, gif, tiff et bmp. Des filtres d'image sont également disponibles pour améliorer la capacité de lecture.

Démarrage rapide : lecture d'un fichier image avec IronOcr

Utilisez IronOcr en une seule ligne pour extraire du texte d'une image. Cet exemple montre comment, en quelques étapes simples, vous pouvez charger une image et lire son texte à l'aide de la méthode Read sur IronTesseract pour une configuration OCR rapide.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    var result = new IronTesseract().Read(new OcrImageInput("Potter.png"));
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer


Lire l'exemple des images

Commencez par instancier la classe IronTesseract pour activer l'OCR. Utilisez l'instruction "using" pour créer un objet OcrImageInput, en spécifiant le chemin d'accès au fichier image. Cela permet d'assurer l'élimination correcte des ressources lorsqu'elles ne sont plus nécessaires. IronOCR prend en charge les images d'entrée dans différents formats, notamment jpg, png, gif, tiff et bmp. Enfin, utilisez la méthode Read pour effectuer l'OCR.

[{i :( À partir de la version 2025.6 :

  • Le chargement des images TIFF est désormais plus rapide.
  • La lecture d'images TIFF présente des améliorations de performance qui dépendent du GPU de la machine. Certains utilisateurs pourraient voir leur vitesse multipliée par deux, tandis que d'autres pourraient constater des performances similaires à celles des versions précédentes )}]
:path=/static-assets/ocr/content-code-examples/how-to/input-images-read.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.png");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.png")

' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
$vbLabelText   $csharpLabel
Lire l'image PNG

Consultez l'article How to Read Multi-Frame/Page GIFs and TIFFs pour en savoir plus sur la lecture des images TIFF et GIF.

Importer des images en tant qu'octets

Outre le chemin d'accès au fichier, la classe OcrImageInput accepte également des informations sur l'image sous forme d'octets, AnyBitmap, Stream, ainsi que Image. AnyBitmap est un objet bitmap de IronSoftware.Drawing.AnyBitmap.

:path=/static-assets/ocr/content-code-examples/how-to/input-images-import-byte.cs
using IronOcr;
using System.IO;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Read byte from file
byte[] data = File.ReadAllBytes("Potter.tiff");

// Import image byte
using var imageInput = new OcrImageInput(data);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr
Imports System.IO

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Read byte from file
Private data() As Byte = File.ReadAllBytes("Potter.tiff")

' Import image byte
Private imageInput = New OcrImageInput(data)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
$vbLabelText   $csharpLabel

Spécifiez la région d'analyse

Un CropRectangle est également accepté lors de l'instanciation de la classe OcrImageInput. Cela vous permet de spécifier quelle région du document image doit être OCRée. En fonction du document image, la spécification de la région à numériser peut améliorer considérablement les performances. Dans l'exemple de code ci-dessous, vous spécifiez que seuls le numéro et le titre du chapitre doivent être lus.

:path=/static-assets/ocr/content-code-examples/how-to/input-images-read-specific-region.cs
using IronOcr;
using IronSoftware.Drawing;
using System;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Specify crop region
Rectangle scanRegion = new Rectangle(800, 200, 900, 400);

// Add image
using var imageInput = new OcrImageInput("Potter.tiff", ContentArea: scanRegion);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Output the result to console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports IronSoftware.Drawing
Imports System

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Specify crop region
Private scanRegion As New Rectangle(800, 200, 900, 400)

' Add image
Private imageInput = New OcrImageInput("Potter.tiff", ContentArea:= scanRegion)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Output the result to console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

Résultat de l'OCR

Lire la région spécifique

Questions Fréquemment Posées

Comment puis-je effectuer un OCR sur une image en .NET C# ?

Vous pouvez effectuer un OCR sur une image en .NET C# en utilisant la bibliothèque IronOCR. Commencez par télécharger IronOCR depuis NuGet, instanciez la classe IronTesseract, et utilisez la classe OcrImageInput pour entrer une image. Ensuite, appliquez la méthode Read pour extraire le texte de l'image.

Quels formats d'image peuvent être traités par l'OCR en .NET ?

IronOCR prend en charge divers formats d'image pour le traitement OCR, y compris jpg, png, gif, tiff et bmp. Cela permet une intégration flexible avec différents types de fichiers image.

Comment puis-je spécifier une zone spécifique d'une image pour l'OCR en C# ?

Dans IronOCR, vous pouvez définir une zone spécifique d'une image à traiter en utilisant un CropRectangle lors de l'instantiation de la classe OcrImageInput. Cela peut améliorer les performances en concentrant l'opération OCR sur une région particulière.

Est-il possible de lire des images à partir d'un tableau d'octets pour l'OCR en C# ?

Oui, IronOCR vous permet d'entrer des images en tant que tableaux d'octets, AnyBitmap, Stream ou Image. Cette flexibilité vous permet d'effectuer un OCR sur des données d'image disponibles sous différents formats.

Comment puis-je garantir une gestion efficace de la mémoire lors des opérations OCR en C# ?

Pour gérer efficacement la mémoire lors des opérations OCR avec IronOCR, utilisez l'instruction 'using' lorsque vous créez un objet OcrImageInput. Cela garantit que les ressources sont correctement libérées lorsqu'elles ne sont plus nécessaires.

IronOCR offre plusieurs avantages pour lire des images en C#, comme le support de plusieurs formats, la spécification des régions de scan et l'entrée d'images sous forme d'octets ou de flux.

Oui, IronOCR prend en charge la lecture d'images multi-cadres ou multi-pages, telles que les GIFs et TIFFs. Cette capacité vous permet d'effectuer un OCR sur des fichiers image complexes contenant plusieurs cadres ou pages.

Comment puis-je améliorer la reconnaissance de texte dans l'OCR en utilisant des filtres d'image ?

IronOCR fournit des filtres d'image qui peuvent être utilisés pour améliorer les capacités de reconnaissance de texte. En appliquant ces filtres, vous pouvez améliorer la précision et la fiabilité du processus OCR sur divers formats d'image.

Quels sont les avantages de l'utilisation d'IronOCR pour la lecture d'images en C# ?

IronOCR offre plusieurs avantages pour la lecture d'images en C#, y compris le support de plusieurs formats d'image, la possibilité de spécifier des zones de numérisation, et la capacité d'entrer des images sous forme d'octets ou de flux. Ces fonctionnalités permettent un traitement OCR efficace et flexible dans les applications .NET.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Revu par
Jeff Fritz
Jeffrey T. Fritz
Responsable principal du programme - Équipe de la communauté .NET
Jeff est également responsable principal du programme pour les équipes .NET et Visual Studio. Il est le producteur exécutif de la série de conférences virtuelles .NET Conf et anime 'Fritz and Friends', une diffusion en direct pour développeurs qui est diffusée deux fois par semaine où il parle de technologie et écrit du code avec les téléspectateurs. Jeff écrit des ateliers, des présentations et prévoit du contenu pour les plus grands événements de développement Microsoft, y compris Microsoft Build, Microsoft Ignite, .NET Conf et le sommet Microsoft MVP
Prêt à commencer?
Nuget Téléchargements 5,044,537 | Version : 2025.11 vient de sortir