Comment lire des captures d'écran avec IronOCR en C

This article was translated from English: Does it need improvement?
Translated
View the article in English

Les captures d'écran sont un moyen rapide et facile de partager des informations et de capturer rapidement des informations essentielles à envoyer à ses collègues et pairs. Cependant, l'extraction de texte à partir de captures d'écran s'est souvent avérée difficile en raison des dimensions et du bruit inhérents à leur prise. Cela rend les captures d'écran moins efficaces pour la diffusion de la reconnaissance optique de caractères (OCR).

Cependant, IronOCR résout ce problème en fournissant des méthodes spécialisées telles que ReadScreenshot pour le combattre. ReadScreenshot est optimisé pour lire les captures d'écran et en extraire des informations ; il accepte également des formats de fichiers courants.

Pour utiliser cette fonction, vous devez également installer le package IronOCR.Extension.AdvancedScan .

Démarrage rapide : Lire du texte à partir d'une capture d'écran

Démarrez en quelques secondes grâce à ReadScreenshot d'IronOCR : il vous suffit de charger votre capture d'écran dans un OcrInput , d'appeler ReadScreenShot et d'accéder immédiatement au texte extrait, au score de confiance et aux régions de texte via OcrPhotoResult . C'est la méthode la plus rapide pour transformer des images en texte exploitable avec une configuration minimale.

Nuget IconCommencez dès maintenant à créer des PDF avec NuGet :

  1. Installez IronOCR avec le gestionnaire de packages NuGet

    PM > Install-Package IronOcr

  2. Copiez et exécutez cet extrait de code.

    OcrPhotoResult result = new IronTesseract().ReadScreenShot(new OcrInput().LoadImage("screenshot.png"));
  3. Déployez pour tester sur votre environnement de production.

    Commencez à utiliser IronOCR dans votre projet dès aujourd'hui grâce à un essai gratuit.
    arrow pointer

Dans ce guide, nous allons rapidement vous montrer comment utiliser IronOCR pour la reconnaissance de texte sur les captures d'écran, en passant en revue des exemples et les propriétés de l'objet résultant.

Lire l'exemple de captures d'écran

Pour lire une capture d'écran dans IronOCR, il faut suivre les étapes suivantes. Nous utilisons la méthode ReadScreenshot , qui prend un OcrInput comme paramètre d'entrée. Cette méthode est mieux optimisée pour les captures d'écran que la méthode Read standard de la bibliothèque.

Veuillez noter

  • Cette méthode fonctionne actuellement pour des langues telles que l'anglais, le chinois, le japonais, le coréen et les alphabets à base latine.
  • L'utilisation de l'analyse avancée sur .NET Framework nécessite que le projet s'exécute sur une architecture x64.

Entrée

Voici notre entrée pour l'exemple de code ; nous allons démontrer la polyvalence de cette méthode en mélangeant différentes polices et tailles de texte.

Input

Code

:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");

// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);

// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")

' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)

' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
$vbLabelText   $csharpLabel

Sortie

Output

Comme vous pouvez le constater dans la sortie de la console ci-dessus, elle a extrait toutes les occurrences de texte de la capture d'écran. Examinons plus en détail les propriétés d' OcrPhotoResult .

  • Text : Le texte extrait de l'entrée OCR.
  • Confidence : Une propriété double qui indique le niveau de confiance dans la précision statistique, sur une échelle de 0 à 1, où 1 représente le niveau de confiance le plus élevé.
  • TextRegion : Un tableau d'objets TextRegion , qui contiennent des propriétés renvoyant les zones où le texte se trouve sur la capture d'écran. Par défaut, tous TextRegion sont des classes Rectangle dérivées des modèles IronOCR. Il comprend les coordonnées x et y, ainsi que la hauteur et la largeur du rectangle.

Questions Fréquemment Posées

Comment puis-je extraire du texte à partir d'une capture d'écran en utilisant C#?

Vous pouvez extraire du texte à partir d'une capture d'écran en utilisant la méthode ReadScreenshot de IronOCR. Cette méthode est optimisée pour les captures d'écran et supporte plusieurs langues. Commencez par télécharger la bibliothèque IronOCR de NuGet, puis importez vos captures d'écran et utilisez la fonction ReadScreenshot pour récupérer le texte.

Quels formats de fichiers sont compatibles avec la méthode ReadScreenshot?

La méthode ReadScreenshot dans IronOCR est conçue pour accepter les formats de fichiers d'image courants, ce qui la rend polyvalente pour l'extraction de texte à partir de divers types de fichiers de capture d'écran.

Pourquoi la méthode ReadScreenshot est-elle préférable pour les captures d'écran?

La méthode ReadScreenshot est spécifiquement optimisée pour les dimensions et le bruit généralement présents dans les captures d'écran, offrant une extraction de texte plus précise par rapport aux méthodes OCR standard.

Quelles langues IronOCR supporte-t-il pour l'extraction de texte OCR?

IronOCR supporte une variété de langues pour l'extraction de texte OCR, y compris l'anglais, le chinois, le japonais, le coréen et les alphabets basés sur le latin, le rendant adapté à des applications diverses.

Comment fonctionne la propriété de confiance dans IronOCR?

Dans IronOCR, la propriété Confidence est une valeur double allant de 0 à 1 qui indique la probabilité de précision du texte extrait. Une valeur proche de 1 suggère un niveau de confiance plus élevé.

Que sont les objets TextRegion dans IronOCR?

Les objets TextRegion dans IronOCR représentent les zones spécifiques sur une capture d'écran où le texte est détecté. Ces objets incluent des coordonnées et des dimensions, aidant les utilisateurs à comprendre la disposition du texte extrait.

Ai-je besoin de paquets supplémentaires pour améliorer les capacités de IronOCR?

Oui, pour utiliser des fonctionnalités de numérisation avancées dans IronOCR, vous devez installer le package IronOcr.Extension.AdvancedScan de NuGet, qui améliore les performances et les capacités de la bibliothèque.

Comment puis-je implémenter IronOCR dans mon projet C# pour lire des captures d'écran?

Pour implémenter IronOCR dans votre projet C# pour lire des captures d'écran, commencez par télécharger la bibliothèque à partir de NuGet, importez vos images de capture d'écran, puis utilisez la méthode ReadScreenshot pour extraire le texte. Enfin, traitez les données extraites en utilisant la propriété OcrPhotoResult.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Prêt à commencer?
Nuget Téléchargements 5,167,857 | Version: 2025.11 vient de sortir