How to Read Screenshots using IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

Les captures d'écran sont un moyen rapide et facile de partager des informations et de capturer rapidement des informations essentielles à envoyer à des collègues et à des pairs. Cependant, l'extraction de texte à partir de captures d'écran s'est souvent avérée difficile en raison de l'encombrement et du bruit liés à la prise de vue. Les captures d'écran sont donc un support moins efficace pour la publication de l'OCR.

Cependant, IronOCR résout ce problème en fournissant des méthodes spécialisées telles que ReadScreenshot pour lutter contre cela. ReadScreenshot est optimisé pour lire les captures d'écran et en extraire des informations ; le logiciel accepte également les formats de fichiers courants.

Pour utiliser cette fonction, vous devez également installer le paquet IronOcr.Extension.AdvancedScan.

Quickstart : Read Text from a Screenshot

Commencez en quelques secondes en utilisant le ReadScreenshot d'IronOcr - chargez simplement votre capture d'écran dans un OcrInput, appelez ReadScreenShot, et accédez immédiatement au texte extrait, au score de confiance et aux régions de texte via le OcrPhotoResult. C'est le moyen le plus rapide de transformer des images en texte utilisable avec un minimum d'installation.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    OcrPhotoResult result = new IronTesseract().ReadScreenShot(new OcrInput().LoadImage("screenshot.png"));
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer

Dans ce guide, nous allons rapidement démontrer comment utiliser IronOCR pour la reconnaissance de texte de capture d'écran, en parcourant des exemples et les propriétés de l'objet résultat.

Lire l'exemple des captures d'écran

Pour lire une capture d'écran dans IronOCR, nous devons appliquer les étapes suivantes. Nous utilisons la méthode ReadScreenshot, qui prend un OcrInput comme paramètre pour l'entrée. Cette méthode est plus optimisée pour les captures d'écran que la méthode standard Lire de la bibliothèque.

[{i :(

  • La méthode fonctionne actuellement pour des langues telles que l'anglais, le chinois, le japonais, le coréen et les alphabets latins.
  • L'utilisation d'un scan avancé sur .NET Framework nécessite que le projet soit exécuté sur une architecture x64. )}]

Entrée

Vous trouverez ci-dessous notre contribution à l'exemple de code ; nous démontrerons la polyvalence de cette méthode en mélangeant différentes polices et tailles de texte.

Input

Code

:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");

// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);

// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")

' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)

' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
$vbLabelText   $csharpLabel

Sortie

Sortie

Comme vous pouvez le voir dans la sortie de la console ci-dessus, toutes les occurrences de texte de la capture d'écran ont été extraites. Voyons plus en détail les propriétés de OcrPhotoResult.

  • Texte : Le texte extrait de l'entrée OCR.
  • Confiance : Une propriété double qui indique la confiance dans la précision statistique, avec une échelle de 0 à 1, où 1 est le niveau de confiance le plus élevé.
  • TextRegion : Un tableau d'objets TextRegion, qui contiennent des propriétés renvoyant aux zones où se trouve le texte sur la capture d'écran. Par défaut, toutes les TextRegion sont des classes Rectangle dérivées des modèles IronOcr. Elle comprend les coordonnées x et y, ainsi que la hauteur et la largeur du rectangle.

Questions Fréquemment Posées

Comment puis-je extraire du texte à partir d'une capture d'écran en utilisant C#?

Vous pouvez extraire du texte à partir d'une capture d'écran en utilisant la méthode ReadScreenshot de IronOCR. Cette méthode est optimisée pour les captures d'écran et supporte plusieurs langues. Commencez par télécharger la bibliothèque IronOCR de NuGet, puis importez vos captures d'écran et utilisez la fonction ReadScreenshot pour récupérer le texte.

Quels formats de fichiers sont compatibles avec la méthode ReadScreenshot?

La méthode ReadScreenshot dans IronOCR est conçue pour accepter les formats de fichiers d'image courants, ce qui la rend polyvalente pour l'extraction de texte à partir de divers types de fichiers de capture d'écran.

Pourquoi la méthode ReadScreenshot est-elle préférable pour les captures d'écran?

La méthode ReadScreenshot est spécifiquement optimisée pour les dimensions et le bruit généralement présents dans les captures d'écran, offrant une extraction de texte plus précise par rapport aux méthodes OCR standard.

Quelles langues IronOCR supporte-t-il pour l'extraction de texte OCR?

IronOCR supporte une variété de langues pour l'extraction de texte OCR, y compris l'anglais, le chinois, le japonais, le coréen et les alphabets basés sur le latin, le rendant adapté à des applications diverses.

Comment fonctionne la propriété de confiance dans IronOCR?

Dans IronOCR, la propriété Confidence est une valeur double allant de 0 à 1 qui indique la probabilité de précision du texte extrait. Une valeur proche de 1 suggère un niveau de confiance plus élevé.

Que sont les objets TextRegion dans IronOCR?

Les objets TextRegion dans IronOCR représentent les zones spécifiques sur une capture d'écran où le texte est détecté. Ces objets incluent des coordonnées et des dimensions, aidant les utilisateurs à comprendre la disposition du texte extrait.

Ai-je besoin de paquets supplémentaires pour améliorer les capacités de IronOCR?

Oui, pour utiliser des fonctionnalités de numérisation avancées dans IronOCR, vous devez installer le package IronOcr.Extension.AdvancedScan de NuGet, qui améliore les performances et les capacités de la bibliothèque.

Comment puis-je implémenter IronOCR dans mon projet C# pour lire des captures d'écran?

Pour implémenter IronOCR dans votre projet C# pour lire des captures d'écran, commencez par télécharger la bibliothèque à partir de NuGet, importez vos images de capture d'écran, puis utilisez la méthode ReadScreenshot pour extraire le texte. Enfin, traitez les données extraites en utilisant la propriété OcrPhotoResult.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Prêt à commencer?
Nuget Téléchargements 5,044,537 | Version : 2025.11 vient de sortir