Comment lire les captures d'écran avec IronOCR
Les captures d'écran sont un moyen rapide et facile de partager des informations et de capturer rapidement des informations essentielles à envoyer à des collègues et pairs. Cependant, extraire du texte à partir de captures d'écran s'est souvent avéré difficile en raison des dimensions et du bruit impliqués lors de leur prise. Cela rend les captures d'écran un média moins efficace pour la publication de l'OCR.
Cependant, IronOCR résout ce problème en fournissant des méthodes spécialisées telles que "ReadScreenShot" pour le combattre. ReadScreenshot est optimisé pour lire des captures d'écran et extraire des informations à partir de celles-ci ; il accepte également les formats de fichiers courants.
Dans ce guide, nous allons rapidement démontrer comment utiliser IronOCR pour la reconnaissance de texte à partir de captures d'écran, en parcourant des exemples et les propriétés de l'objet résultat.
Comment lire les captures d'écran avec IronOCR
- Téléchargez la bibliothèque C# pour lire les captures d'écran
- Importer les images capturées pour le traitement
- Utiliser le
Lire la capture d'écran
méthode pour extraire du texte de l'image - Récupérez les données extraites en utilisant leOcrPhotoResultpropriété pour un traitement ultérieur
- Enregistrez ou exportez le texte extrait selon vos besoins
Commencez à utiliser IronOCR dans votre projet dès aujourd'hui avec un essai gratuit.
Pour utiliser cette fonction, vous devez également installer le IronOcr.Extension.AdvancedScan l'emballage.
Lire l'exemple de captures d'écran
Pour lire une capture d'écran dans IronOCR, nous devons appliquer les étapes suivantes : nous utilisons la méthode ReadScreenShot
, qui prend un OcrInput
comme paramètre pour l'entrée. Cette méthode est plus optimisée pour les captures d'écran que la méthode standard Read
de la bibliothèque.
[{i :(
- La méthode ne fonctionne actuellement que pour l'anglais, le chinois, le japonais, le coréen et l'alphabet latin.
-
L'utilisation de l'analyse avancée sur le Framework .NET nécessite que le projet soit exécuté sur une architecture x64.
)}]
Entrée
Ci-dessous, notre entrée pour l'exemple de code ; nous démontrerons la polyvalence de cette méthode en mélangeant différentes polices de texte et tailles.
Code
:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;
// Instantiate OCR engine
var ocr = new IronTesseract();
using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");
// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);
// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq
' Instantiate OCR engine
Private ocr = New IronTesseract()
Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")
' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)
' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
Sortie
Comme vous pouvez le voir dans la sortie de la console ci-dessus, il a extrait toutes les instances de texte de la capture d'écran. Plongeons plus profondément dans les propriétés de OcrPhotoResult
.
Le texte extrait de la saisie OCR.
Confiance : Une propriété "double" qui indique la confiance en la précision statistique d'une moyenne de chaque caractère, où un est le plus haut et 0 est le plus bas.
TextRegion : Un tableau de "TextRegion" qui contient la propriété qui renvoie les zones où le texte est trouvé sur la capture d'écran. Par défaut, tout TextRegion
est une classe Rectangle
dérivée des modèles IronOCR. Il renvoie les coordonnées x et y ainsi que la hauteur et la largeur du rectangle.