Mise à jour février 16, 2025
Partager:

Comment lire les captures d'écran avec IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

par Curtis Chau

Les captures d'écran sont un moyen rapide et facile de partager des informations et de capturer rapidement des informations essentielles à envoyer à des collègues et pairs. Cependant, extraire du texte à partir de captures d'écran s'est souvent avéré difficile en raison des dimensions et du bruit impliqués lors de leur prise. Cela rend les captures d'écran un média moins efficace pour la publication de l'OCR.

Cependant, IronOCR résout ce problème en fournissant des méthodes spécialisées telles que "ReadScreenShot" pour le combattre. ReadScreenshot est optimisé pour lire des captures d'écran et extraire des informations à partir de celles-ci ; il accepte également les formats de fichiers courants.

Dans ce guide, nous allons rapidement démontrer comment utiliser IronOCR pour la reconnaissance de texte à partir de captures d'écran, en parcourant des exemples et les propriétés de l'objet résultat.

Commencez à utiliser IronOCR dans votre projet dès aujourd'hui avec un essai gratuit.

Première étape :
green arrow pointer

Pour utiliser cette fonction, vous devez également installer le IronOcr.Extension.AdvancedScan l'emballage.

Lire l'exemple de captures d'écran

Pour lire une capture d'écran dans IronOCR, nous devons appliquer les étapes suivantes : nous utilisons la méthode ReadScreenShot, qui prend un OcrInput comme paramètre pour l'entrée. Cette méthode est plus optimisée pour les captures d'écran que la méthode standard Read de la bibliothèque.

[{i :(

  • La méthode ne fonctionne actuellement que pour l'anglais, le chinois, le japonais, le coréen et l'alphabet latin.
  • L'utilisation de l'analyse avancée sur le Framework .NET nécessite que le projet soit exécuté sur une architecture x64.

    )}]

Entrée

Ci-dessous, notre entrée pour l'exemple de code ; nous démontrerons la polyvalence de cette méthode en mélangeant différentes polices de texte et tailles.

Entrée

Code

:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");

// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);

// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")

' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)

' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
VB   C#

Sortie

sortie

Comme vous pouvez le voir dans la sortie de la console ci-dessus, il a extrait toutes les instances de texte de la capture d'écran. Plongeons plus profondément dans les propriétés de OcrPhotoResult.

Le texte extrait de la saisie OCR.

Confiance : Une propriété "double" qui indique la confiance en la précision statistique d'une moyenne de chaque caractère, où un est le plus haut et 0 est le plus bas.

TextRegion : Un tableau de "TextRegion" qui contient la propriété qui renvoie les zones où le texte est trouvé sur la capture d'écran. Par défaut, tout TextRegion est une classe Rectangle dérivée des modèles IronOCR. Il renvoie les coordonnées x et y ainsi que la hauteur et la largeur du rectangle.