UTILISATION DE L'IRONOCR

Comment obtenir par OCR du texte à partir d'une capture d'écran en C#

Mise à jour décembre 18, 2023
Partager:

De nombreuses personnes se demandent peut-être ce qu'est une capture d'écran OCR D'autres se demandent peut-être comment convertir une capture d'écran de n'importe quel texte en un format numérique exploitable ou en format .txt ou .doc. Si vous êtes l'une de ces personnes, ne vous inquiétez plus car nous avons les solutions parfaites pour vous.

Dans cet article, nous aborderons différents outils qui vous permettront d'effectuer une reconnaissance optique de caractères (OCR) sur des captures d'écran.

Il existe de nombreux outils d'OCR, mais nous utiliserons aujourd'hui les outils suivantsIronOCR pour extraire du texte de captures d'écran.

1. IronOCR

IronOCR est une bibliothèque logicielle pour les langages de programmation C# et VB.NET, conçue pour permettre aux développeurs d'ajouter des fonctionnalités OCR à leurs produits(Reconnaissance optique de caractères) à leurs applications. La bibliothèque peut être utilisée pour reconnaître du texte dans des images et le convertir en texte lisible par une machine. La bibliothèque repose sur le moteur d'OCR Tesseract, qui est considéré comme l'un des moteurs d'OCR les plus précis qui soient.

IronOCR peut être utilisé pour lire du texte à partir d'images dans de nombreux formats de fichiers différents, notamment PNG, JPG, TIFF et PDF. Il offre également une série de fonctions avancées pour la reconnaissance de texte, telles que la possibilité de reconnaître plusieurs langues, ainsi que la possibilité de reconnaître du texte à partir d'images qui ont été tournées ou inclinées. En outre, les développeurs peuvent utiliser IronOCR pour intégrer rapidement la fonctionnalité OCR dans leurs applications, car il fournit une API simple et facile à utiliser qui peut être appelée à partir d'un code C# ou VB.NET. Avec IronOCR, vous pouvez choisir votre langage d'OCR et effectuer l'OCR sur des images, des fichiers PDF numériques et des fichiers PDF scannés.

IronOCR est considéré comme une bonne option pour les développeurs qui souhaitent ajouter une fonctionnalité OCR à leurs applications. C'est un logiciel libre, facile à utiliser et à intégrer, rapide, précis et à jour avec les dernières technologies d'OCR.

2. Caractéristiques de l'IronOCR

IronOCR offre un large éventail de caractéristiques permettant aux développeurs d'intégrer la fonctionnalité OCR dans leurs applications. Voici quelques-unes des principales caractéristiques de l'IronOCR :

  1. Prise en charge de plusieurs langues: IronOCR peut reconnaître du texte dans plus de 60 langues, dont l'anglais, l'espagnol, l'allemand, le français, l'italien et le chinois.

  2. **Détection automatique de l'orientation du texte: IronOCR peut détecter automatiquement l'orientation du texte dans une image, même si l'image a été tournée ou inclinée.

  3. Prise en charge d'une large gamme de formats d'images : IronOCR peut lire du texte à partir d'images dans de nombreux formats de fichiers différents, y compris PNG, JPG,TIFFetPDF (EN ANGLAIS)(EN ANGLAIS).

  4. Paramètres de reconnaissance personnalisables : Les développeurs peuvent personnaliser les paramètres de reconnaissance afin d'améliorer la précision de la reconnaissance pour des types d'images ou des cas d'utilisation spécifiques.

  5. Capacité à reconnaître du texte à partir de documents numérisés et de PDF comportant plusieurs pages.

  6. Reconnaissance rapide et haute précision : IronOCR utilise le moteur d'OCR Tesseract qui est l'un des moteurs d'OCR les plus précis et les plus utilisés.

  7. API simple d'utilisation : IronOCR fournit une API simple et conviviale qui peut être appelée à partir d'un code C# ou VB.NET, ce qui facilite l'intégration de la fonctionnalité OCR dans n'importe quelle application.

    Dans l'ensemble, IronOCR est un outil puissant qui offre un large éventail de fonctionnalités permettant aux développeurs d'ajouter des fonctions d'OCR à leurs applications.

3. Création d'un nouveau projet dans Visual Studio

Ouvrez Visual Studio et allez dans le menu Fichier. Sélectionnez "Nouveau projet", puis sélectionnez "Application console".

Saisissez le nom du projet et sélectionnez le chemin d'accès dans la zone de texte appropriée. Cliquez ensuite sur le bouton Créer. Sélectionnez le Framework .NET requis, comme dans la capture d'écran ci-dessous :

Comment obtenir du texte par OCR à partir d'une capture d'écran en C#, Figure 1 : Création d'un nouveau projet dans Visual Studio

Création d'un nouveau projet dans Visual Studio

Le projet Visual Studio va maintenant générer la structure de l'application console. Une fois terminé, il ouvrira le fichier program.cs, dans lequel vous pouvez écrire et exécuter le code source.

Comment obtenir du texte à partir d'une capture d'écran par OCR en C#, Figure 2 : Le fichier program.cs, généré à partir de l'assistant de nouveau projet de Visual Studio

**Le fichier program.cs, généré par l'assistant de nouveau projet de Visual Studio

Nous pouvons maintenant ajouter la bibliothèque IronOCR et tester le programme.

4. Installer IronOCR

Dans Visual Studio, vous pouvez facilement intégrer IronOCR à votre projet C#.

IronOCR propose plusieurs processus d'intégration à un projet C# .NET. Ici, nous allons discuter de l'une d'entre elles : l'installation d'IronOCR à l'aide du gestionnaire de paquets NuGet.

Dans Visual Studio, allez dans Tools > NuGet Package Manager > Package Manager Console

Comment obtenir du texte à partir d'une capture d'écran par OCR en C#, Figure 3 : L'interface utilisateur du gestionnaire de paquets NuGet

**L'interface utilisateur du gestionnaire de paquets NuGet

Après avoir cliqué, une nouvelle console apparaît en bas de la fenêtre de Visual Studio. Tapez la commande ci-dessous dans la console et appuyez sur Entrée.

Install-Package IronOcr

IronOCR sera installé en quelques secondes.

5. Utilisation d'IronOCR pour effectuer une OCR sur une capture d'écran

IronOCR est une puissante bibliothèque OCR qui peut être utilisée pour reconnaître du texte à partir de captures d'écran. Avec IronOCR, vous pouvez faire une capture d'écran d'un texte, puis utiliser les capacités d'OCR de la bibliothèque pour convertir le texte de la capture d'écran dans un format numérique éditable. Voici un exemple d'utilisation d'IronOCR pour effectuer une OCR sur une capture d'écran en C#. Pour effectuer l'OCR d'une capture d'écran, il suffit de capturer une capture d'écran et d'exécuter le code ci-dessous pour extraire le texte dans le format de sortie de votre choix.

using IronOcr;
using System;

string imageText = new IronTesseract().Read("ocr.png").Text;
Console.WriteLine(imageText);
using IronOcr;
using System;

string imageText = new IronTesseract().Read("ocr.png").Text;
Console.WriteLine(imageText);
Imports IronOcr
Imports System

Private imageText As String = (New IronTesseract()).Read("ocr.png").Text
Console.WriteLine(imageText)
VB   C#

Fichier d'image d'entrée

Comment obtenir du texte par OCR à partir d'une capture d'écran en C#, Figure 4 : Exemple de capture d'écran utilisée pour l'entrée

Capture d'écran type utilisée pour la saisie

Sortie de texte

- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 127+ global language packs
- Output as text, structured data, or searchable PDFs
- Supports NET 6, 5, Core, Standard, Framework

6. Utilisation d'IronOCR pour effectuer l'OCR sur une zone spécifique

IronOCR vous permet d'effectuer l'OCR sur des zones spécifiques d'une image. Cela peut s'avérer utile lorsque l'image contient plusieurs régions de texte et que vous ne souhaitez reconnaître que le texte situé dans une région spécifique. Un exemple de code est présenté ci-dessous.

using IronOcr;
using IronSoftware.Drawing;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
    var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
    ocrInput.AddImage("ocr.png", contentArea);
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using IronSoftware.Drawing;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
    var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
    ocrInput.AddImage("ocr.png", contentArea);
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports IronSoftware.Drawing
Imports System

Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput()
	Dim contentArea = New CropRectangle(x:= 0, y:= 0, width:= 350, height:= 150)
	ocrInput.AddImage("ocr.png", contentArea)
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using
VB   C#

Sortie

  • IronOCR pour NET
  • La bibliothèque OCR C#
  • OCR pour C# pour numériser et lire des images et des PDF
  • Bibliothèque OCR .NET avec 127+ packs de langues globales

7. Utilisation d'IronOCR pour effectuer l'OCR sur une image

Pour effectuer une OCR sur une image et enregistrer le texte reconnu dans un fichier .txt, vous pouvez utiliser le code suivant.

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
    var result = ocr.Read(input);
    result.SaveAsTextFile("output.txt");
}
using IronOcr;
using System;

var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
    var result = ocr.Read(input);
    result.SaveAsTextFile("output.txt");
}
Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using input = New OcrInput("ocr.png")
	Dim result = ocr.Read(input)
	result.SaveAsTextFile("output.txt")
End Using
VB   C#

Le contenu du fichier de sortie est indiqué ci-dessous :

How to OCR Get Text From Screenshot in C#, Figure 5 : Contenu du fichier output.txt généré

Contenu du fichier output.txt généré

8. En savoir plus

Lire leExtraction d'images et de textes pour plus d'informations sur la manière d'effectuer l'OCR sur les images.

IronOCR fait partie d'unesuite de cinq bibliothèques .NET conçues pour travailler avec différents types de documents. Vous pouvez acheter les cinq bibliothèques pour le prix de deux seulementlicences.

< PRÉCÉDENT
Comment obtenir du texte à partir d'une facture en C# Tutoriel
SUIVANT >
Comment reconnaître des sous-titres en C# (Tutoriel)