Test dans un environnement réel
Test en production sans filigrane.
Fonctionne partout où vous en avez besoin.
De nombreuses personnes se demandent peut-être ce qu'est une capture d'écran OCR D'autres se demandent peut-être comment convertir une capture d'écran de n'importe quel texte en un format numérique exploitable ou en format .txt ou .doc. Si vous êtes l'une de ces personnes, ne vous inquiétez plus car nous avons les solutions parfaites pour vous.
Dans cet article, nous aborderons différents outils qui vous permettront d'effectuer une reconnaissance optique de caractères (OCR) sur des captures d'écran.
Il existe de nombreux outils d'OCR, mais nous utiliserons aujourd'hui les outils suivantsIronOCR pour extraire du texte de captures d'écran.
IronOCR est une bibliothèque logicielle pour les langages de programmation C# et VB.NET, conçue pour permettre aux développeurs d'ajouter des fonctionnalités OCR à leurs produits(Reconnaissance optique de caractères) à leurs applications. La bibliothèque peut être utilisée pour reconnaître du texte dans des images et le convertir en texte lisible par une machine. La bibliothèque repose sur le moteur d'OCR Tesseract, qui est considéré comme l'un des moteurs d'OCR les plus précis qui soient.
IronOCR peut être utilisé pour lire du texte à partir d'images dans de nombreux formats de fichiers différents, notamment PNG, JPG, TIFF et PDF. Il offre également une série de fonctions avancées pour la reconnaissance de texte, telles que la possibilité de reconnaître plusieurs langues, ainsi que la possibilité de reconnaître du texte à partir d'images qui ont été tournées ou inclinées. En outre, les développeurs peuvent utiliser IronOCR pour intégrer rapidement la fonctionnalité OCR dans leurs applications, car il fournit une API simple et facile à utiliser qui peut être appelée à partir d'un code C# ou VB.NET. Avec IronOCR, vous pouvez choisir votre langage d'OCR et effectuer l'OCR sur des images, des fichiers PDF numériques et des fichiers PDF scannés.
IronOCR est considéré comme une bonne option pour les développeurs qui souhaitent ajouter une fonctionnalité OCR à leurs applications. C'est un logiciel libre, facile à utiliser et à intégrer, rapide, précis et à jour avec les dernières technologies d'OCR.
IronOCR offre un large éventail de caractéristiques permettant aux développeurs d'intégrer la fonctionnalité OCR dans leurs applications. Voici quelques-unes des principales caractéristiques de l'IronOCR :
Prise en charge de plusieurs langues: IronOCR peut reconnaître du texte dans plus de 60 langues, dont l'anglais, l'espagnol, l'allemand, le français, l'italien et le chinois.
**Détection automatique de l'orientation du texte: IronOCR peut détecter automatiquement l'orientation du texte dans une image, même si l'image a été tournée ou inclinée.
Prise en charge d'une large gamme de formats d'images : IronOCR peut lire du texte à partir d'images dans de nombreux formats de fichiers différents, y compris PNG, JPG,TIFFetPDF (EN ANGLAIS)(EN ANGLAIS).
Paramètres de reconnaissance personnalisables : Les développeurs peuvent personnaliser les paramètres de reconnaissance afin d'améliorer la précision de la reconnaissance pour des types d'images ou des cas d'utilisation spécifiques.
Capacité à reconnaître du texte à partir de documents numérisés et de PDF comportant plusieurs pages.
Reconnaissance rapide et haute précision : IronOCR utilise le moteur d'OCR Tesseract qui est l'un des moteurs d'OCR les plus précis et les plus utilisés.
API simple d'utilisation : IronOCR fournit une API simple et conviviale qui peut être appelée à partir d'un code C# ou VB.NET, ce qui facilite l'intégration de la fonctionnalité OCR dans n'importe quelle application.
Dans l'ensemble, IronOCR est un outil puissant qui offre un large éventail de fonctionnalités permettant aux développeurs d'ajouter des fonctions d'OCR à leurs applications.
Ouvrez Visual Studio et allez dans le menu Fichier. Sélectionnez "Nouveau projet", puis sélectionnez "Application console".
Saisissez le nom du projet et sélectionnez le chemin d'accès dans la zone de texte appropriée. Cliquez ensuite sur le bouton Créer. Sélectionnez le Framework .NET requis, comme dans la capture d'écran ci-dessous :
Création d'un nouveau projet dans Visual Studio
Le projet Visual Studio va maintenant générer la structure de l'application console. Une fois terminé, il ouvrira le fichier program.cs
, dans lequel vous pouvez écrire et exécuter le code source.
**Le fichier program.cs, généré par l'assistant de nouveau projet de Visual Studio
Nous pouvons maintenant ajouter la bibliothèque IronOCR et tester le programme.
Dans Visual Studio, vous pouvez facilement intégrer IronOCR à votre projet C#.
IronOCR propose plusieurs processus d'intégration à un projet C# .NET. Ici, nous allons discuter de l'une d'entre elles : l'installation d'IronOCR à l'aide du gestionnaire de paquets NuGet.
Dans Visual Studio, allez dans Tools > NuGet Package Manager > Package Manager Console
**L'interface utilisateur du gestionnaire de paquets NuGet
Après avoir cliqué, une nouvelle console apparaît en bas de la fenêtre de Visual Studio. Tapez la commande ci-dessous dans la console et appuyez sur Entrée.
Install-Package IronOcr
IronOCR sera installé en quelques secondes.
IronOCR est une puissante bibliothèque OCR qui peut être utilisée pour reconnaître du texte à partir de captures d'écran. Avec IronOCR, vous pouvez faire une capture d'écran d'un texte, puis utiliser les capacités d'OCR de la bibliothèque pour convertir le texte de la capture d'écran dans un format numérique éditable. Voici un exemple d'utilisation d'IronOCR pour effectuer une OCR sur une capture d'écran en C#. Pour effectuer l'OCR d'une capture d'écran, il suffit de capturer une capture d'écran et d'exécuter le code ci-dessous pour extraire le texte dans le format de sortie de votre choix.
using IronOcr;
using System;
string imageText = new IronTesseract().Read("ocr.png").Text;
Console.WriteLine(imageText);
using IronOcr;
using System;
string imageText = new IronTesseract().Read("ocr.png").Text;
Console.WriteLine(imageText);
Imports IronOcr
Imports System
Private imageText As String = (New IronTesseract()).Read("ocr.png").Text
Console.WriteLine(imageText)
Capture d'écran type utilisée pour la saisie
- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 127+ global language packs
- Output as text, structured data, or searchable PDFs
- Supports NET 6, 5, Core, Standard, Framework
IronOCR vous permet d'effectuer l'OCR sur des zones spécifiques d'une image. Cela peut s'avérer utile lorsque l'image contient plusieurs régions de texte et que vous ne souhaitez reconnaître que le texte situé dans une région spécifique. Un exemple de code est présenté ci-dessous.
using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
ocrInput.AddImage("ocr.png", contentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
ocrInput.AddImage("ocr.png", contentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput()
Dim contentArea = New CropRectangle(x:= 0, y:= 0, width:= 350, height:= 150)
ocrInput.AddImage("ocr.png", contentArea)
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
End Using
Pour effectuer une OCR sur une image et enregistrer le texte reconnu dans un fichier .txt, vous pouvez utiliser le code suivant.
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
var result = ocr.Read(input);
result.SaveAsTextFile("output.txt");
}
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
var result = ocr.Read(input);
result.SaveAsTextFile("output.txt");
}
Imports IronOcr
Imports System
Private ocr = New IronTesseract()
Using input = New OcrInput("ocr.png")
Dim result = ocr.Read(input)
result.SaveAsTextFile("output.txt")
End Using
Le contenu du fichier de sortie est indiqué ci-dessous :
Contenu du fichier output.txt généré
Lire leExtraction d'images et de textes pour plus d'informations sur la manière d'effectuer l'OCR sur les images.
IronOCR fait partie d'unesuite de cinq bibliothèques .NET conçues pour travailler avec différents types de documents. Vous pouvez acheter les cinq bibliothèques pour le prix de deux seulementlicences.
9 produits de l'API .NET pour vos documents de bureau