UTILISATION DE L'IRONOCR

Comment créer une démo de logiciel d'OCR en C#

Publié juin 6, 2024
Partager:

Reconnaissance optique de caractères (OCR) est une technologie qui transforme divers formats de documents, y compris des documents papier scannés, des PDF, des fichiers numériques ou des images de textes imprimés prises avec un appareil photo numérique, en données textuelles codées par une machine, modifiables et consultables.

IronOCR est une excellente bibliothèque de moteur d'OCR qui offre de puissantes fonctionnalités d'OCR aux développeurs. Dans cet article, nous allons explorer comment effectuer l'OCR en utilisant IronOCR avec des exemples de code avec Démo du logiciel OCR.

Qu'est-ce que l'IronOCR ?

IronOCR est une puissante bibliothèque .NET conçue pour faciliter la reconnaissance optique de caractères (OCR) dans les applications C# et VB.NET. En s'appuyant sur des algorithmes avancés et des techniques d'apprentissage automatique, IronOCR peut extraire avec précision le texte et le contenu des fichiers PDF numérisés, des images et des PDF, ce qui facilite le traitement, la recherche et l'analyse de ces fichiers de manière programmatique.

Grâce à son API simple et à ses nombreuses fonctionnalités, les développeurs peuvent intégrer en toute transparence des fonctions d'OCR dans leurs applications afin d'automatiser les tâches d'extraction de données, de traitement de documents, de saisie de données et de gestion de contenu. Que vous travailliez dans le domaine des affaires, avec des factures, des rapports, une extraction de données automatisée, un PDF interrogeable ou tout autre document riche en texte, IronOCR offre une solution fiable pour traiter efficacement les exigences de l'OCR.

Premiers pas avec IronOCR

Avant de plonger dans les exemples de code, vous devez installer IronOCR via le gestionnaire de paquets NuGet. Vous pouvez installer IronOCR en exécutant la commande suivante dans la console du gestionnaire de paquets :

Install-Package IronOcr
Install-Package IronOcr
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr
VB   C#

Effectuer l'OCR avec IronOCR

Reconnaissance de texte de base

Pour effectuer une reconnaissance de texte de base à l'aide d'IronOCR, vous pouvez utiliser l'extrait de code suivant :

using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
    OcrResult ocrResult = ocrTesseract.Read(ocrInput);
    string RecognizedText = ocrResult.Text;
    Console.WriteLine(RecognizedText);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
    OcrResult ocrResult = ocrTesseract.Read(ocrInput);
    string RecognizedText = ocrResult.Text;
    Console.WriteLine(RecognizedText);
}
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput("ocr.png")
	Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
	Dim RecognizedText As String = ocrResult.Text
	Console.WriteLine(RecognizedText)
End Using
VB   C#

Ce code utilise IronOCR pour effectuer la reconnaissance optique de caractères (OCR) sur un fichier image nommé "ocr.png". Il initialise un objet IronTesseract et lit la couche de texte du fichier image dans un objet OcrInput.

Le résultat de l'OCR est ensuite récupéré sous forme de Texte reconnu et imprimé sur la console.

Sortie

``cs

      - LOGO SHOP

      - LOREM IPSUM

      - DOLOR SITAMET CONSECTETUR

      - ADIPISCING ELIT

      - 1 LOREM IPSUM $3.20

      - 2 ORNARE MALESUADA $9.50

      - 3 PORTA FERMENTUM $5.90

      - 4 SODALES ARCU $6.00

      - 5 ELEIFEND $9.00

 - 6 SEMNISIMASSA 0,50

      - 7 DUIS FAMES DIS $7.60

 - 8 FACILISIRISUS 810

 - MONTANT TOTAL 49,80

 - ESPÈCES $50.00

### Options avancées d'OCR

IronOCR propose diverses options qui vous permettent de personnaliser le processus d'OCR en fonction de vos fichiers images et de vos besoins. Par exemple, vous pouvez spécifier la langue de l'OCR, ajuster les paramètres de prétraitement de l'image ou activer le nettoyage du texte. Voici un exemple qui illustre certaines de ces options avancées :

```cs
using IronOcr;
class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
    ocrInput.LoadImage(@"images\image.png");
        // Set OCR language to English
        ocr.Language = OcrLanguage.English;
        // Enable text cleaning
        ocrInput.DeNoise();
    ocrInput.EnhanceResolution(225);
        var result = ocr.Read(ocrInput);
        if (result != null && result.Text != null)
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}

Le code utilise IronOCR pour effectuer l'OCR sur un fichier image "image.png" situé dans le dossier "images". Il règle la langue de l'OCR sur l'anglais, nettoie le bruit de l'image et améliore sa résolution. Le texte reconnu de l'image est extrait et imprimé sur la console.

Comment créer une démo de logiciel d'OCR en C# : Figure 1

Lecture de codes-barres

IronOCR prend également en charge la lecture des codes-barres, ce qui vous permet de créer des logiciels pour extraire les informations des codes-barres des images. Voici un exemple de code qui montre comment lire un code-barres à l'aide d'IronOCR :

using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
    Console.WriteLine(barcode.Value);
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
    Console.WriteLine(barcode.Value);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Dim ocrInput As New OcrInput()
ocrInput.LoadImage("images\imageWithBarcode.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
For Each barcode In ocrResult.Barcodes
	Console.WriteLine(barcode.Value)
Next barcode
VB   C#

Le code utilise IronOCR pour détecter et lire les codes-barres d'un fichier image "imageWithBarcode.png" dans le dossier "images". Il configure IronOCR pour permettre la lecture des codes-barres en fixant ReadBarCodes à true. Les valeurs des codes-barres détectés sont ensuite imprimées sur la console.

Comment créer une démo de logiciel d'OCR en C# : Figure 2

Extraction de texte en PDF

IronOCR peut également extraire du texte des PDF et des documents numérisés. Voici un exemple de code qui montre comment extraire du texte d'un fichier PDF à l'aide d'IronOCR :

using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
Private ocrInput = New OcrInput()
' OCR entire document
ocrInput.LoadPdf("Email_Report.pdf")
Dim pages() As Integer = { 1, 2, 3, 4, 5 }
' Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
VB   C#

Le code utilise IronOCR pour effectuer un traitement ROC sur un document PDF nommé "Email_Report.pdf". Il peut océriser le document entier en utilisant LoadPdf, ou des pages spécifiques de "exemple.pdf" en utilisant LoadPdfPages avec un mot de passe. Le texte reconnu par l'OCR est imprimé sur la console.

Comment créer une démo de logiciel d'OCR en C# : Figure 3

Conclusion

IronOCR est une puissante bibliothèque .NET qui offre des capacités logicielles d'OCR avancées, permettant aux développeurs d'effectuer facilement des tâches d'OCR dans leurs applications. Dans cet article, nous avons exploré comment effectuer des démonstrations de logiciels OCR basiques et avancés en utilisant IronOCR avec des exemples de code.

Qu'il s'agisse de reconnaître du texte manuscrit ou divers formats numériques, de scanner et de lire des codes-barres ou d'extraire du texte de documents PDF, IronOCR vous couvre grâce à son ensemble complet de fonctionnalités.

Si vous travaillez sur un projet .NET et que vous avez besoin d'intégrer une fonctionnalité d'OCR, IronOCR vaut vraiment la peine d'être pris en considération lors de l'examen des différents moteurs d'OCR. Sa facilité d'utilisation, sa rapidité, sa flexibilité et sa documentation complète en font un choix populaire parmi les développeurs pour les tâches d'automatisation de l'OCR.

Pourquoi ne pas essayer IronOCR et voir comment il peut simplifier votre propre processus de développement de projet OCR ? C'est peut-être le meilleur moteur d'OCR pour vos projets.

IronOCR offre un service gratuit de licence d'essai commencent alors à partir de 749 USD, ce qui vous permet de continuer à tirer le meilleur parti d'IronOCR dans vos projets.

Pour en savoir plus sur IronOCR, consultez le site suivant ici.

< PRÉCÉDENT
OCR Tesseract pour plusieurs langues (Tutoriel pour développeurs)
SUIVANT >
Comment réaliser l'OCR de l'immatriculation d'un véhicule en C#