Passer au contenu du pied de page
UTILISATION D'IRONOCR

Comment créer un logiciel de démonstration OCR en C#

La reconnaissance optique de caractères (ROC) est une technologie qui transforme divers formats de documents, y compris les documents papier scannés, les PDF, les fichiers numériques ou les images de textes imprimés prises avec un appareil photo numérique, en données textuelles codées par une machine, modifiables et consultables.

IronOCR est une excellente bibliothèque de moteur d'OCR qui offre de puissantes fonctionnalités d'OCR aux développeurs. Dans cet article, nous allons explorer comment effectuer l'OCR à l'aide d'IronOcr avec des exemples de code avec Démonstration du logiciel d'OCR.

Qu'est-ce qu'IronOCR?

IronOCR est une puissante bibliothèque .NET conçue pour faciliter la reconnaissance optique de caractères (OCR) au sein des applications C# et VB.NET. S'appuyant sur des algorithmes avancés et des techniques d'apprentissage automatique, IronOCR peut extraire avec précision du texte et du contenu à partir de fichiers PDF numérisés, d'images et de PDF, ce qui facilite le traitement, la recherche et l'analyse de ces fichiers de manière programmatique.

Grâce à son API simple et à ses nombreuses fonctionnalités, les développeurs peuvent intégrer en toute transparence des fonctions d'OCR dans leurs applications afin d'automatiser l'extraction de données, le traitement de documents, la saisie de données et les tâches de gestion de contenu. Que vous travailliez dans le domaine des affaires, avec des factures, des rapports, une extraction de données automatisée, un PDF interrogeable ou tout autre document riche en texte, IronOcr offre une solution fiable pour traiter efficacement les exigences de l'OCR.

Pour commencer avec IronOCR

Avant de plonger dans les exemples de code, vous devez installer IronOCR via NuGet Package Manager. Vous pouvez installer IronOCR en exécutant la commande suivante dans la console du gestionnaire de paquets :

Install-Package IronOcr

Exécution de l'OCR avec IronOCR

Reconnaissance de base du texte

Pour effectuer une reconnaissance de texte de base à l'aide d'IronOCOcr, vous pouvez utiliser l'extrait de code suivant :

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using (var ocrInput = new OcrInput("ocr.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);
            string recognizedText = ocrResult.Text;
            Console.WriteLine(recognizedText);
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using (var ocrInput = new OcrInput("ocr.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);
            string recognizedText = ocrResult.Text;
            Console.WriteLine(recognizedText);
        }
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()
		Using ocrInput As New OcrInput("ocr.png")
			Dim ocrResult = ocrTesseract.Read(ocrInput)
			Dim recognizedText As String = ocrResult.Text
			Console.WriteLine(recognizedText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Ce code utilise IronOcr pour effectuer une reconnaissance optique de caractères (OCR) sur un fichier image nommé "ocr.png". Il initialise un objet IronTesseract et lit la couche de texte du fichier image dans un objet OcrInput.

Le résultat de l'OCR est ensuite récupéré en tant que Texte reconnu et imprimé sur la console.

Sortie
- LOGO SHOP
- LOREM IPSUM
- DOLOR SITAMET CONSECTETUR
- ADIPISCING ELIT
- 1 LOREM IPSUM $3.20
- 2 ORNARE MALESUADA $9.50
- 3 PORTA FERMENTUM $5.90
- 4 SODALES ARCU $6.00
- 5 ELEIFEND $9.00
- 6 SEMNISIMASSA $0.50
- 7 DUIS FAMES DIS $7.60
- 8 FACILISIRISUS $810
- TOTAL AMOUNT $49.80
- CASH $50.00

Options avancées d'OCR

IronOcr propose diverses options qui vous permettent de personnaliser le processus d'OCR en fonction de vos fichiers images et de vos besoins. Par exemple, vous pouvez spécifier la langue de l'OCR, ajuster les paramètres de prétraitement de l'image ou activer le nettoyage du texte. Voici un exemple qui illustre certaines de ces options avancées :

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\image.png");

        // Set OCR language to English
        ocr.Language = OcrLanguage.English;

        // Enable text cleaning and enhance the resolution
        ocrInput.DeNoise();
        ocrInput.EnhanceResolution(225);

        var result = ocr.Read(ocrInput);
        if (!string.IsNullOrEmpty(result.Text))
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\image.png");

        // Set OCR language to English
        ocr.Language = OcrLanguage.English;

        // Enable text cleaning and enhance the resolution
        ocrInput.DeNoise();
        ocrInput.EnhanceResolution(225);

        var result = ocr.Read(ocrInput);
        if (!string.IsNullOrEmpty(result.Text))
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocr = New IronTesseract()
		Dim ocrInput As New OcrInput()
		ocrInput.LoadImage("images\image.png")

		' Set OCR language to English
		ocr.Language = OcrLanguage.English

		' Enable text cleaning and enhance the resolution
		ocrInput.DeNoise()
		ocrInput.EnhanceResolution(225)

		Dim result = ocr.Read(ocrInput)
		If Not String.IsNullOrEmpty(result.Text) Then
			Console.WriteLine($"Recognized Text: {result.Text}")
		End If
	End Sub
End Class
$vbLabelText   $csharpLabel

Le code utilise IronOcr pour effectuer une reconnaissance optique des caractères sur un fichier image "image.png" situé dans le dossier "images". Il définit la langue de l'OCR en anglais, nettoie le bruit de l'image et améliore sa résolution. Le texte reconnu dans l'image est extrait puis imprimé sur la console.

Comment créer une démo de logiciel OCR en C# : Figure 1

Lecture de BarCodes

IronOcr prend également en charge la lecture de codes-barres, ce qui vous permet de créer des logiciels pour extraire des informations de codes-barres à partir d'images. Voici un exemple de code qui montre comment lire un code-barres à l'aide d'IronOcr :

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        ocrTesseract.Configuration.ReadBarCodes = true;

        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\imageWithBarcode.png");

        var ocrResult = ocrTesseract.Read(ocrInput);
        foreach (var barcode in ocrResult.Barcodes)
        {
            Console.WriteLine(barcode.Value);
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        ocrTesseract.Configuration.ReadBarCodes = true;

        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\imageWithBarcode.png");

        var ocrResult = ocrTesseract.Read(ocrInput);
        foreach (var barcode in ocrResult.Barcodes)
        {
            Console.WriteLine(barcode.Value);
        }
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()
		ocrTesseract.Configuration.ReadBarCodes = True

		Dim ocrInput As New OcrInput()
		ocrInput.LoadImage("images\imageWithBarcode.png")

		Dim ocrResult = ocrTesseract.Read(ocrInput)
		For Each barcode In ocrResult.Barcodes
			Console.WriteLine(barcode.Value)
		Next barcode
	End Sub
End Class
$vbLabelText   $csharpLabel

Le code utilise IronOcr pour détecter et lire des codes-barres à partir d'un fichier image "imageWithBarcode.png" dans le dossier "images". Elle configure IronOcr pour permettre la lecture des codes-barres en définissant ReadBarCodes sur true. Les valeurs des codes-barres détectés sont ensuite imprimées sur la console.

Comment créer une démo de logiciel OCR en C# : Figure 2

Extraction de texte au format PDF

IronOcr peut également extraire du texte à partir de PDF et de documents numérisés. Voici un exemple de code qui montre comment extraire du texte d'un fichier PDF à l'aide d'IronOCR :

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using var ocrInput = new OcrInput();

        // OCR entire document
        ocrInput.LoadPdf("Email_Report.pdf");

        // Alternatively OCR selected page numbers
        int[] pages = { 1, 2, 3, 4, 5 };
        ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");

        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using var ocrInput = new OcrInput();

        // OCR entire document
        ocrInput.LoadPdf("Email_Report.pdf");

        // Alternatively OCR selected page numbers
        int[] pages = { 1, 2, 3, 4, 5 };
        ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");

        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()
		Dim ocrInput As New OcrInput()

		' OCR entire document
		ocrInput.LoadPdf("Email_Report.pdf")

		' Alternatively OCR selected page numbers
		Dim pages() As Integer = { 1, 2, 3, 4, 5 }
		ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")

		Dim ocrResult = ocrTesseract.Read(ocrInput)
		Console.WriteLine(ocrResult.Text)
	End Sub
End Class
$vbLabelText   $csharpLabel

Le code utilise IronOCR pour effectuer un traitement ROC sur un document PDF nommé "Email_Report.pdf". Il peut océriser le document entier en utilisant LoadPdf, ou des pages spécifiques de "example.pdf" en utilisant LoadPdfPages avec un mot de passe. Le texte reconnu par l'opération d'OCR est imprimé sur la console.

Comment créer une démo de logiciel OCR en C# : Figure 3

Conclusion

IronOCR est une puissante bibliothèque .NET qui offre des capacités logicielles avancées en matière d'OCR, ce qui permet aux développeurs d'effectuer facilement des tâches d'OCR dans leurs applications. Dans cet article, nous avons exploré comment effectuer une démonstration logicielle OCR basique et avancée à l'aide d'IronOCR avec des exemples de code.

Si vous travaillez sur un projet .NET et que vous avez besoin d'intégrer une fonctionnalité d'OCR, IronOCR vaut vraiment la peine d'être pris en compte lorsque vous examinez les différents moteurs d'OCR. Sa facilité d'utilisation, sa rapidité, sa flexibilité et sa documentation complète en font un choix populaire parmi les développeurs pour les tâches d'automatisation de l'OCR.

Alors pourquoi ne pas essayer IronOCR et voir comment il peut simplifier votre propre processus de développement de projet OCR ? Il peut s'agir du meilleur moteur OCR pour vos projets.

IronOCR propose une licence d'essai gratuite puis à partir de $799 USD qui vous permet de continuer à tirer le meilleur parti d'IronOCR dans vos projets.

Pour en savoir plus sur IronOCR, rendez-vous sur ici.

Questions Fréquemment Posées

Comment puis-je effectuer une reconnaissance optique de caractères en C# ?

Vous pouvez effectuer l'OCR en C# en utilisant la bibliothèque IronOCR. Tout d'abord, installez-la via le gestionnaire de packages NuGet avec la commande Install-Package IronOcr. Ensuite, utilisez l'objet IronTesseract pour lire le texte des images ou des PDF et les convertir en texte éditable.

Quelles étapes sont impliquées dans l'extraction de texte d'une image en C#?

Pour extraire du texte d'une image en C#, utilisez IronOCR en créant une instance de l'objet IronTesseract. Chargez votre image, telle que 'ocr.png', et appelez la méthode Read() pour traiter l'image et extraire le texte.

Puis-je personnaliser le processus OCR avec IronOCR ?

Oui, IronOCR vous permet de personnaliser le processus OCR en définissant des options telles que la langue OCR, en activant le prétraitement de l'image pour réduire le bruit et en ajustant la résolution pour améliorer la précision.

Est-il possible de lire des codes-barres avec IronOCR?

Oui, IronOCR prend en charge la lecture de codes-barres. Vous pouvez le configurer pour détecter et extraire les informations de code-barres des images en activant la fonction de lecture de codes-barres dans votre configuration OCR.

Comment extraire du texte d'un PDF en utilisant C# ?

En utilisant IronOCR, vous pouvez extraire du texte de fichiers PDF en C#. Vous pouvez choisir d'effectuer l'OCR sur l'intégralité du document ou sur des pages spécifiques en chargeant le PDF dans IronTesseract et en utilisant sa méthode Read() pour extraire le texte.

Qu'est-ce qui rend IronOCR un choix recommandé pour les développeurs ?

IronOCR est recommandé pour les développeurs en raison de ses fonctionnalités OCR complètes, de sa facilité d'utilisation, de son traitement rapide et de sa flexibilité. Il s'intègre parfaitement dans les projets .NET, permettant une automatisation efficace des tâches OCR.

Existe-t-il des options de licence disponibles pour IronOCR?

IronOCR propose plusieurs options de licence, à commencer par un essai gratuit. Les développeurs peuvent choisir parmi différentes licences pour continuer à utiliser pleinement les capacités d'IronOCR dans leurs applications.

Où puis-je trouver des exemples de code pour utiliser IronOCR?

Vous pouvez trouver des exemples de code pour utiliser IronOCR dans l'article 'Démonstration de logiciel OCR en C# (Tutoriel pour les développeurs)'. Les exemples démontrent la reconnaissance de texte de base, les options OCR avancées et la lecture de codes-barres.

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Pendant qu'il poursuivait son diplôme, Kannapat est également devenu membre du laboratoire de robotique de véhicules, qui fait partie du département de bioproduction. En 2022, il a utilisé ses compé...
Lire la suite