Passer au contenu du pied de page
UTILISATION D'IRONOCR

Comment créer un logiciel de démonstration OCR en C#

La reconnaissance optique de caractères (OCR) est une technologie qui transforme divers formats de documents, y compris les documents papier numérisés, les PDFs, les fichiers numériques ou les images de texte imprimé prises avec un appareil photo numérique, en données texte modifiables et consultables encodées par machine.

IronOCR est une excellente bibliothèque OCR qui offre de puissantes fonctionnalités OCR aux développeurs. Dans cet article, nous allons explorer comment effectuer de l'OCR en utilisant IronOCR avec des exemples de code avec Démo de logiciel OCR.

Qu'est-ce qu'IronOCR ?

IronOCR est une puissante bibliothèque .NET conçue pour faciliter la reconnaissance optique de caractères (OCR) au sein d'applications C# et VB.NET. En s'appuyant sur des algorithmes avancés et des techniques d'apprentissage automatique, IronOCR peut extraire avec précision du texte et du contenu à partir de fichiers PDF numérisés, d'images et de PDFs, ce qui facilite le traitement, la recherche et l'analyse de tels fichiers de manière programmatique.

Avec son API simple et ses fonctionnalités étendues, les développeurs peuvent intégrer sans effort des capacités OCR dans leurs applications pour automatiser l'extraction de données, le traitement des documents, la saisie de données et les tâches de gestion de contenu. Que vous travailliez sur des affaires, avec des factures, des rapports, l'extraction de données automatisée, un PDF consultable ou tout autre document riche en texte, IronOCR offre une solution fiable pour répondre efficacement aux besoins OCR.

Premiers pas avec IronOCR

Avant de plonger dans les exemples de code, vous devez installer IronOCR via le gestionnaire de paquets NuGet. Vous pouvez installer IronOCR en exécutant la commande suivante dans la console du gestionnaire de paquets :

Install-Package IronOcr

Réaliser une reconnaissance optique de caractères (OCR) avec IronOCR

Reconnaissance de texte de base

Pour effectuer une reconnaissance de texte de base en utilisant IronOCR, vous pouvez utiliser l'extrait de code suivant :

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using (var ocrInput = new OcrInput("ocr.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);
            string recognizedText = ocrResult.Text;
            Console.WriteLine(recognizedText);
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using (var ocrInput = new OcrInput("ocr.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);
            string recognizedText = ocrResult.Text;
            Console.WriteLine(recognizedText);
        }
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()
		Using ocrInput As New OcrInput("ocr.png")
			Dim ocrResult = ocrTesseract.Read(ocrInput)
			Dim recognizedText As String = ocrResult.Text
			Console.WriteLine(recognizedText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Ce code utilise IronOCR pour effectuer de la reconnaissance optique de caractères (OCR) sur un fichier image nommé "ocr.png". Il initialise un objet IronTesseract et lit la couche de texte du fichier image dans un objet OcrInput.

Le résultat OCR est ensuite récupéré en tant que recognizedText et imprimé dans la console.

Résultat
- LOGO SHOP
- LOREM IPSUM
- DOLOR SITAMET CONSECTETUR
- ADIPISCING ELIT
- 1 LOREM IPSUM $3.20
- 2 ORNARE MALESUADA $9.50
- 3 PORTA FERMENTUM $5.90
- 4 SODALES ARCU $6.00
- 5 ELEIFEND $9.00
- 6 SEMNISIMASSA $0.50
- 7 DUIS FAMES DIS $7.60
- 8 FACILISIRISUS $810
- TOTAL AMOUNT $49.80
- CASH $50.00

Options OCR avancées

IronOCR offre diverses options qui vous permettent de personnaliser le processus OCR en fonction de vos fichiers image et de vos exigences. Par exemple, vous pouvez spécifier la langue de l'OCR, ajuster les paramètres de prétraitement de l'image, ou activer le nettoyage du texte. Voici un exemple qui démontre certaines de ces options avancées :

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\image.png");

        // Set OCR language to English
        ocr.Language = OcrLanguage.English;

        // Enable text cleaning and enhance the resolution
        ocrInput.DeNoise();
        ocrInput.EnhanceResolution(225);

        var result = ocr.Read(ocrInput);
        if (!string.IsNullOrEmpty(result.Text))
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\image.png");

        // Set OCR language to English
        ocr.Language = OcrLanguage.English;

        // Enable text cleaning and enhance the resolution
        ocrInput.DeNoise();
        ocrInput.EnhanceResolution(225);

        var result = ocr.Read(ocrInput);
        if (!string.IsNullOrEmpty(result.Text))
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocr = New IronTesseract()
		Dim ocrInput As New OcrInput()
		ocrInput.LoadImage("images\image.png")

		' Set OCR language to English
		ocr.Language = OcrLanguage.English

		' Enable text cleaning and enhance the resolution
		ocrInput.DeNoise()
		ocrInput.EnhanceResolution(225)

		Dim result = ocr.Read(ocrInput)
		If Not String.IsNullOrEmpty(result.Text) Then
			Console.WriteLine($"Recognized Text: {result.Text}")
		End If
	End Sub
End Class
$vbLabelText   $csharpLabel

Le code utilise IronOCR pour effectuer de l'OCR sur un fichier image "image.png" situé dans le dossier "images". Il définit la langue de l'OCR sur l'anglais, nettoie le bruit de l'image et améliore sa résolution. Le texte reconnu de l'image est extrait puis imprimé dans la console.

Comment créer une démonstration de logiciel OCR en C#: Figure 1

Lecture de codes-barres

IronOCR prend également en charge la lecture de codes-barres, vous permettant de créer un logiciel pour extraire les informations des codes-barres à partir d'images. Voici un exemple de code qui démontre comment lire un code-barres en utilisant IronOCR :

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        ocrTesseract.Configuration.ReadBarCodes = true;

        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\imageWithBarcode.png");

        var ocrResult = ocrTesseract.Read(ocrInput);
        foreach (var barcode in ocrResult.Barcodes)
        {
            Console.WriteLine(barcode.Value);
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        ocrTesseract.Configuration.ReadBarCodes = true;

        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\imageWithBarcode.png");

        var ocrResult = ocrTesseract.Read(ocrInput);
        foreach (var barcode in ocrResult.Barcodes)
        {
            Console.WriteLine(barcode.Value);
        }
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()
		ocrTesseract.Configuration.ReadBarCodes = True

		Dim ocrInput As New OcrInput()
		ocrInput.LoadImage("images\imageWithBarcode.png")

		Dim ocrResult = ocrTesseract.Read(ocrInput)
		For Each barcode In ocrResult.Barcodes
			Console.WriteLine(barcode.Value)
		Next barcode
	End Sub
End Class
$vbLabelText   $csharpLabel

Le code utilise IronOCR pour détecter et lire les codes-barres à partir d'un fichier image "imageWithBarcode.png" dans le dossier "images". Il configure IronOCR pour activer la lecture de codes-barres en définissant ReadBarCodes sur vrai. Les valeurs de code-barres détectées sont ensuite imprimées sur la console.

Comment créer une démo de logiciel OCR en C#: Figure 2

Extraction de texte PDF

IronOCR peut également extraire du texte des PDFs et des documents numérisés. Voici un exemple de code qui démontre comment extraire du texte d'un fichier PDF en utilisant IronOCR :

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using var ocrInput = new OcrInput();

        // OCR entire document
        ocrInput.LoadPdf("Email_Report.pdf");

        // Alternatively OCR selected page numbers
        int[] pages = { 1, 2, 3, 4, 5 };
        ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");

        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using var ocrInput = new OcrInput();

        // OCR entire document
        ocrInput.LoadPdf("Email_Report.pdf");

        // Alternatively OCR selected page numbers
        int[] pages = { 1, 2, 3, 4, 5 };
        ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");

        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()
		Dim ocrInput As New OcrInput()

		' OCR entire document
		ocrInput.LoadPdf("Email_Report.pdf")

		' Alternatively OCR selected page numbers
		Dim pages() As Integer = { 1, 2, 3, 4, 5 }
		ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")

		Dim ocrResult = ocrTesseract.Read(ocrInput)
		Console.WriteLine(ocrResult.Text)
	End Sub
End Class
$vbLabelText   $csharpLabel

Le code utilise IronOCR pour effectuer le traitement OCR sur un document PDF nommé "Email_Report.pdf". Il peut OCR l'ensemble du document en utilisant LoadPdf, ou des pages spécifiques de "example.pdf" en utilisant LoadPdfPages avec un mot de passe. Le texte reconnu de l'opération OCR est imprimé dans la console.

Comment créer une démo de logiciel OCR en C#: Figure 3

Conclusion

IronOCR est une puissante bibliothèque .NET qui offre des capacités de logiciels OCR avancées, facilitant la réalisation des tâches OCR par les développeurs dans leurs applications. Dans cet article, nous avons exploré comment effectuer des démonstrations de logiciels OCR de base et avancés en utilisant IronOCR avec des exemples de code.

Si vous travaillez sur un projet .NET et que vous avez besoin d'intégrer des fonctionnalités OCR, IronOCR vaut vraiment la peine d'être envisagé lorsque vous examinez différents moteurs OCR. Sa facilité d'utilisation, sa rapidité, sa flexibilité et sa documentation extensive en font un choix populaire parmi les développeurs pour les tâches d'automatisation OCR.

Alors, pourquoi ne pas essayer IronOCR et voir comment il peut simplifier votre propre processus de développement de projet OCR? Ce pourrait être le meilleur moteur OCR pour vos projets.

IronOCR offre une licence d'essai gratuite, puis commence à partir de $799 USD, ce qui vous permet de continuer à tirer le meilleur parti d'IronOCR dans vos projets.

Pour en savoir plus sur IronOCR, visitez ici.

Questions Fréquemment Posées

Comment puis-je effectuer une reconnaissance optique de caractères en C# ?

Vous pouvez effectuer l'OCR en C# en utilisant la bibliothèque IronOCR. Tout d'abord, installez-la via le gestionnaire de packages NuGet avec la commande Install-Package IronOcr. Ensuite, utilisez l'objet IronTesseract pour lire le texte des images ou des PDF et les convertir en texte éditable.

Quelles étapes sont impliquées dans l'extraction de texte d'une image en C#?

Pour extraire du texte d'une image en C#, utilisez IronOCR en créant une instance de l'objet IronTesseract. Chargez votre image, telle que 'ocr.png', et appelez la méthode Read() pour traiter l'image et extraire le texte.

Puis-je personnaliser le processus OCR avec IronOCR ?

Oui, IronOCR vous permet de personnaliser le processus OCR en définissant des options telles que la langue OCR, en activant le prétraitement de l'image pour réduire le bruit et en ajustant la résolution pour améliorer la précision.

Est-il possible de lire des codes-barres avec IronOCR?

Oui, IronOCR prend en charge la lecture de codes-barres. Vous pouvez le configurer pour détecter et extraire les informations de code-barres des images en activant la fonction de lecture de codes-barres dans votre configuration OCR.

Comment extraire du texte d'un PDF en utilisant C# ?

En utilisant IronOCR, vous pouvez extraire du texte de fichiers PDF en C#. Vous pouvez choisir d'effectuer l'OCR sur l'intégralité du document ou sur des pages spécifiques en chargeant le PDF dans IronTesseract et en utilisant sa méthode Read() pour extraire le texte.

Qu'est-ce qui rend IronOCR un choix recommandé pour les développeurs ?

IronOCR est recommandé pour les développeurs en raison de ses fonctionnalités OCR complètes, de sa facilité d'utilisation, de son traitement rapide et de sa flexibilité. Il s'intègre parfaitement dans les projets .NET, permettant une automatisation efficace des tâches OCR.

Existe-t-il des options de licence disponibles pour IronOCR?

IronOCR propose plusieurs options de licence, à commencer par un essai gratuit. Les développeurs peuvent choisir parmi différentes licences pour continuer à utiliser pleinement les capacités d'IronOCR dans leurs applications.

Où puis-je trouver des exemples de code pour utiliser IronOCR?

Vous pouvez trouver des exemples de code pour utiliser IronOCR dans l'article 'Démonstration de logiciel OCR en C# (Tutoriel pour les développeurs)'. Les exemples démontrent la reconnaissance de texte de base, les options OCR avancées et la lecture de codes-barres.

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Pendant qu'il poursuivait son diplôme, Kannapat est également devenu membre du laboratoire de robotique de véhicules, qui fait partie du département de bioproduction. En 2022, il a utilisé ses compé...
Lire la suite