Passer au contenu du pied de page
UTILISATION D'IRONOCR

OCR avec vision par ordinateur (Tutoriel d'exemple)

Reconnaissance optique de caractères (OCR) avec IronOCR

La reconnaissance optique de caractères (OCR) est une technologie qui permet aux machines de lire et d'interpréter le texte à partir d'images, rendant le traitement des données et l'automatisation plus rapides et plus efficaces. Cet article fournit des lignes directrices sur l'utilisation de l'OCR avec la bibliothèque IronOCR et explique comment elle peut améliorer la reconnaissance de texte en automatisant ce processus.

Pourquoi l'OCR est-il important ?

L'OCR avec la vision par ordinateur est une forme avancée de reconnaissance optique de caractères (OCR) qui exploite la puissance de l'intelligence artificielle et des algorithmes d'apprentissage automatique pour reconnaître les caractères textuels à partir d'images de manière plus précise et efficace.

Les algorithmes de traitement d'image de vision par ordinateur permettent aux systèmes OCR de comprendre le contexte et la disposition du texte dans une image et de reconnaître les caractères en fonction de leur forme et de leur structure. L'OCR avec la vision par ordinateur peut extraire le texte d'images complexes contenant plusieurs polices, styles et tailles, en en faisant un outil précieux dans la numérisation de documents, l'extraction de données et l'automatisation.

IronOCR : Bibliothèque OCR C

IronOCR est une bibliothèque OCR populaire qui utilise des techniques de vision par ordinateur pour extraire le texte à partir d'images et de documents. Il est facile à utiliser et s'intègre à plusieurs langages de programmation, y compris C# et VB.NET. IronOCR est disponible en versions sur site et cloud et offre une gamme de fonctionnalités pour traiter et extraire le texte des images.

Installation de IronOCR

Pour installer IronOCR, utilisez la commande suivante dans la console du gestionnaire de packages NuGet :

Install-Package IronOcr

Système OCR avec IronOCR

L'image suivante est utilisée pour tester le système OCR avec vision par ordinateur en utilisant IronOCR.

L'OCR avec la vision par ordinateur (Exemple de tutoriel), Figure 1 : Échantillon d'image utilisé pour la détection OCR Échantillon d'image utilisé pour la détection OCR

Méthode FindTextRegion

La méthode FindTextRegion est utilisée pour identifier une seule région de texte dans une image. La méthode accepte plusieurs paramètres optionnels, y compris Scale, DilationAmount, Binarize, et Invert :

  • Scale ajuste la taille de l'image pour une meilleure reconnaissance du texte.
  • DilationAmount augmente l'épaisseur du texte pour améliorer la visibilité.
  • Binarize convertit l'image en noir et blanc pour améliorer le contraste.
  • Invert inverse les couleurs de l'image, ce qui peut être utile pour certains types d'images.
using IronOcr;
using System;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var inputOCR = new OcrInput("test.jpg")) 
{
    // Identify a text region within the image
    inputOCR.FindTextRegion();

    // Perform OCR on the identified text region
    OcrResult result = ocr.Read(inputOCR);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;
using System;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var inputOCR = new OcrInput("test.jpg")) 
{
    // Identify a text region within the image
    inputOCR.FindTextRegion();

    // Perform OCR on the identified text region
    OcrResult result = ocr.Read(inputOCR);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr
Imports System

' Initialize the IronTesseract OCR engine
Private ocr = New IronTesseract()

' Create an OcrInput object for the image
Using inputOCR = New OcrInput("test.jpg")
	' Identify a text region within the image
	inputOCR.FindTextRegion()

	' Perform OCR on the identified text region
	Dim result As OcrResult = ocr.Read(inputOCR)

	' Extract and print the recognized text
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
$vbLabelText   $csharpLabel

Remarque : Après exécution du code, vous verrez qu'il extrait le texte de la région de texte en utilisant un processus d'apprentissage machine. Le résultat de sortie apparaît dans la console avec une haute précision de reconnaissance de texte.

L'OCR avec la vision par ordinateur (Exemple de tutoriel), Figure 2 : Les résultats de la console du processus d'extraction de texte Les résultats de la console du processus d'extraction de texte

Méthode FindMultipleTextRegions

La méthode FindMultipleTextRegions est similaire à FindTextRegion, mais elle est utilisée lorsque plusieurs régions de texte se trouvent dans une image. Elle renvoie une liste d'objets CropRectangle qui définissent l'emplacement de chaque région de texte. Cette méthode est utile lorsque vous souhaitez extraire le texte d'une image contenant plusieurs sections de texte.

using IronOcr;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var input = new OcrInput("test.jpg"))
{
    // Identify multiple text regions within the image
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);

    // Perform OCR on the pre-processed image
    OcrResult result = ocr.Read(input);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var input = new OcrInput("test.jpg"))
{
    // Identify multiple text regions within the image
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);

    // Perform OCR on the pre-processed image
    OcrResult result = ocr.Read(input);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr

' Initialize the IronTesseract OCR engine
Private ocr = New IronTesseract()

' Create an OcrInput object for the image
Using input = New OcrInput("test.jpg")
	' Identify multiple text regions within the image
	input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)

	' Perform OCR on the pre-processed image
	Dim result As OcrResult = ocr.Read(input)

	' Extract and print the recognized text
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
$vbLabelText   $csharpLabel

Explication : L'exemple de code fourni ci-dessus est un exemple d'utilisation de la bibliothèque IronOCR pour effectuer l'OCR sur un fichier image. Il importe d'abord la bibliothèque IronOCR et crée une nouvelle instance de la classe IronTesseract. Ensuite, il initialise un objet OcrInput avec le chemin du fichier image d'entrée et applique certaines techniques de prétraitement pour la correction d'image à l'aide de la méthode FindMultipleTextRegions.

Le Résultat de IronOCR

Le résultat de IronOCR est très précis, même lorsqu'il traite des images complexes contenant plusieurs polices, tailles et styles de texte.

La précision de l'OCR est cruciale lors de l'extraction des données des images car le texte extrait est souvent utilisé pour un traitement ultérieur, comme l'analyse des données, la saisie manuelle des données, l'apprentissage machine ou le traitement du langage naturel. Si le texte extrait contient des erreurs, cela peut causer des problèmes en aval. De plus, IronOCR permet d'examiner les objets de résultat pour vérifier les niveaux de confiance.

Cas d'utilisation de l'OCR Vision par Ordinateur

La technologie de reconnaissance optique de caractères (OCR) a révolutionné la manière dont les textes imprimés sont traités. Les outils OCR sont devenus une partie indispensable du traitement de documents et de l'extraction de données. Voici quelques cas d'utilisation des logiciels de reconnaissance optique de caractères :

Reconnaissance de Plaques d'Immatriculation par OCR

La reconnaissance de plaques d'immatriculation joue un rôle important dans l'automatisation de la gestion du trafic, des systèmes de stationnement et des activités des forces de l'ordre. En intégrant l'OCR vision par ordinateur en C#, les développeurs peuvent créer des applications qui identifient rapidement et précisément les plaques d'immatriculation à partir d'images ou de flux vidéo en direct. Cette technologie peut être utilisée pour :

  • Surveiller les infractions au code de la route et identifier les véhicules impliqués dans des activités criminelles.
  • Automatiser les systèmes de stationnement, facilitant la gestion des entrées et sorties et rationalisant le processus de facturation.
  • Renforcer les mesures de sécurité en suivant et surveillant le mouvement des véhicules dans des zones restreintes.

Extraction de Texte à partir de Factures

L'ordinateur OCR en C# peut être utilisé pour développer des applications OCR qui automatisent l'extraction du texte des factures et d'autres documents financiers. Ce processus peut réduire considérablement les erreurs de saisie manuelle de données et rationaliser les tâches comptables. Les principaux avantages comprennent :

  • Productivité accrue grâce à l'automatisation du processus de saisie de données.
  • Précision améliorée, car l'OCR réduit la probabilité d'erreurs humaines.
  • Intégration fluide avec les logiciels et systèmes comptables pour une gestion efficace des données.

Génération de Sous-Titres par OCR

Créer des sous-titres pour les vidéos peut être chronophage et laborieux. L'OCR vision par ordinateur en C# peut simplifier ce processus en détectant et transcrivant automatiquement le texte à l'écran, permettant aux développeurs de :

  • Créer des sous-titres précis pour les films, séries télévisées et vidéos en ligne.
  • Améliorer l'accessibilité pour les personnes malentendantes ou parlant différentes langues.
  • Améliorer les efforts de SEO en fournissant un contenu recherché et indexé pour la plateforme vidéo

Traitement PDF par OCR

Les PDF sont largement utilisés pour partager et stocker des documents, mais extraire du texte à partir de ceux-ci peut être difficile. L'OCR vision par ordinateur en C# peut aider les développeurs à créer des applications OCR qui traitent les fichiers PDF sans effort et extraient leur contenu, facilitant :

Numérisation de Texte Imprimé

Les logiciels OCR sont largement utilisés pour numériser le texte imprimé à partir d'images de documents. Les outils OCR peuvent extraire le texte des documents numériques scannés, PDF, et images dans divers formats. Cela est particulièrement utile dans la gestion de documents, où vous pouvez facilement rechercher, stocker et partager des documents textuels.

Extraction de données

La technologie OCR est largement utilisée pour extraire des données d'entrée telles que des factures, reçus, et formulaires. Les modèles OCR peuvent reconnaître et extraire les principaux champs de données tels que noms, adresses, dates, et montants. Cela élimine le besoin de saisie manuelle des données et réduit les erreurs dans le traitement des données.

Recherche d'Images

La technologie OCR est également utilisée pour la recherche d'images, où vous pouvez chercher des images en fonction du texte qu'elles contiennent. C'est particulièrement utile pour de grandes bibliothèques d'images, où la recherche manuelle serait chronophage.

Traduction

Les logiciels OCR peuvent être utilisés pour extraire le texte de documents dans une langue et le traduire dans une autre langue. Cela est particulièrement utile pour les entreprises internationales, où les documents doivent être traduits rapidement et avec précision.

Résumé

La reconnaissance optique de caractères (OCR) est une technologie qui permet aux ordinateurs de lire le texte à partir d'images. L'OCR accompagné de la vision par ordinateur est important car il permet aux machines de comprendre et d'interpréter le monde visuel, ce qui est essentiel pour des applications telles que les voitures autonomes, la robotique, et le traitement automatisé de documents.

IronOCR est un moteur OCR puissant qui peut être utilisé pour appliquer l'OCR avec une vision par ordinateur pour reconnaître avec précision le texte et effectuer l'extraction de texte à partir d'images. Il offre une gamme de méthodes pour trouver et extraire des régions de texte, y compris FindTextRegion, FindMultipleTextRegions, et GetTextRegions. Chaque méthode a son propre ensemble de paramètres pouvant être utilisés pour affiner le processus OCR et fournir une haute précision OCR.

En utilisant IronOCR, vous pouvez extraire rapidement et avec précision le texte scanné à partir d'images d'entrée en utilisant la concurrence et une configuration personnalisée, ce qui peut vous faire gagner du temps et des efforts lorsque vous traitez de grands volumes de données d'images d'entrée. Que vous travailliez avec des documents scannés, des photographies ou des captures d'écran, IronOCR peut vous aider à déverrouiller le texte qu'ils contiennent.

IronOCR offre un essai gratuit aux utilisateurs qui souhaitent tester le logiciel avant de prendre une décision d'achat. La licence pour IronOCR commence à partir de $799 et inclut le support et les mises à jour pour une année. Avec ses fonctionnalités robustes et ses prix raisonnables, IronOCR est une excellente option pour quiconque recherche une solution OCR fiable avec une haute précision OCR.

Questions Fréquemment Posées

Comment puis-je convertir une image en texte avec C# ?

Vous pouvez utiliser les fonctionnalités OCR d'IronOCR pour convertir des images en texte avec C#. En utilisant des méthodes comme Read et ReadAsync, vous pouvez traiter les images pour extraire le texte efficacement.

Quels sont les avantages d'utiliser l'OCR avec la vision par ordinateur?

L'utilisation de l'OCR avec la vision par ordinateur permet une reconnaissance de texte plus précise à partir de mises en page d'images, de polices et de styles complexes. IronOCR utilise l'intelligence artificielle et l'apprentissage automatique pour améliorer l'extraction de texte et automatiser le traitement des données.

Comment améliorer la précision de l'OCR en C# ?

IronOCR offre diverses méthodes pour améliorer la précision de l'OCR, notamment en ajustant les paramètres de configuration, en utilisant la concurrence et en inspectant les objets de résultat pour les niveaux de confiance. Cela aide à affiner le processus d'OCR pour de meilleurs résultats.

Quel est le processus pour extraire du texte de plusieurs régions dans une image ?

Pour extraire du texte de plusieurs régions dans une image avec IronOCR, vous pouvez utiliser la méthode FindMultipleTextRegions. Cette méthode renvoie une liste d'objets CropRectangle indiquant l'emplacement de chaque région de texte.

La technologie OCR peut-elle être utilisée pour la reconnaissance de plaques d'immatriculation ?

Oui, la technologie OCR, telle que celle fournie par IronOCR, peut être appliquée à la reconnaissance de plaques d'immatriculation. En traitant des images de plaques d'immatriculation, IronOCR peut extraire le texte pour diverses applications.

Comment installer IronOCR dans un projet C# ?

Vous pouvez installer IronOCR dans votre projet C# en utilisant la console du gestionnaire de packages NuGet. Exécutez la commande Install-Package IronOcr pour ajouter la bibliothèque à votre projet.

Y a-t-il une version d'essai pour tester une bibliothèque OCR en C# ?

Oui, IronOCR propose une version d'essai gratuite, permettant aux utilisateurs de tester les capacités de la bibliothèque avant de s'engager à acheter une licence.

Quelles options de licence sont disponibles pour une bibliothèque OCR en C# ?

IronOCR propose diverses options de licence à partir de $liteLicense, qui incluent un support et des mises à jour pendant un an, répondant aux différents besoins et budgets des projets.

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Pendant qu'il poursuivait son diplôme, Kannapat est également devenu membre du laboratoire de robotique de véhicules, qui fait partie du département de bioproduction. En 2022, il a utilisé ses compé...
Lire la suite