UTILISATION DE L'IRONOCR

OCR avec vision par ordinateur (exemple de tutoriel)

Kannaopat Udonpant
Kannapat Udonpant
mars 28, 2023
Mise à jour janvier 28, 2024
Partager:

La reconnaissance optique de caractères (OCR) est une technologie qui permet aux machines de lire et d'interpréter le texte à partir d'images, rendant le traitement des données et l'automatisation plus rapides et plus efficaces. Cet article fournit des indications sur l'utilisation de la vision artificielle OCR avec la bibliothèque IronOCR et sur la manière dont elle peut améliorer la reconnaissance de texte, en automatisant ce processus.

Pourquoi l'OCR est-il important ?

OCR avec vision par ordinateur est une forme avancée de Reconnaissance Optique de Caractères (OCR) qui exploite la puissance de l'intelligence artificielle et des algorithmes d'apprentissage automatique pour reconnaître les caractères de texte à partir d'images de manière plus précise et efficace.

Les algorithmes de traitement d'image par vision artificielle permettent aux systèmes OCR de comprendre le contexte et la disposition du texte dans une image et de reconnaître les caractères en fonction de leur forme et de leur structure. L'OCR, associée à la vision par ordinateur, peut extraire du texte à partir d'images complexes comportant plusieurs polices, styles et tailles, ce qui en fait un outil précieux pour la numérisation de documents, l'extraction de données et l'automatisation.

IronOCR : C&num ; Bibliothèque OCR

IronOCR est une bibliothèque OCR populaire qui utilise des techniques de vision par ordinateur pour l'extraction de texte à partir d'images et de documents. Il est facile à utiliser et s'intègre à de nombreux langages de programmation, notamment C# et VB.NET. IronOCR est disponible en version sur site et en version cloud et offre une gamme de fonctionnalités permettant de traiter et d'extraire du texte à partir d'images.

Installation de l'IronOCR

Pour installer IronOCR, utilisez la commande suivante dans la console du gestionnaire de paquets NuGet :

:ProductInstall

Système OCR avec IronOCR

L'image suivante est utilisée pour tester le système OCR avec Vision par Ordinateur en utilisant IronOCR.

OCR avec vision par ordinateur (Exemple de tutoriel), Figure 1 : Exemple d'image utilisé pour la détection OCR

Exemple d'image utilisé pour la détection OCR

FindTextRegion

La méthode FindTextRegion est utilisée pour identifier une seule région de texte dans une image. La méthode prend plusieurs paramètres optionnels, y compris Scale, DilationAmount, Binarize, et Invert. Échelle ajuste la taille de l'image, DilationAmount augmente l'épaisseur du texte, Binarize convertit l'image en noir et blanc, et Invert inverse les couleurs de l'image.

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using inputOCR = New OcrInput("test.jpg")
	inputOCR.FindTextRegion()
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
$vbLabelText   $csharpLabel

Après avoir exécuté le code, vous verrez qu'il extrait le texte de la zone de texte à l'aide d'un processus d'apprentissage automatique. Le résultat s'affiche dans la console avec une précision de reconnaissance de texte de près de 100 %.

OCR avec la vision par ordinateur (Exemple de tutoriel), Figure 2 : Les résultats dans la console du processus d'extraction de texte

Les résultats de la console issus du processus d'extraction de texte

Méthode FindMultipleTextRegions

La méthode FindMultipleTextRegions est similaire à la méthode FindTextRegion, mais elle est utilisée lorsqu'il y a plusieurs régions de texte dans une image. Il renvoie une liste d'objets CropRectangle qui définissent l'emplacement de chaque région de texte. Cette méthode est utile lorsque vous souhaitez extraire du texte d'une image contenant plusieurs sections de texte.

using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr

Private ocr = New IronTesseract()
Using input = New OcrInput("test.jpg")
	input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
$vbLabelText   $csharpLabel

L'extrait de code fourni ci-dessus est un exemple de la manière d'utiliser la bibliothèque IronOCR pour effectuer de l'OCR sur un fichier image. Il importe d'abord la bibliothèque IronOCR et crée une nouvelle instance de la classe IronTesseract. Ensuite, il initialise un objet OcrInput avec le chemin du fichier image d'entrée et applique certaines techniques de prétraitement pour la correction de l'image en utilisant la méthode FindMultipleTextRegions.

Ensuite, il appelle la méthode Read de l'objet IronTesseract, qui effectue l'OCR sur l'image prétraitée et retourne un objet OcrResult. Le texte extrait de l'objet OcrResult est ensuite stocké dans une variable de type chaîne et imprimé dans la console.

La sortie de l'IronOCR

Les résultats d'IronOCR sont très précis, même lorsqu'il s'agit d'images complexes comportant plusieurs polices, tailles et styles de texte.

La précision de l'OCR est cruciale lors de l'extraction de données à partir d'images, car le texte extrait est souvent utilisé pour un traitement ultérieur, tel que l'analyse de données, la saisie manuelle de données, l'apprentissage automatique ou le traitement du langage naturel. Si le texte extrait contient des erreurs, il peut causer des problèmes en aval. De plus, IronOCR permet d'examiner les objets de résultat pour vérifier les niveaux de confiance.

Cas d'utilisation de la vision par ordinateur de l'OCR

La technologie de reconnaissance optique de caractères (OCR) a révolutionné la façon dont le texte imprimé est traité. Les outils d'OCR sont devenus un élément indispensable du traitement des documents et de l'extraction des données. Voici quelques cas d'utilisation des logiciels de reconnaissance optique de caractères :

OCR Reconnaissance des plaques d'immatriculation

La reconnaissance des plaques d'immatriculation joue un rôle significatif dans l'automatisation de la gestion du trafic, des systèmes de stationnement et des activités des forces de l'ordre. En mettant en œuvre la vision artificielle OCR en C#, les développeurs peuvent créer des applications qui identifient rapidement et avec précision les plaques d'immatriculation à partir d'images ou de flux vidéo en direct. Cette technologie peut être utilisée pour :

  • Contrôler les infractions au code de la route et identifier les véhicules impliqués dans des activités criminelles.
  • Automatiser les systèmes de stationnement, en facilitant la gestion des entrées et des sorties et en rationalisant le processus de facturation.
  • Renforcer les mesures de sécurité en suivant et en contrôlant les mouvements des véhicules dans les zones d'accès restreint.

Extraction de texte à partir de factures

La vision par ordinateur OCR en C# peut être utilisée pour développer des applications OCR qui automatisent l'extraction de texte à partir de factures et d'autres documents financiers. Ce processus permet de réduire considérablement les erreurs de saisie manuelle des données et de rationaliser les tâches comptables. Les principaux avantages sont les suivants :

  • Augmentation de la productivité grâce à l'automatisation du processus de saisie des données.
  • Précision accrue, car l'OCR réduit la probabilité d'erreurs humaines.
  • Intégration transparente avec les logiciels et systèmes comptables pour une gestion efficace des données.

Génération de sous-titres OCR

Créer des sous-titres pour les vidéos peut être chronophage et laborieux. La vision par ordinateur OCR en C# peut simplifier ce processus en détectant et transcrivant automatiquement le texte à l'écran, permettant ainsi aux développeurs de :

  • Créez des sous-titres précis pour les films, les émissions de télévision et les vidéos en ligne.
  • Améliorer l'accessibilité pour les personnes souffrant de déficiences auditives ou parlant des langues différentes.
  • Stimuler les efforts de référencement en fournissant un contenu indexable pour la plateforme vidéo

Traitement OCR des PDF

Les PDF sont largement utilisés pour le partage et le stockage de documents, mais l'extraction de texte à partir de ces documents peut s'avérer difficile. La vision par ordinateur OCR en C# peut aider les développeurs à créer des applications OCR qui traitent sans effort les fichiers PDF et extraire leur contenu, facilitant :

Numérisation de textes imprimés

Le logiciel OCR est largement utilisé pour numériser le texte imprimé à partir d'images de documents. Les outils OCR peuvent extraire du texte à partir de documents numériques numérisés, PDF, et images dans divers formats. C'est particulièrement utile pour la gestion des documents, où vous pouvez facilement rechercher, stocker et partager des documents textuels.

Extraction des données

La technologie OCR est largement utilisée pour extraire des données à partir de données d'entrée telles que des factures, des reçus et des formulaires. Les modèles OCR peuvent reconnaître et extraire des champs de données clés tels que les noms, les adresses, les dates et les montants. Cela élimine la nécessité d'une saisie manuelle des données et réduit les erreurs dans le traitement des données.

Recherche d'images

La technologie OCR est également utilisée pour la recherche d'images, où vous pouvez rechercher des images sur la base du texte qu'elles contiennent. Cette fonction est particulièrement utile pour les grandes bibliothèques d'images, où la recherche manuelle prendrait beaucoup de temps.

Traduction

Le logiciel OCR peut être utilisé pour extraire le texte de documents dans une langue et le traduire dans une autre langue. Ceci est particulièrement utile pour les entreprises internationales, où les documents doivent être traduits rapidement et avec précision.

Résumé

La reconnaissance optique de caractères (OCR) est une technologie qui permet aux ordinateurs de lire du texte à partir d'images. L'OCR et la vision par ordinateur sont importantes car elles permettent aux machines de comprendre et d'interpréter le monde visuel, ce qui est essentiel pour des applications telles que les voitures autonomes, la robotique et le traitement automatisé des documents.

IronOCR est un puissant moteur d'OCR qui peut être utilisé pour appliquer l'OCR avec la vision par ordinateur afin de reconnaître avec précision le texte et d'effectuer l'extraction de texte à partir d'images. Il fournit une gamme de méthodes pour trouver et extraire des régions de texte, y compris FindTextRegion, FindMultipleTextRegions, et GetTextRegions. Chaque méthode possède son propre ensemble de paramètres pouvant être utilisés pour affiner le processus OCR et fournir une précision OCR élevée.

En utilisant IronOCR, vous pouvez extraire le texte scanné des images d'entrée rapidement et avec précision en utilisant la concurrence et une configuration personnalisée, ce qui peut vous faire gagner du temps et des efforts lors du traitement de grands volumes de données d'images d'entrée. Que vous travailliez avec des documents numérisés, des photographies ou des captures d'écran, IronOCR peut vous aider à déverrouiller le texte qu'ils contiennent.

IronOCR offre un essai gratuit aux utilisateurs qui souhaitent tester le logiciel avant de prendre une décision d'achat. La licence pour IronOCR commence à partir de $749 et inclut le support et les mises à jour pendant un an. Avec ses fonctionnalités robustes et son prix raisonnable, IronOCR est une excellente option pour tous ceux qui recherchent une solution d'OCR fiable avec une grande précision d'OCR.

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Tout en poursuivant ses études, Kannapat est également devenu membre du Vehicle Robotics Laboratory, qui fait partie du Department of Bioproduction Engineering (département d'ingénierie de la bioproduction). En 2022, il a mis à profit ses compétences en C# pour rejoindre l'équipe d'ingénieurs d'Iron Software, où il se concentre sur IronPDF. Kannapat apprécie son travail car il apprend directement auprès du développeur qui écrit la majeure partie du code utilisé dans IronPDF. Outre l'apprentissage par les pairs, Kannapat apprécie l'aspect social du travail chez Iron Software. Lorsqu'il n'écrit pas de code ou de documentation, Kannapat peut généralement être trouvé en train de jouer sur sa PS5 ou de revoir The Last of Us.
< PRÉCÉDENT
Extraction de données de reçus OCR (tutoriel étape par étape)
SUIVANT >
Comment OCR le permis de conduire en C#