UTILISATION DE L'IRONOCR

OCR avec vision par ordinateur (exemple de tutoriel)

Mise à jour janvier 28, 2024
Partager:

Reconnaissance optique de caractères(OCR) est une technologie qui permet aux machines de lire et d'interpréter du texte à partir d'images, ce qui rend le traitement des données et l'automatisation plus rapides et plus efficaces. Cet article fournit des indications sur l'utilisation de la vision artificielle OCR avec la bibliothèque IronOCR et sur la manière dont elle peut améliorer la reconnaissance de texte, en automatisant ce processus.

Pourquoi l'OCR est-il important ?

OCR et vision par ordinateur est une forme avancée de reconnaissance optique de caractères(OCR) qui exploite la puissance de l'intelligence artificielle et des algorithmes d'apprentissage automatique pour reconnaître les caractères de texte à partir d'images avec plus de précision et d'efficacité.

Les algorithmes de traitement d'image par vision artificielle permettent aux systèmes OCR de comprendre le contexte et la disposition du texte dans une image et de reconnaître les caractères en fonction de leur forme et de leur structure. L'OCR, associée à la vision par ordinateur, peut extraire du texte à partir d'images complexes comportant plusieurs polices, styles et tailles, ce qui en fait un outil précieux pour la numérisation de documents, l'extraction de données et l'automatisation.

IronOCR : C&num ; Bibliothèque OCR

IronOCR est une bibliothèque OCR populaire qui utilise des techniques de vision artificielle pour l'extraction de texte à partir d'images et de documents. Il est facile à utiliser et s'intègre à de nombreux langages de programmation, notamment C# et VB.NET. IronOCR est disponible en version sur site et en version cloud et offre une gamme de fonctionnalités permettant de traiter et d'extraire du texte à partir d'images.

Installation de l'IronOCR

Pour installer IronOCR, utilisez la commande suivante dans la console du gestionnaire de paquets NuGet :

:ProductInstall

Système OCR avec IronOCR

L'image suivante est utilisée pour tester leSystème OCR avec vision par ordinateur en utilisant l'IronOCR.

OCR avec vision par ordinateur(Exemple de tutoriel), Figure 1 : Échantillon d'image utilisé pour la détection de l'OCR

Exemple d'image utilisée pour la détection de l'OCR

FindTextRegion

LesFindTextRegion (Trouver une région de texte) est utilisée pour identifier une zone de texte unique dans une image. La méthode prend plusieurs paramètres optionnels, dont Scale, DilationAmount, Binarize, et Invert. Scale ajuste la taille de l'image, DilationAmount augmente l'épaisseur du texte, Binarize convertit l'image en noir et blanc, et Invert inverse les couleurs de l'image.

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using inputOCR = New OcrInput("test.jpg")
	inputOCR.FindTextRegion()
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

Après avoir exécuté le code, vous verrez qu'il extrait le texte de la zone de texte à l'aide d'un processus d'apprentissage automatique. Le résultat s'affiche dans la console avec une précision de reconnaissance de texte de près de 100 %. La précision d'IronOCR est proche de 100 % pour toute forme de texte, qu'il soit imprimé ou manuscrit.

OCR avec vision par ordinateur(Exemple de tutoriel), Figure 2 : Les résultats de la Console après le processus d'extraction de texte

Les résultats de la Console issus du processus d'extraction de texte

Méthode FindMultipleTextRegions

LesFindMultipleTextRegions (Trouver des régions de texte multiples) est similaire à la méthode FindTextRegion, mais elle est utilisée lorsqu'il y a plusieurs zones de texte dans une image. Il renvoie une liste d'objets CropRectangle qui définissent l'emplacement de chaque zone de texte. Cette méthode est utile lorsque vous souhaitez extraire du texte d'une image contenant plusieurs sections de texte.

using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr

Private ocr = New IronTesseract()
Using input = New OcrInput("test.jpg")
	input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

L'extrait de code fourni ci-dessus est un exemple d'utilisation de la bibliothèque IronOCR pour effectuer une reconnaissance optique de caractères (OCR) sur un fichier image. Il importe d'abord la bibliothèque IronOCR et crée une nouvelle instance de l'élémentTesseracte de fer classe. Ensuite, il initialise unOcrInput avec le chemin d'accès du fichier image d'entrée et appliquequelques techniques de prétraitement pour la correction d'images en utilisant la méthode FindMultipleTextRegions.

Ensuite, il appelle leLire de l'objet IronTesseract, qui effectue l'OCR sur l'image prétraitée et renvoie un objetOcrResult objet. Le texte extrait de l'objet OcrResult est alors stocké dans une variable de type chaîne et imprimé sur la console.

La sortie de l'IronOCR

Les résultats d'IronOCR sont très précis, même lorsqu'il s'agit d'images complexes comportant plusieurs polices, tailles et styles de texte.

La précision de l'OCR est cruciale lors de l'extraction de données à partir d'images, car le texte extrait est souvent utilisé pour un traitement ultérieur, tel que l'analyse de données, la saisie manuelle de données, l'apprentissage automatique ou le traitement du langage naturel. Si le texte extrait contient des erreurs, il peut causer des problèmes en aval. En outre, IronOCR permet d'enquêter sur les objets de résultat pourvérifier les niveaux de confiance.

Cas d'utilisation de la vision par ordinateur de l'OCR

Reconnaissance optique de caractères(OCR) a révolutionné le traitement des textes imprimés et manuscrits. Les outils d'OCR sont devenus un élément indispensable du traitement des documents et de l'extraction des données. Voici quelques cas d'utilisation des logiciels de reconnaissance optique de caractères :

OCR Reconnaissance des plaques d'immatriculation

Reconnaissance des plaques d'immatriculation joue un rôle important dans l'automatisation de la gestion du trafic, des systèmes de stationnement et des activités de maintien de l'ordre. En mettant en œuvre la vision artificielle OCR en C#, les développeurs peuvent créer des applications qui identifient rapidement et avec précision les plaques d'immatriculation à partir d'images ou de flux vidéo en direct. Cette technologie peut être utilisée pour :

  • Contrôler les infractions au code de la route et identifier les véhicules impliqués dans des activités criminelles.
  • Automatiser les systèmes de stationnement, en facilitant la gestion des entrées et des sorties et en rationalisant le processus de facturation.
  • Renforcer les mesures de sécurité en suivant et en contrôlant les mouvements des véhicules dans les zones d'accès restreint.

Extraction de texte à partir de factures

La vision par ordinateur de l'OCR en C# peut être utilisée pour développer des applications d'OCR qui automatisent le processus de traitement de l'imageextraction de texte à partir de factures et d'autres documents financiers. Ce processus permet de réduire considérablement les erreurs de saisie manuelle des données et de rationaliser les tâches comptables. Les principaux avantages sont les suivants :

  • Augmentation de la productivité grâce à l'automatisation du processus de saisie des données.
  • Précision accrue, car l'OCR réduit la probabilité d'erreurs humaines.
  • Intégration transparente avec les logiciels et systèmes comptables pour une gestion efficace des données.

Génération de sous-titres OCR

La création de sous-titres pour les vidéos peut prendre du temps et nécessiter beaucoup de travail. La vision par ordinateur de l'OCR en C# peut simplifier ce processus en permettant d'obtenir automatiquementdétection et transcription du texte à l'écranpermettant aux développeurs de :

  • Créez des sous-titres précis pour les films, les émissions de télévision et les vidéos en ligne.
  • Améliorer l'accessibilité pour les personnes souffrant de déficiences auditives ou parlant des langues différentes.
  • Stimuler les efforts de référencement en fournissant un contenu indexable pour la plateforme vidéo

Traitement OCR des PDF

Les PDF sont largement utilisés pour le partage et le stockage de documents, mais l'extraction de texte à partir de ces documents peut s'avérer difficile. La vision par ordinateur de l'OCR en C# peut aider les développeurs à créer des applications d'OCR qui traitent sans effort des fichiers PDF et desextraire leur contenu, facilitant :

Numérisation de textes imprimés

Les logiciels d'OCR sont largement utilisés pournumériser du texte imprimé à partir d'images de documents. Les outils OCR permettent d'extraire du texte à partir de documents numériques scannés,PDFsetdes images dans différents formats. C'est particulièrement utile pour la gestion des documents, où vous pouvez facilement rechercher, stocker et partager des documents textuels.

Extraction de texte manuscrit

La technologie de l'OCR a progressé à un point tel qu'elle peutreconnaître un texte manuscrit avec une grande précision. Ceci est particulièrement utile dans des domaines tels que les soins de santé, où les dossiers médicaux contiennent souvent des notes manuscrites. Les outils d'OCR permettent d'extraire le texte manuscrit des dossiers médicaux, des étiquettes d'ordonnance et d'autres documents manuscrits.

Extraction des données

La technologie OCR est largement utilisée pour extraire des données à partir de données d'entrée telles que des factures, des reçus et des formulaires. Les modèles OCR peuvent reconnaître et extraire des champs de données clés tels que les noms, les adresses, les dates et les montants. Cela élimine la nécessité d'une saisie manuelle des données et réduit les erreurs dans le traitement des données.

Recherche d'images

La technologie OCR est également utilisée pour la recherche d'images, où vous pouvez rechercher des images sur la base du texte qu'elles contiennent. Cette fonction est particulièrement utile pour les grandes bibliothèques d'images, où la recherche manuelle prendrait beaucoup de temps.

Traduction

Le logiciel OCR peut être utilisé pour extraire le texte de documents dans une langue et le traduire dans une autre langue. Ceci est particulièrement utile pour les entreprises internationales, où les documents doivent être traduits rapidement et avec précision.

Résumé

Reconnaissance optique des caractères(OCR) est une technologie qui permet aux ordinateurs de lire du texte à partir d'images. L'OCR et la vision par ordinateur sont importantes car elles permettent aux machines de comprendre et d'interpréter le monde visuel, ce qui est essentiel pour des applications telles que les voitures autonomes, la robotique et le traitement automatisé des documents.

IronOCR est un puissant moteur d'OCR qui peut être utilisé pour appliquer l'OCR avec la vision par ordinateur afin de reconnaître avec précision le texte et d'effectuer l'extraction de texte à partir d'images. Il fournit une série de méthodes pour trouver et extraire des régions de texte, notamment FindTextRegion, FindMultipleTextRegions, et GetTextRegions. Chaque méthode possède son propre ensemble de paramètres qui peuvent être utilisés pouraffiner le processus d'OCR et offrent une grande précision d'OCR.

En utilisant IronOCR, vous pouvez extraire le texte scanné des images d'entrée rapidement et avec précision en utilisantconcurrence etconfiguration personnaliséequi vous permet d'économiser du temps et des efforts lorsque vous traitez de grands volumes de données d'image. Que vous travailliez avec des documents numérisés, des photographies ou des captures d'écran, IronOCR peut vous aider à déverrouiller le texte qu'ils contiennent.

IronOCR offreun essai gratuit aux utilisateurs qui souhaitent tester le logiciel avant de prendre une décision d'achat. Leslicence pour IronOCR commence à partir de $749 et inclut le support et les mises à jour pendant un an. Avec ses fonctionnalités robustes et son prix raisonnable, IronOCR est une excellente option pour tous ceux qui recherchent une solution d'OCR fiable avec une grande précision d'OCR.

< PRÉCÉDENT
Extraction de données de reçus OCR (tutoriel étape par étape)
SUIVANT >
Comment OCR le permis de conduire en C#