Comment lire des images d'écriture manuscrite avec IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

La lecture automatique de textes manuscrits à partir d'images est extrêmement difficile car les gens écrivent différemment. Cette incohérence massive fait qu'il est difficile pour l'OCR de capturer les données avec précision. De ce fait, des documents cruciaux tels que les anciens dossiers, les formulaires d'admission des patients et les enquêtes auprès des clients doivent encore être traités manuellement, ce qui entraîne un processus sujet aux erreurs qui compromet l'intégrité des données.

IronOcr résout ce problème et le rationalise en introduisant une méthode spécialisée pour comprendre et numériser de manière fiable les images d'écriture manuscrite.

Dans le guide pratique, nous allons parcourir un tutoriel simple, étape par étape, sur l'utilisation de la bibliothèque IronOcr pour lire vos images d'écriture manuscrite avec précision.

Commencez avec IronOCR

Commencez à utiliser IronOCR dans votre projet aujourd'hui avec un essai gratuit.

Première étape :
green arrow pointer


Pour utiliser cette fonction, vous devez d'abord installer le paquet IronOcr.Extensions.AdvancedScan. Veuillez noter que la méthode ReadHandwriting ne prend actuellement en charge que l'anglais.

Lire des images d'écriture manuscrite

La lecture d'une image d'écriture manuscrite avec IronOCR est simple. Nous commençons par instancier le moteur OCR, puis nous chargeons l'image dans LoadImage, et enfin nous utilisons notre méthode spécialisée, ReadHandwriting, conçue pour lire les images d'écriture manuscrite. Nous imprimons ensuite le texte extrait pour en vérifier l'exactitude et le contenu.

Saisie d'images d'écriture manuscrite

Exemple d'image d'entrée
:path=/static-assets/ocr/content-code-examples/how-to/read-handwritten-image.cs
using IronOcr;

// Instantiate OCR engine
var ocr = new IronTesseract();

// Load handwriting image
var inputHandWriting = new OcrInput();
inputHandWriting.LoadImage("handwritten.png");

// Perform OCR on the handwriting image
OcrHandwritingResult result = ocr.ReadHandwriting(inputHandWriting);

// Output the recognized handwritten text
Console.WriteLine(result.Text);
// Output the confidence score of the OCR result
Console.WriteLine(result.Confidence);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Sortie

Sortie MICR

La méthode ReadHandWriting a obtenu un bon score de confiance de 90,6 %, identifiant correctement la majorité du texte et les idées principales, telles que la phrase d'ouverture, "Mon nom est Erin Fish"

Il s'agit d'un résultat fort car l'entrée est un script manuscrit difficile plutôt qu'un simple texte imprimé. Bien que le moteur ait eu des difficultés avec l'espacement et les lettres connectées, le message principal du paragraphe a été extrait avec succès. Cela montre qu'IronOCR est tout à fait capable de traiter des textes complexes et non standard.

Exemple de lecture-écriture asynchrone

IronOCR prend également en charge une version asynchrone de la méthode ReadHandwriting, ReadHandwritingAsync. Ces outils sont extrêmement utiles lorsqu'il s'agit de code asynchrone qui nécessite de récupérer l'image d'entrée avant d'exécuter l'opération. En utilisant les mêmes données que précédemment, voici un exemple de code démontrant comment utiliser la méthode asynchrone pour obtenir le même résultat :

:path=/static-assets/ocr/content-code-examples/how-to/read-handwritten-image-async.cs
using IronOcr;
using System.Threading.Tasks;

// Instantiate OCR engine
var ocr = new IronTesseract();

// Load handwriting image
var inputHandWriting = new OcrInput();
inputHandWriting.LoadImage("handwritten.png");

// Perform OCR using the async method with 'await'.
// The compiler automatically infers this top-level code block as an 'async Task Main()' method.
OcrHandwritingResult result = await ocr.ReadHandwritingAsync(inputHandWriting);

// Output the recognized handwriting text
Console.WriteLine(result.Text);
// Output the confidence score of the OCR result
Console.WriteLine(result.Confidence);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Vous pouvez également fournir un entier comme deuxième paramètre facultatif, timeoutMs, pour attendre un nombre spécifié de millisecondes avant que l'opération ne soit automatiquement annulée. Par défaut, ce paramètre a une valeur de -1, ce qui signifie qu'il n'y a pas de limite de temps et que l'opération se poursuivra jusqu'à son terme.

Lecture d'images d'écriture manuscrite Défis

Bien qu'IronOcr puisse atteindre un niveau de confiance élevé en conservant la structure et le texte global, l'OCR dans son ensemble a encore du mal avec l'écriture manuscrite, ce qui entraîne des erreurs localisées. Voici quelques-uns des défis les plus courants qui nécessitent une vérification du résultat extrait :

Espacement irrégulier : Lorsqu'il s'agit d'espacement dans les caractères d'imprimerie, la distance entre les lettres est uniforme. Cependant, l'espacement entre les traits et la façon dont les lettres se joignent dans l'écriture manuscrite peuvent varier considérablement. Cette non-uniformité amène le moteur OCR à segmenter incorrectement les caractères, ce qui conduit aux erreurs illustrées ci-dessus, où le mot ununiformed est divisé en caractères individuels (u n u n i f o c m e d) au lieu d'un seul mot.

Variation des traits : Chaque personne a un style d'écriture unique, et même une personne écrit la même lettre de manière légèrement différente à chaque fois. La façon dont les lettres sont reliées entre elles et le motif général varient considérablement. Le moteur doit en effet faire face à la grande variabilité de l'inclinaison, de la pression et de la forme des traits, ce qui rend la correspondance des formes intrinsèquement moins fiable qu'avec des polices normalisées.

Formes de caractères ambiguës : l'écriture manuscrite utilise souvent des traits simplifiés ou précipités, ce qui entraîne des formes de caractères ambiguës. Par exemple, un "e" écrit rapidement peut ressembler à un "c", ou un "l" et un "i" reliés peuvent être mal identifiés.

Par conséquent, lorsque vous utilisez cette méthode, veillez à vérifier que le résultat correspond à l'entrée prévue, en accordant une attention particulière aux mots peu espacés ou mal formés.

[{w:( La méthode ReadHandwriting ne permet d'obtenir qu'une faible précision d'extraction OCR lorsqu'il s'agit d'écritures cursives. @@--BRACKET-FERMETURE--@@

Questions Fréquemment Posées

Qu'est-ce que l'IronOCR et comment est-il utilisé pour la lecture d'images manuscrites ?

IronOCR est une puissante bibliothèque de reconnaissance optique de caractères pour C#. Elle permet de lire des images manuscrites en configurant le moteur OCR, en important des images manuscrites et en utilisant la méthode ReadPhoto pour extraire le texte.

Comment configurer le moteur d'OCR dans IronOcr ?

Pour configurer le moteur d'OCR dans IronOcr, vous devez installer la bibliothèque IronOCR, initialiser le moteur d'OCR et le configurer pour qu'il reconnaisse différents styles d'écriture et formats d'image.

Quelles sont les étapes à suivre pour importer des images manuscrites dans IronOcr ?

Pour importer des images manuscrites dans IronOcr, chargez le fichier image dans l'application à l'aide du chemin de fichier ou du flux approprié, en veillant à ce que l'image soit prétraitée pour une meilleure précision de la reconnaissance.

IronOCR peut-il reconnaître différents styles d'écriture ?

Oui, IronOcr est conçu pour reconnaître différents styles d'écriture. Il utilise des algorithmes avancés pour s'adapter aux différents styles d'écriture et fournir une extraction de texte précise.

Qu'est-ce que la méthode ReadPhoto dans IronOcr ?

La méthode ReadPhoto dans IronOcr est une fonction qui traite les images importées pour extraire le texte du contenu manuscrit à l'aide du moteur OCR.

Est-il possible d'améliorer la précision de la reconnaissance de texte pour les images manuscrites dans IronOCR ?

Oui, vous pouvez améliorer la précision de la reconnaissance de texte en prétraitant les images, en ajustant les paramètres du moteur OCR et en utilisant des images de haute qualité.

IronOCR prend-il en charge plusieurs formats de fichiers d'images pour l'OCR ?

IronOCR prend en charge différents formats de fichiers d'image, notamment JPEG, PNG, BMP et TIFF, ce qui le rend flexible pour répondre à différents besoins en matière d'OCR.

Comment IronOCR gère-t-il les images manuscrites de faible qualité ?

IronOCR comprend des fonctionnalités d'amélioration de l'image et de réduction du bruit, améliorant la reconnaissance du texte même dans les images manuscrites de faible qualité.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Prêt à commencer?
Nuget Téléchargements 5,167,857 | Version: 2025.11 vient de sortir