VIDéOS

Comment extraire du texte d'une image en C#

Kannaopat Udonpant
Kannapat Udonpant
mars 27, 2022
Partager:


Dans ce tutoriel, nous explorons le processus d'utilisation de Iron OCR, une bibliothèque gratuite pour la reconnaissance optique de caractères (OCR), afin d'extraire du texte à partir de fichiers image. Le tutoriel commence par l'installation de Iron OCR via le gestionnaire de packages NuGet et continue en guidant les utilisateurs à travers l'écriture d'un programme en C#. Les étapes clés incluent l'ajout de l'espace de noms Iron OCR, l'initialisation de la classe IronTesseract, et le passage du chemin du fichier image en entrée OCR. Le tutoriel démontre la précision d'Iron OCR dans la lecture d'images de texte à la fois simples et complexes, y compris celles comportant de grands blocs de texte et dans des conditions moins qu'idéales telles que des pages froissées, tournées ou inclinées. Le tutoriel met en avant la capacité de la bibliothèque à gérer divers formats d'images, en fournissant des instructions détaillées sur l'enregistrement de la sortie en tant que fichier texte ou PDF. L'efficacité d'IronOCR est mise en avant, démontrant sa capacité à lire et générer des sorties de texte avec précision même à partir d'entrées difficiles. Le tutoriel se termine par une incitation à demander de l'aide si nécessaire, garantissant aux utilisateurs de pouvoir pleinement exploiter les puissantes capacités de Iron OCR.

Lecture supplémentaire : Lire le texte des images avec C# OCR

BIBLIOTHÈQUE_COMMENCER_AVEC_UNE_EXTENSION_D'ESSAI_DU_PRODUIT_BLOC

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Tout en poursuivant ses études, Kannapat est également devenu membre du Vehicle Robotics Laboratory, qui fait partie du Department of Bioproduction Engineering (département d'ingénierie de la bioproduction). En 2022, il a mis à profit ses compétences en C# pour rejoindre l'équipe d'ingénieurs d'Iron Software, où il se concentre sur IronPDF. Kannapat apprécie son travail car il apprend directement auprès du développeur qui écrit la majeure partie du code utilisé dans IronPDF. Outre l'apprentissage par les pairs, Kannapat apprécie l'aspect social du travail chez Iron Software. Lorsqu'il n'écrit pas de code ou de documentation, Kannapat peut généralement être trouvé en train de jouer sur sa PS5 ou de revoir The Last of Us.
< PRÉCÉDENT
Comment personnaliser l'entraînement des polices pour Tesseract 5 en C#
SUIVANT >
Pourquoi IronOCR est meilleur que le package Nuget Tesseract 4