VIDéOS

Comment utiliser les Language Packs de l'OCR dans IronOCR

Kannaopat Udonpant
Kannapat Udonpant
décembre 10, 2023
Partager:


Dans ce tutoriel, vous apprendrez à extraire du texte à partir de documents PDF multilingues en utilisant IronOCR en C#. La vidéo guide l'installation de IronOCR et des packs de langues supplémentaires, spécifiquement l'anglais et le japonais. Vous allez apprendre à configurer le moteur OCR pour prendre en charge plusieurs langues et l'appliquer à un échantillon de PDF qui comprend à la fois du texte en anglais et en japonais. Le tutoriel montre comment initialiser le moteur OCR, définir le fichier d'entrée et extraire le texte en utilisant la méthode Read. Le contenu extrait est ensuite enregistré dans un fichier .txt, avec une gestion des erreurs en place pour les opérations échouées. C'est un excellent exemple de la manière dont IronOCR prend en charge le traitement global des documents en reconnaissant plusieurs langues lors d'une seule numérisation. Que vous traitiez des formulaires multilingues, des documents internationaux ou des PDF de sources mondiales, ce guide montre à quel point il est facile d'obtenir des résultats OCR précis et adaptés à la langue en C#.

Lecture complémentaire : Packs de langues OCR supplémentaires

BIBLIOTHÈQUE_COMMENCER_AVEC_UNE_EXTENSION_D'ESSAI_DU_PRODUIT_BLOC

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Tout en poursuivant ses études, Kannapat est également devenu membre du Vehicle Robotics Laboratory, qui fait partie du Department of Bioproduction Engineering (département d'ingénierie de la bioproduction). En 2022, il a mis à profit ses compétences en C# pour rejoindre l'équipe d'ingénieurs d'Iron Software, où il se concentre sur IronPDF. Kannapat apprécie son travail car il apprend directement auprès du développeur qui écrit la majeure partie du code utilisé dans IronPDF. Outre l'apprentissage par les pairs, Kannapat apprécie l'aspect social du travail chez Iron Software. Lorsqu'il n'écrit pas de code ou de documentation, Kannapat peut généralement être trouvé en train de jouer sur sa PS5 ou de revoir The Last of Us.
< PRÉCÉDENT
Pourquoi IronOCR est meilleur que le package Nuget Tesseract 4
SUIVANT >
Comment utiliser plusieurs langues avec Tesseract ?