Passer au contenu du pied de page
OUTILS OCR

Automatisation de l'OCR avec Power Automate (Tutoriel pour développeurs)

La reconnaissance optique de caractères (OCR) est la technologie qui numérise le texte à partir d'images, de documents numérisés et de fichiers PDF pour le transformer en texte lisible par machine. La reconnaissance optique de caractères (OCR) permet aux ordinateurs d'identifier différents formats (livres, reçus, formulaires et photographies) qui peuvent être numérisés et automatisés pour l'extraction de données PDF. Il analyse les caractères d'une image et leurs motifs, puis les met en correspondance avec du texte. Cette technologie de reconnaissance optique de caractères est utilisée dans des applications de numérisation de documents, d'extraction et de saisie automatisées de données PDF, de traitement des factures et de mise à disposition de fichiers PDF numérisés pour la recherche.

Les systèmes de reconnaissance optique de caractères (OCR) se sont considérablement améliorés et peuvent désormais reconnaître et lire différentes langues, dont la mise en page est aujourd'hui complexe, notamment en ce qui concerne les tableaux et les colonnes. Les logiciels de reconnaissance optique de caractères (OCR) avancés utilisent également des techniques de prétraitement des images. Ces améliorations comprennent la suppression du bruit et le réglage du contraste, ce qui améliore la précision des logiciels OCR dans la lecture d'images de faible qualité. Parmi les outils OCR les plus populaires, on trouve le moteur Tesseract OCR, Power Automate et IronOCR, qui offrent une précision et une flexibilité élevées. Les logiciels de reconnaissance optique de caractères (OCR) sont devenus des outils indispensables pour les entreprises, les chercheurs et les développeurs qui souhaitent externaliser la gestion de la documentation et la reconnaissance de texte.

Qu'est-ce que Microsoft Power Automate OCR ?

Reconnaissance optique de caractères par Microsoft Power Automate : grâce à cette fonctionnalité, les entreprises peuvent automatiser l'extraction de texte à partir d'images, de documents numérisés et de fichiers PDF vers des formats facilement modifiables et lisibles par machine. Faisant partie de la plateforme Microsoft Power Platform, Power Automate, en version bureau et en ligne, offre à l'utilisateur la possibilité de créer des flux sans nécessairement avoir besoin de compétences en programmation. Grâce à l'intégration de la reconnaissance optique de caractères (OCR) dans les flux de travail, ils peuvent automatiser la saisie fastidieuse de données, traiter les factures et numériser les documents.

Cela permet de gagner du temps et de minimiser les erreurs. Il s'agit en effet d'un outil de recherche puissant capable de prendre en charge de nombreux formats et langues différents dans la fonction OCR de Power Automate. Conçu à l'aide d'AI Builder, il prend en charge l'utilisation de la reconnaissance de texte dans de nombreux secteurs d'activité. Il s'intègre parfaitement aux autres services Microsoft, notamment Excel, SharePoint et OneDrive, permettant une automatisation de bout en bout, de la numérisation du document à son stockage, voire à son partage. Cela permet aux organisations d'accroître leur efficacité, de rationaliser la gestion des documents et d'améliorer la précision opérationnelle de leurs activités.

Avantages de la mise en œuvre de la reconnaissance optique de caractères (OCR) dans Power Automate

L'implémentation de la reconnaissance optique de caractères (OCR) dans Power Automate présente les avantages suivants :

Gain de temps et de main-d'œuvre : L'automatisation de l'extraction de texte des documents permet d'économiser un temps et des efforts considérables qui seraient autrement consacrés à la saisie manuelle des données.

Rentable : convivial et accessible, éliminant ainsi le besoin de solutions logicielles personnalisées coûteuses.

Intégration : Microsoft Power Automate offre une intégration transparente avec d'autres services Microsoft 365 tels que SharePoint, OneDrive et même Excel.

Évolutivité : Il peut traiter des milliers de documents simultanément, ce qui le rend adapté aux grandes entreprises.

Réduction des erreurs : L'automatisation des processus de saisie de données minimise les risques d'erreur humaine.

Comment utiliser la reconnaissance optique de caractères (OCR) dans Power Automate

Power Automate prend en charge la reconnaissance optique de caractères (OCR) via plusieurs connexions, notamment AI Builder et OneDrive. Voici un guide étape par étape pour créer un flux de travail compatible avec l'OCR à l'aide de Power Automate en ligne ou sur ordinateur :

1. Configurer Power Automate

Pour commencer, connectez-vous à votre compte Power Automate ou créez-en un si vous n'en avez pas. Power Automate fait partie de Microsoft 365, ce qui signifie que vous y avez déjà accès si vous utilisez Office 365 ou Dynamics 365.

2. Créer un nouveau flux

Ouvrez l'onglet Créer, puis cliquez sur Flux instantané pour créer un flux déclenché manuellement.

Nommez votre flux. Par exemple, nommez-le " Avant approbation " et sélectionnez le déclencheur suivant : Lorsqu'un fichier est créé dans un dossier (SharePoint ou OneDrive) ou Déclencher manuellement un flux.

Un nouveau flux d'automatisation de l'alimentation est créé, similaire à celui présenté ci-dessous.

Power Automate OCR (Tutoriel développeur) : Figure 5 - Nouveau flux d'automatisation

3. Téléversez un fichier sur OneDrive ou SharePoint

Ajoutez une action pour télécharger votre document (image ou PDF) sur OneDrive Entreprise ou SharePoint. Cette action déclenchera le processus OCR pour extraire les données. Pour cette démonstration, nous utilisons une bibliothèque de documents SharePoint.

Power Automate OCR (Tutoriel pour développeurs) : Figure 6 - Téléchargement de fichier

4. Utilisez la fonction OCR du générateur d'IA

Utilisez AI Builder pour développer l'action " Extraire le texte des images ". AI Builder est une fonctionnalité profondément intégrée de l'apprentissage automatique dans Power Automate et dispose de modèles OCR pré-entraînés qui permettent aux utilisateurs d'identifier facilement le texte à partir d'images ou de PDF.

Power Automate OCR (Tutoriel pour développeurs) : Figure 7 - Générateur d'IA

Sélectionnez le fichier image à partir duquel extraire le texte.

! Power Automate OCR (Tutoriel pour développeurs) : Figure 8 - Sélectionner une image

5. Traitement des données extraites

Une fois le texte extrait par OCR, il peut être traité ultérieurement. Par exemple :

Enregistrez le texte extrait au format Excel : utilisez l'action " Ajouter une ligne " pour insérer le texte extrait dans un fichier Excel.

Transmettre le texte par e-mail : Utilisez l'action " Envoyer un e-mail " pour transmettre le texte extrait aux destinataires spécifiés.

Stockage dans une base de données : utilisez des connecteurs pour transférer les données vers SQL Server, des listes SharePoint ou d'autres bases de données pour le stockage.

Qu'est-ce qu'IronOCR ?

IronOCR est une puissante bibliothèque OCR .NET qui vous permet d'extraire du texte avec précision à partir d'images, de PDF et de numérisations grâce à la reconnaissance optique de caractères (OCR). Elle excelle là où d'autres bibliothèques peuvent avoir des difficultés avec la reconnaissance de texte en raison d'une mauvaise qualité d'image ou d'images bruitées, et prend en charge plus de 125 langues, ce qui la rend parfaite pour les cas d'utilisation multilingues. IronOCR inclut des fonctionnalités avancées telles que la détection automatique de la langue, le prétraitement des images, la suppression du bruit, la correction de l'inclinaison et la conversion des documents en PDF consultables tout en préservant la mise en page originale.

! Power Automate OCR (Tutoriel pour développeurs) : Figure 9 - IronOCR

Ce produit s'intègre facilement grâce à des API .NET simples, permettant aux développeurs d'implémenter la reconnaissance optique de caractères (OCR) dans leurs applications. La bibliothèque est particulièrement utile pour la numérisation de documents, l'automatisation des flux de travail de saisie de données et l'extraction de texte, offrant une précision et une évolutivité élevées pour les applications d'entreprise. Sa facilité d'utilisation et ses puissantes capacités de reconnaissance optique de caractères sont ses points forts.

Caractéristiques d'IronOCR

  • Précision d'extraction de texte exceptionnelle, même à partir d'images basse résolution et de documents numérisés bruités.
  • Prend en charge plus de 125 langues, avec détection automatique de la langue pour une utilisation dans des environnements linguistiques variés.
  • Offre des outils de prétraitement d'image, tels que la réduction du bruit, la correction de la distorsion, l'amélioration du contraste et l'accentuation, afin d'améliorer les performances sur les images imparfaites.
  • Crée des PDF consultables en texte intégral, convertissant les documents ou images numérisés en PDF entièrement consultables avec la mise en page d'origine.
  • Préserve la mise en page et le formatage, en conservant la structure, les polices et le formatage des documents sources, ce qui est essentiel pour les documents complexes comportant des tableaux et des colonnes.
  • Traitement par lots : permet le traitement par lots de plusieurs images ou documents en une seule opération, prenant en charge la gestion de volumes importants de documents.
  • Intégration facile avec .NET : Prend en charge une API simple pour une intégration facile avec les applications .NET, permettant aux développeurs de mettre en œuvre la reconnaissance optique de caractères (OCR) sans effort significatif.

Exemple de code pour effectuer une reconnaissance optique de caractères (OCR)

using IronOcr;

class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine
        var Ocr = new IronTesseract();

        // Set language
        Ocr.Language = OcrLanguage.English;

        // Path to the image file
        var inputFile = @"path\to\your\image.png";

        // Read the image and perform OCR
        using (var Input = new OcrInput(inputFile))
        {
            // Perform OCR
            var Result = Ocr.Read(Input);

            // Display the extracted text in the console
            Console.WriteLine("Extracted Text:");
            Console.WriteLine(Result.Text);
        }
    }
}
using IronOcr;

class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine
        var Ocr = new IronTesseract();

        // Set language
        Ocr.Language = OcrLanguage.English;

        // Path to the image file
        var inputFile = @"path\to\your\image.png";

        // Read the image and perform OCR
        using (var Input = new OcrInput(inputFile))
        {
            // Perform OCR
            var Result = Ocr.Read(Input);

            // Display the extracted text in the console
            Console.WriteLine("Extracted Text:");
            Console.WriteLine(Result.Text);
        }
    }
}
Imports IronOcr

Friend Class Program
	Shared Sub Main(ByVal args() As String)
		' Initialize Iron Tesseract OCR engine
		Dim Ocr = New IronTesseract()

		' Set language
		Ocr.Language = OcrLanguage.English

		' Path to the image file
		Dim inputFile = "path\to\your\image.png"

		' Read the image and perform OCR
		Using Input = New OcrInput(inputFile)
			' Perform OCR
			Dim Result = Ocr.Read(Input)

			' Display the extracted text in the console
			Console.WriteLine("Extracted Text:")
			Console.WriteLine(Result.Text)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Conclusion

Bien qu'IronOCR et Power Automate OCR soient tous deux très performants pour la reconnaissance de texte, IronOCR est considérablement plus robuste et polyvalent dans sa solution pour tout développeur ou entreprise ayant besoin de capacités OCR sérieuses au-delà des cas simples pris en charge par Power Automate OCR. Le moteur OCR de Power Automate est conçu pour les flux de travail simples et peut nécessiter un abonnement supplémentaire.

À l'inverse, IronOCR se distingue par sa capacité à fournir des résultats de haute qualité, même avec des images d'entrée de faible qualité. Il prend en charge plus de 125 langues avec une mise en forme et une disposition bien préservées. Ses capacités de traitement de documents complexes et d'opérations par lots importantes sont parfaitement prises en charge par des options avancées de prétraitement d'images. Il est hautement personnalisable dans les applications .NET.

Power Automate OCR est suffisant pour une automatisation mineure ou des intégrations strictement au sein de l'écosystème Microsoft, tandis qu'IronOCR excelle avec une précision et un contrôle maximum, prenant en charge des fonctionnalités telles que la création de PDF consultables qui prennent en charge plusieurs formats.

Pour les organisations recherchant une solution OCR critique en puissance et personnalisable sans contraintes de plateforme, IronOCR est recommandé. Iron Software propose diverses options de bibliothèques pour les développeurs. Consultez la page de la suite de bibliothèques pour plus de détails.

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Pendant qu'il poursuivait son diplôme, Kannapat est également devenu membre du laboratoire de robotique de véhicules, qui fait partie du département de bioproduction. En 2022, il a utilisé ses compé...
Lire la suite