OUTILS OCR

OCR Foto (Tutoriel pour débutants)

Kannaopat Udonpant
Kannapat Udonpant
décembre 12, 2023
Partager:

Introduction

La technologie de reconnaissance optique de caractères (OCR) a révolutionné notre interaction avec le texte dans le monde numérique. Les outils de photo OCR permettent de convertir des images en texte, facilitant ainsi la numérisation des notes imprimées.

Dans cet article, nous explorerons quatre outils d'OCR en ligne - gratuits et payants - et terminerons par une présentation d'IronOCR, qui montre comment l'OCR peut être mis en œuvre de manière programmatique en C#.

1. Google Vision API

Google Vision API offre une solution OCR puissante pour créer un convertisseur d'image en texte fourni par Google. Il prend en charge l'extraction de texte à partir d'images et de fichiers PDF et peut reconnaître du texte dans plusieurs langues.

OCR Photo (Tutoriel Débutant) : Figure 1

Pour

  • Haute précision
  • Soutien linguistique
  • Intégration avec d'autres services Google Cloud.

Cons

  • Nécessite une clé API
  • Pas entièrement gratuit au-delà d'un certain seuil d'utilisation.

Étape 1 Obtenir la clé API

  • Visitez la Google Cloud Console.
  • Créez un nouveau projet ou sélectionnez un projet existant.
  • Activez l'API de Cloud Vision et générez une clé d'API.

Étape 2 Effectuer une demande d'API

  • Utilisez un outil comme cURL ou un langage de programmation de votre choix pour effectuer une requête HTTP POST.
  • Inclure le fichier image ou l'URL dans la charge utile de la demande.
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"

Étape 3 Analyse des résultats

  • Extraire le texte reconnu de la réponse de l'API.
{
  "responses": [
    {
      "textAnnotations": [
        {
          "description": "Hello World!",
          "boundingPoly": { /* bounding box coordinates */ }
        }
      ]
    }
  ]
}

2. Tesseract OCR

Tesseract est un moteur OCR open-source développé par Google. Il prend en charge plus de 100 langues et est largement utilisé pour sa précision et sa flexibilité. Il aide à convertir des images de plusieurs formats de fichiers et même à convertir des images numérisées en texte éditable.

OCR Foto (Tutoriel Débutant) : Figure 2

Pour

  • Source ouverte
  • Haute précision
  • Soutien communautaire

Cons

  • L'intégration peut nécessiter des outils supplémentaires
  • Un prétraitement de l'image peut s'avérer nécessaire pour obtenir des résultats optimaux.

Étape 1 Installer Tesseract

  • Téléchargez et installez Tesseract OCR depuis le dépôt officiel sur GitHub.
  • Ajoutez le dossier tesseract à la variable d'environnement Path pour y accéder depuis n'importe quel endroit du terminal.

Étape 2 Exécuter l'OCR sur l'image

  • Ouvrez un terminal et naviguez jusqu'au dossier contenant l'image.
  • Exécutez la commande suivante :
tesseract path/to/your/image.jpg output.txt
tesseract path/to/your/image.jpg output.txt
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'tesseract path/@to/your/image.jpg output.txt
$vbLabelText   $csharpLabel

Étape 3 Visualiser les résultats

  • Ouvrez le fichier texte généré (output.txt) pour voir le texte extrait.

3. ABBYY FineReader Online

ABBYY FineReader Online est un service OCR basé sur le cloud qui permet aux utilisateurs de convertir des documents numérisés et des images en formats modifiables.

Cet outil en ligne permet d'utiliser gratuitement un convertisseur de texte basé sur l'OCR pour extraire du texte à partir d'images sans aucun problème.

OCR Foto (Tutoriel Débutant) : Figure 3

Pour

  • Outil convivial d'OCR d'images
  • Prise en charge de différents formats d'entrée
  • Préserve la mise en forme du document

Cons

  • Utilisation gratuite limitée
  • Connexion Internet requise

Étape 1 Visitez ABBYY FineReader Online

  • Allez sur le site ABBYY FineReader Online.
  • Téléchargez la version d'évaluation gratuite pour Windows ou Mac.
  • Installez le logiciel et suivez les étapes indiquées.

Étape 2 Télécharger l'image

  • Cliquez sur le bouton "Choisir un fichier" et téléchargez votre image.

Étape 3 Traitement de l'image

  • Attendez que l'image soit traitée. L'outil extrait automatiquement le texte.

Étape 4 Modifier le texte

  • Enregistrez le texte extrait ou utilisez l'éditeur pour effectuer les corrections nécessaires
  • Sauvegarde aux formats Word, Excel et texte.

4. OCR en ligne

Online OCR est un service OCR en ligne qui prend en charge plusieurs langues pour la conversion d'image en texte en ligne. Les utilisateurs peuvent télécharger des images directement à partir de leur appareil ou fournir des URL.

Pour

  • Interface utilisateur simple
  • Prise en charge de différents formats d'entrée
  • Utilisation gratuite avec des limitations

Cons

  • Fonctionnalités gratuites limitées
  • Dépend de la connectivité internet

Étape 1 Visiter l'OCR en ligne

Allez sur le site web Online OCR.

Étape 2 Télécharger l'image

Cliquez sur le bouton "Sélectionner un fichier" et téléchargez votre image.

OCR Foto (Tutoriel Débutant) : Figure 4

Étape 3 Choisir la langue et le format de sortie

Sélectionnez la langue et le format de sortie du texte dans l'image.

OCR Photo (Tutoriel Débutant) : Figure 5

Étape 4 Lancer l'OCR

Cliquez sur le bouton "Convertir" pour lancer le processus d'OCR.

Étape 5 Téléchargement du texte

Une fois le processus terminé, téléchargez le texte extrait à partir du lien fourni.

OCR Foto (Tutoriel Débutant) : Figure 6

Introduction à IronOCR dans C&num ;

Nous allons maintenant nous pencher sur IronOCR, une puissante bibliothèque OCR pour C# qui fournit aux développeurs les outils nécessaires à la mise en œuvre d'une fonctionnalité OCR en toute transparence. IronOCR est une bibliothèque OCR pour C# développée par l'équipe d'Iron Software.

IronOCR se distingue comme une bibliothèque de reconnaissance optique de caractères (OCR) robuste conçue spécifiquement pour les développeurs C#, offrant une suite de fonctionnalités puissantes pour une extraction de texte précise et fluide à partir d'images.

Reconnu pour sa fiabilité et son efficacité, IronOCR a gagné en popularité auprès des développeurs C# à la recherche d'une solution complète pour l'extraction de texte à partir d'images et de documents.

En mettant l'accent sur la précision et la polyvalence, IronOCR est devenu un choix incontournable pour des projets allant des systèmes de gestion de documents aux applications d'extraction de données.

S'appuyant sur des algorithmes d'OCR avancés, IronOCR excelle dans le déchiffrage précis de texte à partir de divers formats d'image, notamment JPEG, PNG et TIFF. Sa polyvalence s'étend à la prise en charge de plusieurs langues, ce qui en fait un outil précieux pour les applications qui répondent à des besoins linguistiques divers.

Cette bibliothèque s'intègre de manière transparente aux Framework .NET les plus répandus, ce qui simplifie la mise en œuvre de la fonctionnalité OCR dans les applications C#.

Que vous travailliez avec des documents ou des images numérisés, les fonctionnalités complètes d'IronOCR permettent aux développeurs d'incorporer sans effort des fonctions d'OCR dans leurs projets.

Les caractéristiques de l'IronOCR en détail

  1. Algorithmes OCR avancés : IronOCR utilise des algorithmes OCR sophistiqués qui vont au-delà de la simple reconnaissance de caractères, garantissant une haute précision même dans des scénarios complexes.

  2. Support de Format d'Image : Les développeurs peuvent profiter de la prise en charge par IronOCR d'une variété de formats d'image, tels que JPEG, PNG et TIFF, offrant une flexibilité dans la gestion de contenus visuels divers.

  3. Prise en charge multi-langues : Reconnaissant la nature globale des applications, IronOCR est équipé d'une prise en charge multi-langues, permettant l'extraction de texte dans différentes langues avec précision.

  4. Extraction de texte PDF : En plus des images, IronOCR étend ses capacités pour extraire du texte de documents PDF, améliorant ainsi son applicabilité dans des scénarios où les documents sont stockés sous des formats numériques.

  5. Intégration avec les frameworks .NET : IronOCR s'intègre parfaitement avec les frameworks .NET populaires, permettant aux développeurs C# d'incorporer facilement la fonctionnalité OCR dans leurs projets sans les tracas d'une configuration complexe.

Mise en œuvre de l'OCR avec IronOCR dans C&num ;

Voici un exemple simple d'utilisation de IronOCR en C# pour extraire du texte d'une image :

using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
Imports IronOcr
Private imageText As String = (New IronTesseract()).Read("images\image.png").Text
$vbLabelText   $csharpLabel

Ce simple extrait de code C# montre comment IronOCR peut être utilisé pour lire du texte à partir d'un fichier image. Les développeurs peuvent personnaliser davantage le processus d'OCR en fonction de leurs besoins spécifiques.

Pour des informations détaillées sur la fonctionnalité avancée d'IronOCR, veuillez visiter la page de documentation.

Conclusion

Les outils de reconnaissance optique de caractères jouent un rôle essentiel dans la numérisation du contenu textuel des images. Alors que divers outils en ligne offrent une certaine commodité, IronOCR fournit aux développeurs une solution puissante et flexible pour intégrer des fonctionnalités OCR dans leurs applications C#.

Le choix entre les outils en ligne et les bibliothèques programmées dépend de facteurs tels que les exigences de précision, les besoins de personnalisation et le niveau de contrôle que les développeurs souhaitent exercer sur le processus d'OCR.

IronOCR propose un essai gratuit requis. Téléchargez le logiciel depuis ici.

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Tout en poursuivant ses études, Kannapat est également devenu membre du Vehicle Robotics Laboratory, qui fait partie du Department of Bioproduction Engineering (département d'ingénierie de la bioproduction). En 2022, il a mis à profit ses compétences en C# pour rejoindre l'équipe d'ingénieurs d'Iron Software, où il se concentre sur IronPDF. Kannapat apprécie son travail car il apprend directement auprès du développeur qui écrit la majeure partie du code utilisé dans IronPDF. Outre l'apprentissage par les pairs, Kannapat apprécie l'aspect social du travail chez Iron Software. Lorsqu'il n'écrit pas de code ou de documentation, Kannapat peut généralement être trouvé en train de jouer sur sa PS5 ou de revoir The Last of Us.
< PRÉCÉDENT
Meilleur logiciel OCR gratuit pour les développeurs
SUIVANT >
Outils de reconnaissance de texte arabe : Améliorer la précision