OUTILS OCR

OCR dans Windows 10 (Outils gratuits en ligne)

Publié octobre 30, 2022
Partager:

Reconnaissance optique de caractères (OCR) est le processus de conversion d'une image ou d'un texte dans un format lisible par une machine. Lorsqu'une image ou un document est scanné dans un ordinateur, il est enregistré en tant que fichier image. Les éditeurs de texte ne peuvent donc pas modifier, rechercher ou compter les mots dans le fichier image. L'OCR permet aux systèmes d'extraire le texte d'une image, le contenu étant ensuite stocké sous forme de données textuelles modifiables.

La plupart des flux de travail des entreprises impliquent la communication d'informations à l'aide de supports imprimés. La numérisation de documents et d'images peut poser des problèmes. La technologie OCR résout ce problème en convertissant les images de texte en données textuelles qui peuvent ensuite être analysées par d'autres logiciels d'entreprise. Ces données peuvent être utilisées pour effectuer des analyses, rationaliser les opérations, automatiser les processus et améliorer la productivité.

Cet article présente quelques programmes OCR gratuits qui peuvent aider les utilisateurs à gérer efficacement leurs fichiers.

Microsoft OneNote : Le meilleur logiciel OCR gratuit

OneNote est une application de prise de notes numérique qui offre un endroit unique pour conserver toutes vos notes, recherches, plans et informations. OneNote prend en charge la Reconnaissance optique des caractères (OCR)un outil qui vous permet d'extraire du texte d'une image ou d'un fichier imprimé (Document PDF ou fichier Word) et le coller dans vos notes, afin que vous puissiez modifier les mots. C'est un excellent moyen de copier dans OneNote des informations provenant d'une carte de visite que vous avez scannée. Après avoir extrait le texte, vous pouvez le coller ailleurs dans OneNote ou dans un autre programme, tel que Outlook ou Word. Vous pouvez télécharger la dernière version à partir du magasin Microsoft, et elle est souvent déjà installée sur les systèmes Windows. C'est l'un des meilleurs logiciels OCR gratuits pour la reconnaissance de texte.

OCR dans Windows 10, Figure 1 : OneNote OCR

Extraction de texte à partir d'une seule image

  1. Cliquez avec le bouton droit de la souris sur l'image et cliquez sur Copier le texte de l'image.

  2. Cliquez à l'endroit où vous souhaitez coller le texte copié, puis appuyez sur Ctrl+V.

Extraction de texte à partir des images d'un fichier imprimé sur plusieurs pages

  1. Cliquez avec le bouton droit de la souris sur l'un des fichiers image, puis effectuez l'une des opérations suivantes :

    • Cliquez sur Copier le texte de cette page de l'impression pour copier le texte de l'image sélectionnée (page).

    • Cliquez sur Copier le texte de toutes les pages de l'impression pour copier le texte de toutes les images (pages).
  2. Cliquez à l'endroit où vous souhaitez coller le texte copié, puis appuyez sur Ctrl+V.

Outils d'OCR en ligne

Nous venons de voir comment extraire du texte de fichiers images à l'aide de la technologie OCR en utilisant Microsoft OneNote sur une machine locale. Voyons maintenant les logiciels d'OCR actuellement disponibles en ligne.

OnlineOCR

OnlineOCR est un service professionnel d'OCR en ligne au design simple et épuré. L'apparence de ce site web peut sembler un peu vieillotte puisqu'il a été créé en 2009, mais cela permet de garder les opérations d'OCR assez simples pour les utilisateurs.

OnlineOCR vous permet de reconnaître des documents PDF numérisés, des photographies et des images capturées par un appareil photo numérique, et de les convertir en fichiers modifiables tels que Word, TXT et Excel. Il est possible de reconnaître 46 langues différentes, dont l'anglais, l'espagnol, le japonais, le chinois et le coréen.

OCR dans Windows 10, Figure 2 : OnlineOCR

Trois étapes suffisent pour réaliser un travail d'OCR avec OnlineOCR.

Étape 1. Cliquez sur le bouton "Sélectionner un fichier" pour télécharger un fichier PDF ou un document numérisé au format JPG, BMP, GIF ou TIFF. Vous pouvez également télécharger plusieurs fichiers en une seule fois. Remarque : la taille maximale des fichiers que vous pouvez télécharger est de 15 Mo.

**Sélectionnez la langue du fichier que vous téléchargez et choisissez un format de sortie parmi Word, Excel et TXT.

**Cliquez sur "Convert" pour commencer à reconnaître et à convertir vos fichiers.

NouveauOCR

Un autre outil d'OCR en ligne gratuit est NouveauOCRqui peut analyser le texte d'un fichier image ou d'un document PDF que vous téléchargez, puis le convertir en un document texte qui peut être édité facilement sur votre ordinateur. Chaque utilisateur peut bénéficier d'un nombre illimité de téléchargements sans aucune obligation d'enregistrement. Tous les fichiers que vous téléchargez seront supprimés du serveur, il n'y a donc pas lieu de s'inquiéter de la sécurité des fichiers.

OCR dans Windows 10, Figure 3 : NewOCR

Tout d'abord, cliquez sur "Choisir un fichier" pour ajouter une image ou des documents numérisés à partir de votre appareil, puis cliquez sur "Aperçu".

Ensuite, choisissez une ou plusieurs langues de reconnaissance dans la case langue, puis faites pivoter l'image si nécessaire. Si votre fichier téléchargé contient du texte en plusieurs colonnes, cochez l'onglet "Analyse de la mise en page" pour diviser le texte en colonnes. Enfin, cliquez sur le bouton "OCR".

OCR dans Windows 10, Figure 4 : NewOCR

Le texte reconnu s'affiche dans la zone de texte ci-dessous. Vous pouvez télécharger le texte au format TXT, Word ou PDF.

OCR dans Windows 10, Figure 5 : NewOCR

Convertio

Convertio est un service d'OCR en ligne gratuit au design moderne et attrayant. Les utilisateurs gratuits et non enregistrés peuvent traiter un maximum de 10 pages. Il peut s'agir de fichiers PDF ou Word. Vous pouvez également utiliser un fichier PDF scanné. Si vous avez besoin de reconnaître plus de pages, il vous suffit de vous inscrire pour obtenir un service amélioré.

Pour effectuer l'OCR en ligne avec Convertio, il suffit de suivre les trois étapes suivantes.

**Étape 1 : Cliquez sur "Choisir des fichiers" pour choisir et télécharger des fichiers depuis votre appareil local, Google Drive, Dropbox ou des pages Web. Vous pouvez également ajouter des fichiers en les faisant glisser sur la page.

OCR dans Windows 10, Figure 6 : Convertio

Convertio

Étape 2. Choisissez une ou deux langues utilisées dans votre fichier téléchargé. Définissez ensuite le format de sortie : document Word, classeur Excel, document PDF, fichier texte ou tout autre format souhaité. Vous pouvez choisir de reconnaître toutes les pages ou seulement certaines d'entre elles en saisissant une plage de pages dans le champ "Numéro de page".

OCR in Windows 10, Figure 7: Paramètres OCR de Convertio

Paramètres OCR de Convertio

**Lorsque la reconnaissance et la conversion sont terminées, un lien de téléchargement pour le texte extrait dans un document converti apparaît en haut. Il vous suffit de l'enregistrer à l'endroit de votre choix.

OCR dans Windows 10, Figure 8 : Convertio télécharge des fichiers

Téléchargement de fichiers à partir de Convertio

Convertio offre le plus grand nombre d'options en tant que service d'OCR en ligne et est donc le meilleur logiciel d'OCR en ligne gratuit.

IronOCR

IronOCR est une bibliothèque de technologie OCR populaire pour les développeurs .NET qui ont besoin d'extraire du texte à partir de documents scannés ou de fichiers PDF. Il offre une grande précision, un traitement rapide et de solides performances en temps réel pour l'imagerie, la numérisation et la reconnaissance. La bibliothèque est un composant logiciel qui simplifie la numérisation des documents en automatisant le balayage des documents. Il prend également en charge d'autres processus, notamment l'indexation des documents et le traitement des images.

IronOCR est unique dans sa capacité à détecter et à extraire automatiquement des données à partir d'images et de documents scannés de manière imparfaite. La classe "IronTesseract" fournit la version la plus avancée de Tesseract connue dans le monde entier et sur n'importe quelle plate-forme, avec une vitesse et une précision accrues.

Examinons un exemple de code permettant d'extraire du texte d'un fichier image scanné.

var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Input.AddImage("test-files/redacted-employmentapp.png") var Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

Image d'entrée pour extraire le texte

OCR in Windows 10, Figure 9: IronOCR, Données sur les employés expurgées

Données sur les employés expurgées

Texte extrait

Le résultat est propre et correspond à l'image originale en quelques lignes de code, ce qui se traduit par un résultat parfait et aucun problème technique.

OCR dans Windows 10, Figure 10 : IronOCR, Sortie d'image

Sortie d'image

Licences

IronOCR est entièrement gratuit à des fins de développement. Il dispose également d'une structure tarifaire distincte pour licences commerciales. L'offre Lite commence à $749 sans frais cachés. Les utilisateurs peuvent tester IronOCR en production avant de l'acheter grâce à la version d'essai gratuite. Choisissez une formule adaptée à la taille de votre entreprise en optant pour une licence pour un développeur, dix développeurs ou un nombre illimité de développeurs.

Iron Software propose l'ensemble de sa gamme de produits à un prix avantageux forte réduction. Plus d'informations sur cette page

< PRÉCÉDENT
Meilleure OCR pour le chinois (outils gratuits et en ligne)
SUIVANT >
Comparaison des logiciels d'OCR pour entreprises