Passer au contenu du pied de page
OUTILS OCR

OCR dans Windows 10 (Outils en ligne gratuits)

La reconnaissance optique de caractères (OCR) est le processus de conversion d'une image de texte en un format lisible par machine . Lorsqu'une image ou un document est numérisé, il est enregistré sous forme de fichier image. De ce fait, les éditeurs de texte ne peuvent ni le modifier, ni effectuer de recherche, ni compter les mots qu'il contient. La reconnaissance optique de caractères (OCR) permet d'extraire le texte d'une image, ce contenu étant ensuite stocké sous forme de données textuelles modifiables.

La plupart des processus métiers impliquent la communication d'informations au moyen de supports imprimés. La numérisation de documents et d'images peut présenter des difficultés. La technologie OCR résout ce problème en convertissant les images de texte en données textuelles qui peuvent ensuite être analysées par d'autres logiciels d'entreprise. Ces données peuvent être utilisées pour réaliser des analyses, rationaliser les opérations, automatiser les processus et améliorer la productivité.

Cet article présentera quelques logiciels OCR gratuits qui peuvent aider les utilisateurs à gérer efficacement leurs fichiers.

Microsoft OneNote : Le meilleur logiciel OCR gratuit

OneNote est une application de prise de notes numériques qui centralise toutes vos notes, recherches, projets et informations. OneNote prend en charge la reconnaissance optique de caractères (OCR), un outil qui vous permet d'extraire du texte d'une image ou d'un document imprimé (document PDF ou fichier Word) et de le coller dans vos notes, afin de pouvoir modifier le texte. C'est un excellent moyen de faire des choses comme copier des informations à partir d'une carte de visite numérisée dans OneNote. Une fois le texte extrait, vous pouvez le coller ailleurs dans OneNote ou dans un autre programme, comme Outlook ou Word. Vous pouvez télécharger la dernière version depuis le Microsoft Store, et elle est souvent déjà installée sur les systèmes Windows. C'est l'un des meilleurs logiciels OCR gratuits pour la reconnaissance de texte.

OCR in Windows 10, Figure 1: OneNote OCR

Extraction de texte à partir d'une seule image

  1. Faites un clic droit sur l'image, puis cliquez sur Copier le texte de l'image .
  2. Cliquez à l'endroit où vous souhaitez coller le texte copié, puis appuyez sur Ctrl+V.

Extraction de texte à partir d'images d'un fichier imprimé multipage

  1. Cliquez avec le bouton droit sur l'un des fichiers image, puis effectuez l'une des actions suivantes :
    • Cliquez sur " Copier le texte de cette page " pour copier uniquement le texte de l'image (page) actuellement sélectionnée.
    • Cliquez sur Copier le texte de toutes les pages de l'impression pour copier le texte de toutes les images (pages).
  2. Cliquez à l'endroit où vous souhaitez coller le texte copié, puis appuyez sur Ctrl+V.

Outils OCR en ligne

Nous venons de voir comment extraire du texte à partir de fichiers image grâce à la technologie OCR (reconnaissance optique de caractères) avec Microsoft OneNote sur un ordinateur. Voyons maintenant les logiciels OCR disponibles en ligne.

OCR en ligne

OnlineOCR est un service OCR en ligne professionnel avec un design épuré et simple. L'apparence de ce site web peut sembler un peu datée puisqu'il a été créé en 2009, mais cela contribue également à simplifier considérablement les opérations de reconnaissance optique de caractères pour les utilisateurs.

OnlineOCR vous permet de reconnaître les documents PDF numérisés, les photographies et les images capturées par un appareil photo numérique, et de les convertir en fichiers modifiables tels que Word, TXT et Excel. Quarante-six langues différentes peuvent être reconnues, dont l'anglais, l'espagnol, le japonais, le chinois et le coréen.

OCR in Windows 10, Figure 2: OnlineOCR

Réaliser une tâche de reconnaissance optique de caractères (OCR) avec OnlineOCR ne prend que trois étapes faciles.

Étape 1. Cliquez sur le bouton " Sélectionner un fichier " pour télécharger un fichier PDF ou un document numérisé au format JPG, BMP, GIF ou TIFF. Vous pouvez également télécharger plusieurs fichiers en une seule fois. Remarque : la taille maximale des fichiers que vous pouvez télécharger est de 15 Mo.

Étape 2. Sélectionnez la langue du fichier que vous téléchargez et choisissez un format de sortie parmi Word, Excel et TXT.

Étape 3. Cliquez sur " Convertir " pour lancer la reconnaissance et la conversion de vos fichiers.

NewOCR

Un autre outil OCR en ligne gratuit est NewOCR, qui peut analyser le texte dans un fichier image ou un document PDF que vous téléchargez, puis le convertir en un document texte facilement modifiable sur votre ordinateur. Chaque utilisateur peut profiter de téléchargements illimités sans aucune obligation d'inscription. Tous les fichiers que vous téléchargez seront supprimés du serveur, vous n'avez donc pas à vous soucier de la sécurité des fichiers.

OCR in Windows 10, Figure 3: NewOCR

Cliquez d'abord sur " Choisir un fichier " pour ajouter une image ou des documents numérisés depuis votre appareil, puis cliquez sur " Aperçu ".

Ensuite, choisissez une ou plusieurs langues de reconnaissance dans la case langue, puis faites pivoter l'image si nécessaire. Si votre fichier téléchargé contient du texte sur plusieurs colonnes, cochez l'onglet " Analyse de la mise en page " pour diviser le texte en colonnes. Enfin, cliquez sur le bouton " OCR ".

OCR in Windows 10, Figure 4: NewOCR

Le texte reconnu s'affichera dans la zone de texte ci-dessous. Vous pouvez télécharger le texte aux formats TXT, Word ou PDF.

OCR in Windows 10, Figure 5: NewOCR

Convertio

Convertio est un service OCR en ligne gratuit avec un design moderne et attrayant. Les utilisateurs gratuits non enregistrés peuvent traiter un maximum de 10 pages. Il peut s'agir de fichiers PDF ou Word. Vous pouvez également utiliser un fichier PDF numérisé. Si vous souhaitez traiter davantage de pages, inscrivez-vous pour bénéficier d'un service amélioré.

Pour effectuer une reconnaissance optique de caractères (OCR) en ligne avec Convertio, il suffit de suivre ces trois étapes.

Étape 1. Cliquez sur " Choisir des fichiers " pour sélectionner et importer des fichiers depuis votre appareil local, Google Drive, Dropbox ou des pages Web. Vous pouvez également ajouter des fichiers en les faisant glisser sur la page.

OCR in Windows 10, Figure 6: Convertio

Convertio

Étape 2 . Choisissez une ou deux langues utilisées dans votre fichier. Ensuite, définissez le format de sortie : document Word, classeur Excel, document PDF, fichier texte, ou tout autre format souhaité. Vous pouvez choisir de reconnaître toutes les pages ou seulement certaines en saisissant une plage de pages dans le champ " Numéro de page ".

OCR in Windows 10, Figure 7: Paramètres OCR de Convertio

Paramètres OCR de Convertio

Étape 3. Une fois la reconnaissance et la conversion terminées, un lien de téléchargement pour le texte extrait dans un document converti apparaîtra en haut de la page. Il vous suffira ensuite de l'enregistrer à l'emplacement souhaité.

OCR in Windows 10, Figure 8: Convertio Downloading Files

Téléchargement de fichiers depuis Convertio

Convertio offre le plus grand nombre d'options en tant que service OCR en ligne et est donc le meilleur logiciel OCR gratuit en ligne.

IronOCR

IronOCR est une bibliothèque technologique OCR populaire auprès des développeurs .NET qui ont besoin d'extraire du texte à partir de documents numérisés ou de fichiers PDF. Il offre une grande précision, un traitement rapide et des performances solides en temps réel pour l'imagerie, la numérisation et la reconnaissance. La bibliothèque est un composant logiciel qui simplifie la numérisation des documents en automatisant leur scan. Il prend également en charge d'autres processus, notamment l'indexation de documents et le traitement d'images.

IronOCR est unique par sa capacité à détecter et à extraire automatiquement des données à partir d'images et de documents imparfaitement numérisés. La classe IronTesseract offre la version la plus avancée de Tesseract connue sur toutes les plateformes, avec une vitesse et une précision accrues.

Examinons un exemple de code permettant d'extraire du texte d'un fichier image numérisé.

// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

Image d'entrée pour extraire le texte

OCR in Windows 10, Figure 9: IronOCR, Données expurgées des employés

Données expurgées des employés

Sortie de texte extrait

Le résultat est net et correspond à l'image originale avec seulement quelques lignes de code, ce qui se traduit par un rendu parfait et sans aucun problème technique.

OCR in Windows 10, Figure 10: IronOCR, Sortie d'image

Sortie d'image

Licences

IronOCR est entièrement gratuit à des fins de développement. Elle dispose également d'une structure tarifaire distincte pour les licences commerciales . Le forfait Lite commence à $799 sans frais cachés. Grâce à la version d'essai gratuite, les utilisateurs peuvent tester IronOCR en conditions réelles avant de l'acheter. Choisissez une formule adaptée à la taille de votre entreprise en optant pour une licence pour un développeur, dix développeurs ou un nombre illimité de développeurs.

Iron Software propose l'ensemble de sa gamme de produits à un prix fortement réduit . Pour en savoir plus, consultez cette page.

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Pendant qu'il poursuivait son diplôme, Kannapat est également devenu membre du laboratoire de robotique de véhicules, qui fait partie du département de bioproduction. En 2022, il a utilisé ses compé...
Lire la suite

Équipe de soutien Iron

Nous sommes en ligne 24 heures sur 24, 5 jours sur 7.
Chat
Email
Appelez-moi