Passer au contenu du pied de page
OUTILS OCR

OCR dans Windows 10 (Outils en ligne gratuits)

La reconnaissance optique de caractères (OCR) est le processus de conversion d'une image de texte en un format lisible par machine. Lorsqu'une image ou un document est numérisé sur un ordinateur, il est enregistré sous forme de fichier image. Cela rend impossible pour les éditeurs de texte d'éditer, rechercher ou compter les mots dans le fichier image. L'OCR permet aux systèmes d'extraire du texte d'une image, le contenu étant ensuite stocké sous forme de données texte modifiables.

La plupart des flux de travail d'entreprise impliquent la communication d'informations à l'aide des médias imprimés. La numérisation de documents et d'images peut créer des défis. La technologie OCR résout ce problème en convertissant les images de texte en données texte qui peuvent ensuite être analysées par d'autres logiciels d'entreprise. Ces données peuvent être utilisées pour réaliser des analyses, rationaliser les opérations, automatiser les processus et améliorer la productivité.

Cet article présentera certains programmes OCR gratuits qui peuvent aider les utilisateurs à gérer les fichiers efficacement.

Microsoft OneNote: Le meilleur logiciel OCR gratuit

OneNote est une application de prise de notes numériques qui offre un seul endroit pour garder toutes vos notes, recherches, plans et informations. OneNote prend en charge la Reconnaissance optique de caractères (OCR), un outil qui vous permet d'extraire du texte d'une image ou d'un fichier imprimé (document PDF ou fichier Word) et de le coller dans vos notes, afin que vous puissiez apporter des modifications aux mots. C'est un excellent moyen de faire des choses comme copier des informations à partir d'une carte de visite que vous avez numérisée dans OneNote. Après avoir extrait le texte, vous pouvez le coller ailleurs dans OneNote ou un autre programme, tel qu'Outlook ou Word. Vous pouvez télécharger la dernière version dans le magasin Microsoft, et elle est souvent déjà installée sur les systèmes Windows. C'est l'une des meilleures options de logiciels OCR gratuits pour la reconnaissance de texte.

OCR in Windows 10, Figure 1: OneNote OCR

Extraction de texte à partir d'une seule image

  1. Faites un clic droit sur l'image, puis cliquez sur Copier le texte de l'image.
  2. Cliquez là où vous souhaitez coller le texte copié, puis appuyez sur Ctrl+V.

Extraction de texte à partir des images d'un fichier imprimé multipages

  1. Faites un clic droit sur n'importe lequel des fichiers image, puis effectuez l'une des actions suivantes :
    • Cliquez sur Copier le texte de cette page de l'impression pour copier le texte uniquement de l'image sélectionnée actuellement (page).
    • Cliquez sur Copier le texte de toutes les pages de l'impression pour copier le texte de toutes les images (pages).
  2. Cliquez là où vous souhaitez coller le texte copié, puis appuyez sur Ctrl+V.

Outils OCR en ligne

Nous venons de voir comment nous pouvons extraire du texte à partir de fichiers image en utilisant la technologie OCR avec Microsoft OneNote sur une machine locale. Ensuite, examinons les logiciels OCR actuellement disponibles en ligne.

OnlineOCR

OnlineOCR is a professional online OCR service with a clean and simple design. L'apparence de ce site web peut sembler un peu datée puisqu'il a été créé en 2009, mais cela aide aussi à garder les opérations OCR assez simples pour les utilisateurs.

OnlineOCR vous permet de reconnaître des documents PDF numérisés, des photographies et des images capturées par un appareil photo numérique, et de les convertir en fichiers éditables tels que Word, TXT et Excel. Il existe 46 langues différentes qui peuvent être reconnues, y compris l'anglais, l'espagnol, le japonais, le chinois et le coréen.

OCR in Windows 10, Figure 2: OnlineOCR

Obtenir un travail OCR effectué avec OnlineOCR ne nécessite que trois étapes simples.

Étape 1. Appuyez sur le bouton "Select file" pour télécharger un fichier PDF ou un document numérisé au format JPG, BMP, GIF ou TIFF. Vous pouvez également télécharger plusieurs fichiers en une seule fois. Note : la taille maximale de fichier que vous pouvez télécharger est de 15 Mo.

Étape 2. Sélectionnez la langue du fichier que vous téléchargez et choisissez un format de sortie parmi Word, Excel et TXT.

Étape 3. Cliquez sur "Convert" pour commencer à reconnaître et convertir vos fichiers.

NewOCR

Another free online OCR tool is NewOCR, which can analyze the text in an image file or PDF document that you upload, and then convert it to a text document that can be edited easily on your computer. Chaque utilisateur peut profiter de téléchargements illimités sans aucune exigence d'enregistrement. Tous les fichiers que vous téléchargez seront supprimés du serveur, vous n'avez donc pas à vous soucier de la sécurité des fichiers.

OCR in Windows 10, Figure 3: NewOCR

Tout d'abord, cliquez sur "Choose File" pour ajouter une image ou des documents numérisés depuis votre appareil, puis cliquez sur "Preview".

Ensuite, choisissez une ou plusieurs langues de reconnaissance dans la boîte de langues, puis faites pivoter l'image si nécessaire. Si votre fichier téléchargé contient un texte à plusieurs colonnes, cochez l'onglet "Analyse de la mise en page" pour diviser le texte en colonnes. Enfin, cliquez sur le bouton "OCR".

OCR in Windows 10, Figure 4: NewOCR

Le texte reconnu s'affichera dans la zone de texte ci-dessous. Vous pouvez télécharger le texte au format TXT, Word ou PDF.

OCR in Windows 10, Figure 5: NewOCR

Convertio

Convertio is a free online OCR service with a modern and attractive design. Les utilisateurs gratuits et non enregistrés peuvent traiter un maximum de 10 pages. Ceux-ci peuvent être des fichiers PDF ou Word. Vous pouvez également utiliser un fichier PDF numérisé. Si vous avez besoin de reconnaître plus de pages, inscrivez-vous simplement pour obtenir un meilleur service.

Pour effectuer une OCR en ligne avec Convertio, suivez simplement ces trois étapes.

Étape 1. Cliquez sur "Choose Files" pour choisir et télécharger des fichiers depuis votre appareil local, Google Drive, Dropbox ou des pages web. Vous pouvez également ajouter des fichiers en les faisant glisser sur la page.

OCR in Windows 10, Figure 6: Convertio

Convertio

Step 2. Choisissez une ou deux langues utilisées dans votre fichier téléchargé. Ensuite, définissez le format de sortie en document Word, classeur Excel, document PDF, fichier texte ou tout autre format requis. Vous pouvez choisir de reconnaître toutes les pages ou seulement certaines pages en entrant une plage de pages dans la "Page Number" box.

OCR in Windows 10, Figure 7: Convertio Paramètres OCR

Convertio Paramètres OCR

Étape 3. Lorsque la reconnaissance et la conversion sont terminées, un lien de téléchargement pour le texte extrait dans un document converti apparaîtra en haut. Il suffit de l'enregistrer à l'endroit souhaité.

OCR in Windows 10, Figure 8: Convertio Downloading Files

Téléchargement de fichiers à partir de Convertio

Convertio offre le plus d'options en tant que service OCR en ligne, et est donc le meilleur logiciel OCR en ligne gratuit.

IronOCR

IronOCR est une bibliothèque technologique OCR populaire pour les développeurs .NET ayant besoin d'extraire du texte de documents numérisés ou de fichiers PDF. Elle fournit une grande précision, un traitement rapide et des performances solides en temps réel pour l'imagerie, la numérisation et la reconnaissance. La bibliothèque est un composant logiciel qui simplifie la numérisation des documents en automatisant la numérisation des documents. Elle prend également en charge d'autres processus, y compris l'indexation des documents et le traitement des images.

IronOCR est unique par sa capacité à détecter et extraire automatiquement les données des images et documents scannés de manière imparfaite. La classe IronTesseract fournit la version la plus avancée de Tesseract connue dans le monde et sur toutes les plateformes, avec une vitesse et une précision accrues.

Voyons un exemple de code pour extraire du texte à partir d'un fichier image numérisé.

// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
' Import the necessary IronOCR namespace
Imports IronOcr

' Create an instance of the IronTesseract class
Private Ocr = New IronTesseract()

Using Input = New OcrInput()
	' Load the image file to perform OCR
	Input.AddImage("test-files/redacted-employmentapp.png")

	' Perform OCR to extract text from the image(s)
	Dim Result = Ocr.Read(Input)

	' Output the extracted text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

Image d'entrée à extraire du texte

OCR in Windows 10, Figure 9: IronOCR, La sortie est propre et correspond à l'image originale avec juste quelques lignes de code sans aucune complexité technique et un résultat parfait.

La sortie est propre et correspond à l'image originale avec juste quelques lignes de code sans aucune complexité technique et un résultat parfait.

Texte extrait en sortie

La sortie est propre et correspond à l'image originale avec juste quelques lignes de code, se traduisant par une sortie parfaite et sans problèmes techniques.

" class="img-responsive add-shadow" />

5.2. Utilisation de AWS Textract

Licences

IronOCR est entièrement gratuit à des fins de développement. Il a également une structure tarifaire distincte pour les licences commerciales. Le forfait Lite commence à $799 sans frais cachés. Les utilisateurs peuvent essayer IronOCR en production avant de l'acheter avec l'essai gratuit. Choisissez un forfait qui correspond à la taille de votre entreprise en optant pour une licence pour un développeur, dix développeurs ou développeurs illimités.

Iron Software propose l'ensemble de ses produits à un grand rabais. Apprenez plus de détails sur cette page

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Pendant qu'il poursuivait son diplôme, Kannapat est également devenu membre du laboratoire de robotique de véhicules, qui fait partie du département de bioproduction. En 2022, il a utilisé ses compé...
Lire la suite