OUTILS OCR

Comment construire un OCR en Python

Publié novembre 22, 2023
Partager:

Le monde est inondé de grandes quantités d'informations textuelles. Qu'il s'agisse de documents imprimés ou de notes manuscrites, il existe une multitude de contenus précieux qui pourraient être extrêmement utiles s'ils étaient un peu plus accessibles.

C'est là que la reconnaissance optique des caractères (OCR) la technologie entre en jeu. Imaginez un ordinateur capable de "lire" du texte dans des images, comme le fait un être humain, mais il s'agit de vision par ordinateur, qui représente une section de l'informatique dans laquelle nous pouvons entraîner des ordinateurs à reconnaître et à identifier différents sujets dans une image.

Dans ce tutoriel, nous vous guiderons à travers le processus de construction de votre propre système OCR à l'aide de Python, un langage de programmation connu pour sa simplicité et sa polyvalence. Avec l'aide de bibliothèques comme Tesseract, IronOCRet OpenCV, vous serez bientôt en mesure d'extraire, de manipuler et de travailler avec du texte à partir d'images de documents.

Conditions préalables à l'utilisation du moteur OCR (reconnaissance optique de caractères)

Avant de nous plonger dans les détails de la construction de notre système d'OCR, vous aurez besoin de quelques éléments :

  1. Python : Assurez-vous que Python est installé sur votre ordinateur. Vous pouvez le télécharger à partir du site site officiel de Python.

  2. Installer Tesseract OCR : Tesseract OCR est un moteur OCR open-source développé par Google. C'est un outil puissant que nous utiliserons dans notre projet. Vous pouvez télécharger la bibliothèque Tesseract à l'adresse suivante GitHub et lisez la procédure d'installation de Tesseract OCR.

  3. Bibliothèques Python : Nous utiliserons deux bibliothèques Python importantes pour ce projet : pytesseract et opencv. Vous pouvez les installer en utilisant les commandes suivantes dans votre invite de ligne de commande ou votre terminal :
    :InstallCmd  pip install pytesseract opencv-python

Comment construire un OCR en Python : Figure 1

Étapes de la construction du système OCR

Vous pouvez facilement construire l'OCR en utilisant le code Python à l'aide des bibliothèques Python OCR et d'un simple script Python.

Étape 1 Importer des bibliothèques

Tout d'abord, vous devez importer les bibliothèques nécessaires :

import cv2 
import pytesseract
PYTHON

Étape 2 Lire et traiter une image

Charger l'image à l'aide d'OpenCV et la prétraiter pour améliorer la précision de l'OCR :

# Load the image using OpenCV 
image = cv2.imread('sample_image.png') 
# Convert the image to grayscale 
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) 
# Apply thresholding or other preprocessing techniques if needed
PYTHON

Étape 3 : Utiliser Tesseract pour l'OCR

Il est maintenant temps d'utiliser le moteur OCR de Tesseract pour effectuer l'OCR sur l'image traitée :

# Use pytesseract to perform OCR on the grayscale image 
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'
text = pytesseract.image_to_string(gray_image) 
PYTHON

Étape 4 : Affichage des résultats

Si vous souhaitez visualiser l'image originale et le texte extrait, vous pouvez utiliser OpenCV pour les afficher :

# Display the original image 
cv2.imshow('Original Image', image) 
cv2.waitKey(0) 
# Display the extracted text
    print("Extracted Text:", text) 
cv2.waitKey(0) 
cv2.destroyAllWindows()
PYTHON

Image originale

Comment construire un OCR en Python : Figure 2

Texte extrait

Comment construire un OCR en Python : Figure 3

Comme vous pouvez le constater, le résultat est très mauvais, car nous devons l'entraîner (en entraînant l'apprentissage automatique) avant de l'utiliser pour effectuer l'OCR afin d'extraire des images de texte contenant des tableaux.

IronOCR

Dans un monde inondé de données, la possibilité de convertir sans effort un texte imprimé ou manuscrit en un contenu lisible par une machine est une capacité de transformation.

Entrer IronOCR - une technologie de pointe qui permet aux développeurs d'intégrer des systèmes robustes de reconnaissance optique de caractères (OCR) dans leurs applications en toute simplicité.

Qu'il s'agisse d'extraire des données de documents numérisés, d'automatiser la saisie de données ou d'améliorer l'accessibilité, IronOCR offre une solution complète qui dépasse les limites de la reconnaissance de texte traditionnelle.

Dans cette exploration, nous nous plongeons dans le domaine de l'IronOCR, en découvrant ses caractéristiques polyvalentes et en soulignant son potentiel pour combler le fossé entre les mondes physique et numérique.

Installation de l'IronOCR

Vous pouvez facilement installer IronOCR à l'aide de la console NuGet Package Manager, en exécutant simplement la commande suivante.

Install-Package IronOcr

IronOCR est également disponible en téléchargement sur le site site officiel de NuGet.

Extraction de texte à partir d'une image à l'aide d'IronOCR

Dans cette section, nous allons voir comment vous pouvez facilement extraire du texte à partir d'images en utilisant IronOCR. Vous trouverez ci-dessous le code source qui extrait le texte de l'image.

using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput())
{
    input.AddImage("r3.png");
    OcrResult result = ocr.Read(input);
    string text = result.Text;
    Console.WriteLine(result.Text);
}
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput())
{
    input.AddImage("r3.png");
    OcrResult result = ocr.Read(input);
    string text = result.Text;
    Console.WriteLine(result.Text);
}
Imports IronOcr
Imports System
Private ocr = New IronTesseract()
Using input = New OcrInput()
	input.AddImage("r3.png")
	Dim result As OcrResult = ocr.Read(input)
	Dim text As String = result.Text
	Console.WriteLine(result.Text)
End Using
VB   C#

Sortie

Comment construire un OCR en Python : Figure 4

Conclusion

Dans ce tutoriel, nous avons exploré le processus de construction d'un logiciel de reconnaissance optique de caractères (OCR) en Python, dévoilant la capacité d'extraire du texte à partir d'images avec une facilité remarquable.

En exploitant des bibliothèques telles que Tesseract et OpenCV, nous avons franchi des étapes essentielles, du chargement et du prétraitement des images à l'utilisation du moteur OCR de Tesseract pour l'extraction de texte.

Nous avons également abordé les défis potentiels tels que les limitations de précision, que des solutions avancées comme IronOCR visent à résoudre.

Que vous choisissiez de bricoler ou d'adopter des outils sophistiqués, le monde de l'OCR vous attire avec la promesse de transformer les images en texte exploitable, de rationaliser la saisie des données et d'améliorer l'accessibilité. Fort de ces nouvelles connaissances, vous êtes prêt à vous lancer dans un voyage qui fusionne harmonieusement les domaines visuel et numérique.

Pour commencer IronOCR visitez les sites suivants lien. Pour voir l'intégralité du tutoriel sur l'extraction de texte à partir d'images, consultez le site suivant ici.

Si vous souhaitez essayer IronOCR gratuitement aujourd'hui, n'oubliez pas de vous inscrire à la liste de diffusion procès offert par IronOCR pour explorer toutes ses utilisations et son potentiel dans un environnement commercial sans le filigrane. Pour continuer à l'utiliser une fois les 15 jours écoulés, il suffit d'acheter une licence.

< PRÉCÉDENT
Comment numériser une écriture en texte (Tutoriel pour débutants)
SUIVANT >
Comment numériser en texte modifiable en C#