Le monde est inondé de grandes quantités d'informations textuelles. Il y a une richesse de contenu précieux qui pourrait être immensément utile s'il était juste un peu plus accessible.
C'est là que la technologie de Reconnaissance Optique de Caractères (OCR) entre en jeu. Imaginez un ordinateur capable de "lire" du texte dans des images, comme le fait un être humain, mais il s'agit de vision par ordinateur, qui représente une section de l'informatique dans laquelle nous pouvons entraîner des ordinateurs à reconnaître et à identifier différents sujets dans une image.
Dans ce tutoriel, nous vous guiderons à travers le processus de construction de votre propre système OCR à l'aide de Python, un langage de programmation connu pour sa simplicité et sa polyvalence. Avec l'aide de bibliothèques comme Tesseract, IronOCR et OpenCV, vous serez bientôt en mesure de libérer le potentiel de l'extraction, de la manipulation et du traitement du texte à partir d'images de documents.
Conditions préalables à l'utilisation du moteur OCR (reconnaissance optique de caractères)
Avant de nous plonger dans les détails de la construction de notre système d'OCR, vous aurez besoin de quelques éléments :
Python : Assurez-vous que Python est installé sur votre ordinateur. Vous pouvez le télécharger depuis le site officiel de Python.
Installer Tesseract OCR : Tesseract OCR est un moteur OCR open-source développé par Google. C'est un outil puissant que nous utiliserons dans notre projet. Vous pouvez télécharger la bibliothèque Tesseract depuis GitHub et lire à propos du processus d'installation de Tesseract OCR.
Bibliothèques Python : Nous utiliserons deux bibliothèques Python importantes pour ce projet, pytesseract et la bibliothèque opencv. Vous pouvez les installer en utilisant les commandes suivantes dans votre invite de ligne de commande ou votre terminal :
:InstallCmd pip install pytesseract opencv-python
:InstallCmd pip install pytesseract opencv-python
SHELL
Étapes de la construction du système OCR
Vous pouvez facilement construire l'OCR en utilisant le code Python à l'aide des bibliothèques Python OCR et d'un simple script Python.
Étape 1 Importer des bibliothèques
Tout d'abord, vous devez importer les bibliothèques nécessaires :
import cv2
import pytesseract
py
PYTHON
Étape 2 Lire et traiter une image
Charger l'image à l'aide d'OpenCV et la prétraiter pour améliorer la précision de l'OCR :
# Load the image using OpenCV
image = cv2.imread('sample_image.png')
# Convert the image to grayscale
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# Apply thresholding or other preprocessing techniques if needed
py
PYTHON
Étape 3 : Utiliser Tesseract pour l'OCR
Il est maintenant temps d'utiliser le moteur OCR de Tesseract pour effectuer l'OCR sur l'image traitée :
# Use pytesseract to perform OCR on the grayscale image
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'
text = pytesseract.image_to_string(gray_image)
py
PYTHON
Étape 4 : Affichage des résultats
Si vous souhaitez visualiser l'image originale et le texte extrait, vous pouvez utiliser OpenCV pour les afficher :
# Display the original image
cv2.imshow('Original Image', image)
cv2.waitKey(0)
# Display the extracted text
print("Extracted Text:", text)
cv2.waitKey(0)
cv2.destroyAllWindows()
py
PYTHON
Image originale
Texte extrait
Comme vous pouvez le voir, le résultat est très mauvais car nous devons le former (comme nous formons l'apprentissage automatique) avant de l'utiliser pour effectuer l'OCR afin d'extraire les images de texte contenant des tableaux.
IronOCR
Dans un monde inondé de données, la capacité de convertir sans effort le texte imprimé en contenu lisible par machine est une capacité transformatrice.
Découvrez IronOCR – une technologie de pointe qui permet aux développeurs d'intégrer facilement des capacités robustes de reconnaissance optique de caractères (OCR) dans leurs applications.
Qu'il s'agisse d'extraire des données de documents numérisés, d'automatiser la saisie de données ou d'améliorer l'accessibilité, IronOCR offre une solution complète qui dépasse les limites de la reconnaissance de texte traditionnelle.
Dans cette exploration, nous nous plongeons dans le domaine de l'IronOCR, en découvrant ses caractéristiques polyvalentes et en soulignant son potentiel pour combler le fossé entre les mondes physique et numérique.
Installation de l'IronOCR
Vous pouvez facilement installer IronOCR à l'aide de la console NuGet Package Manager, en exécutant simplement la commande suivante.
Extraction de texte à partir d'une image à l'aide d'IronOCR
Dans cette section, nous allons voir comment vous pouvez facilement extraire du texte à partir d'images en utilisant IronOCR. Vous trouverez ci-dessous le code source qui extrait le texte de l'image.
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput())
{
input.AddImage("r3.png");
OcrResult result = ocr.Read(input);
string text = result.Text;
Console.WriteLine(result.Text);
}
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput())
{
input.AddImage("r3.png");
OcrResult result = ocr.Read(input);
string text = result.Text;
Console.WriteLine(result.Text);
}
Imports IronOcr
Imports System
Private ocr = New IronTesseract()
Using input = New OcrInput()
input.AddImage("r3.png")
Dim result As OcrResult = ocr.Read(input)
Dim text As String = result.Text
Console.WriteLine(result.Text)
End Using
$vbLabelText $csharpLabel
Sortie
Conclusion
Dans ce tutoriel, nous avons exploré le processus de construction d'un système de reconnaissance optique de caractères (OCR) en Python, dévoilant la capacité d'extraire du texte à partir d'images avec une remarquable facilité.
En exploitant des bibliothèques telles que Tesseract et OpenCV, nous avons franchi des étapes essentielles, du chargement et du prétraitement des images à l'utilisation du moteur OCR de Tesseract pour l'extraction de texte.
Nous avons également abordé les défis potentiels tels que les limitations de précision, que des solutions avancées comme IronOCR visent à résoudre.
Que vous choisissiez de bricoler ou d'adopter des outils sophistiqués, le monde de l'OCR vous attire avec la promesse de transformer les images en texte exploitable, de rationaliser la saisie des données et d'améliorer l'accessibilité. Fort de ces nouvelles connaissances, vous êtes prêt à vous lancer dans un voyage qui fusionne harmonieusement les domaines visuel et numérique.
Pour commencer avec IronOCR, visitez le lien suivant. Pour voir l'intégralité du tutoriel sur la façon d'extraire du texte à partir d'images, visitez ici.
Si vous souhaitez essayer IronOCR gratuitement aujourd'hui, assurez-vous de vous inscrire à l'essai offert par IronOCR pour explorer toutes ses utilisations et son potentiel dans un environnement commercial sans le filigrane. Pour continuer à l'utiliser une fois les 15 jours écoulés, il vous suffit d'acheter une licence.
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Tout en poursuivant ses études, Kannapat est également devenu membre du Vehicle Robotics Laboratory, qui fait partie du Department of Bioproduction Engineering (département d'ingénierie de la bioproduction). En 2022, il a mis à profit ses compétences en C# pour rejoindre l'équipe d'ingénieurs d'Iron Software, où il se concentre sur IronPDF. Kannapat apprécie son travail car il apprend directement auprès du développeur qui écrit la majeure partie du code utilisé dans IronPDF. Outre l'apprentissage par les pairs, Kannapat apprécie l'aspect social du travail chez Iron Software. Lorsqu'il n'écrit pas de code ou de documentation, Kannapat peut généralement être trouvé en train de jouer sur sa PS5 ou de revoir The Last of Us.
< PRÉCÉDENT Outils de reconnaissance de texte arabe : Améliorer la précision
SUIVANT > Comment numériser en texte modifiable en C#
Des millions d'ingénieurs dans le monde entier lui font confiance
Réservez une démo en direct gratuite
Réservez une démonstration personnelle de 30 minutes.
Pas de contrat, pas de détails de carte, pas d'engagements.
Voici ce à quoi vous pouvez vous attendre :
Une démonstration en direct de notre produit et de ses principales fonctionnalités
Obtenez des recommandations de fonctionnalités spécifiques au projet
Toutes vos questions trouvent réponse pour vous assurer de disposer de toutes les informations dont vous avez besoin. (Aucun engagement de votre part.)
CHOISIR L'HEURE
VOS INFORMATIONS
Réservez votre démo en direct gratuite
Fiable par plus de 2 millions d'ingénieurs dans le monde entier