Test dans un environnement réel
Test en production sans filigrane.
Fonctionne partout où vous en avez besoin.
Le monde est inondé de grandes quantités d'informations textuelles. Qu'il s'agisse de documents imprimés ou de notes manuscrites, il existe une multitude de contenus précieux qui pourraient être extrêmement utiles s'ils étaient un peu plus accessibles.
C'est là que la reconnaissance optique des caractères (OCR) la technologie entre en jeu. Imaginez un ordinateur capable de "lire" du texte dans des images, comme le fait un être humain, mais il s'agit de vision par ordinateur, qui représente une section de l'informatique dans laquelle nous pouvons entraîner des ordinateurs à reconnaître et à identifier différents sujets dans une image.
Dans ce tutoriel, nous vous guiderons à travers le processus de construction de votre propre système OCR à l'aide de Python, un langage de programmation connu pour sa simplicité et sa polyvalence. Avec l'aide de bibliothèques comme Tesseract, IronOCRet OpenCV, vous serez bientôt en mesure d'extraire, de manipuler et de travailler avec du texte à partir d'images de documents.
Avant de nous plonger dans les détails de la construction de notre système d'OCR, vous aurez besoin de quelques éléments :
Python : Assurez-vous que Python est installé sur votre ordinateur. Vous pouvez le télécharger à partir du site site officiel de Python.
Installer Tesseract OCR : Tesseract OCR est un moteur OCR open-source développé par Google. C'est un outil puissant que nous utiliserons dans notre projet. Vous pouvez télécharger la bibliothèque Tesseract à l'adresse suivante GitHub et lisez la procédure d'installation de Tesseract OCR.
pytesseract
et opencv
. Vous pouvez les installer en utilisant les commandes suivantes dans votre invite de ligne de commande ou votre terminal : :InstallCmd pip install pytesseract opencv-python
Vous pouvez facilement construire l'OCR en utilisant le code Python à l'aide des bibliothèques Python OCR et d'un simple script Python.
Tout d'abord, vous devez importer les bibliothèques nécessaires :
import cv2
import pytesseract
Lire et traiter une image
Charger l'image à l'aide d'OpenCV et la prétraiter pour améliorer la précision de l'OCR :
# Load the image using OpenCV
image = cv2.imread('sample_image.png')
# Convert the image to grayscale
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# Apply thresholding or other preprocessing techniques if needed
Il est maintenant temps d'utiliser le moteur OCR de Tesseract pour effectuer l'OCR sur l'image traitée :
# Use pytesseract to perform OCR on the grayscale image
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'
text = pytesseract.image_to_string(gray_image)
Si vous souhaitez visualiser l'image originale et le texte extrait, vous pouvez utiliser OpenCV pour les afficher :
# Display the original image
cv2.imshow('Original Image', image)
cv2.waitKey(0)
# Display the extracted text
print("Extracted Text:", text)
cv2.waitKey(0)
cv2.destroyAllWindows()
Comme vous pouvez le constater, le résultat est très mauvais, car nous devons l'entraîner (en entraînant l'apprentissage automatique) avant de l'utiliser pour effectuer l'OCR afin d'extraire des images de texte contenant des tableaux.
Dans un monde inondé de données, la possibilité de convertir sans effort un texte imprimé ou manuscrit en un contenu lisible par une machine est une capacité de transformation.
Entrer IronOCR - une technologie de pointe qui permet aux développeurs d'intégrer des systèmes robustes de reconnaissance optique de caractères (OCR) dans leurs applications en toute simplicité.
Qu'il s'agisse d'extraire des données de documents numérisés, d'automatiser la saisie de données ou d'améliorer l'accessibilité, IronOCR offre une solution complète qui dépasse les limites de la reconnaissance de texte traditionnelle.
Dans cette exploration, nous nous plongeons dans le domaine de l'IronOCR, en découvrant ses caractéristiques polyvalentes et en soulignant son potentiel pour combler le fossé entre les mondes physique et numérique.
Vous pouvez facilement installer IronOCR à l'aide de la console NuGet Package Manager, en exécutant simplement la commande suivante.
Install-Package IronOcr
IronOCR est également disponible en téléchargement sur le site site officiel de NuGet.
Dans cette section, nous allons voir comment vous pouvez facilement extraire du texte à partir d'images en utilisant IronOCR. Vous trouverez ci-dessous le code source qui extrait le texte de l'image.
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput())
{
input.AddImage("r3.png");
OcrResult result = ocr.Read(input);
string text = result.Text;
Console.WriteLine(result.Text);
}
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput())
{
input.AddImage("r3.png");
OcrResult result = ocr.Read(input);
string text = result.Text;
Console.WriteLine(result.Text);
}
Imports IronOcr
Imports System
Private ocr = New IronTesseract()
Using input = New OcrInput()
input.AddImage("r3.png")
Dim result As OcrResult = ocr.Read(input)
Dim text As String = result.Text
Console.WriteLine(result.Text)
End Using
Dans ce tutoriel, nous avons exploré le processus de construction d'un logiciel de reconnaissance optique de caractères (OCR) en Python, dévoilant la capacité d'extraire du texte à partir d'images avec une facilité remarquable.
En exploitant des bibliothèques telles que Tesseract et OpenCV, nous avons franchi des étapes essentielles, du chargement et du prétraitement des images à l'utilisation du moteur OCR de Tesseract pour l'extraction de texte.
Nous avons également abordé les défis potentiels tels que les limitations de précision, que des solutions avancées comme IronOCR visent à résoudre.
Que vous choisissiez de bricoler ou d'adopter des outils sophistiqués, le monde de l'OCR vous attire avec la promesse de transformer les images en texte exploitable, de rationaliser la saisie des données et d'améliorer l'accessibilité. Fort de ces nouvelles connaissances, vous êtes prêt à vous lancer dans un voyage qui fusionne harmonieusement les domaines visuel et numérique.
Pour commencer IronOCR visitez les sites suivants lien. Pour voir l'intégralité du tutoriel sur l'extraction de texte à partir d'images, consultez le site suivant ici.
Si vous souhaitez essayer IronOCR gratuitement aujourd'hui, n'oubliez pas de vous inscrire à la liste de diffusion procès offert par IronOCR pour explorer toutes ses utilisations et son potentiel dans un environnement commercial sans le filigrane. Pour continuer à l'utiliser une fois les 15 jours écoulés, il suffit d'acheter une licence.
9 produits de l'API .NET pour vos documents de bureau