Passer au contenu du pied de page
UTILISER IRONXL POUR PYTHON

Comment lire des fichiers Excel en Python

Le traitement des fichiers Excel est une exigence courante dans les tâches d'analyse et d'automatisation des données. Python, grâce à son ensemble étendu de bibliothèques , offre différentes manières d'interagir avec les fichiers XLSX. Dans ce tutoriel, nous apprendrons à lire des fichiers Excel à l'aide d'IronXL , une bibliothèque Python pour Excel.

IronXL : Bibliothèque Excel Python

IronXL pour Python est conçu pour aider les développeurs à lire et à écrire facilement des fichiers Excel en Python. Non seulement vous pouvez écrire des fichiers Excel, mais vous pouvez également travailler sur plusieurs feuilles Excel simultanément. Cette bibliothèque est idéale pour écrire des fichiers Excel sans installer Microsoft Excel sur votre ordinateur.

Lorsque vous avez besoin d'importer des données directement dans une feuille de calcul Excel, IronXL vient à votre rescousse. IronXL simplifie la gestion des feuilles de calcul Excel. Il permet de gérer facilement les données réparties sur plusieurs feuilles dans un fichier XLSX.

Voyons comment lire des fichiers Excel en Python à l'aide d'IronXL.

Comment lire des fichiers Excel en Python

Les étapes suivantes décrivent le processus de lecture des fichiers Excel en Python.

  1. Créez un fichier Python dans Visual Studio Code.
  2. Installez la bibliothèque Python Excel à l'aide de pip.
  3. Chargez le fichier Excel que nous devons lire.
  4. Parcourir les données Excel à l'aide de boucles
  5. Afficher les données itérées sur la console

Prérequis

Avant de commencer le tutoriel, assurez-vous d'avoir installé les prérequis suivants sur votre système :

  • Kit de développement logiciel .NET 6.0 : IronXL est basé sur .NET et nécessite l'installation du kit de développement logiciel .NET 6.0 sur votre système.
  • Python 3.0+ : Ce tutoriel suppose que vous avez installé Python 3.0 ou une version supérieure.
  • pip : Assurez-vous que pip, le gestionnaire de paquets de Python, est installé car il sera utilisé pour installer IronXL.

Configuration de votre environnement

1. Création d'un fichier dans Visual Studio Code

Ouvrez Visual Studio Code et créez un nouveau fichier Python nommé ReadExcel.py . Ce fichier contiendra notre script permettant de lire les fichiers Excel à l'aide d'IronXL.

Comment lire des fichiers Excel en Python : Figure 1

2. Installation d'IronXL

Ouvrez la ligne de commande dans Visual Studio Code en sélectionnant Terminal > New Terminal dans le menu.

Comment lire des fichiers Excel en Python : Figure 2

Installez IronXL en exécutant la commande suivante :

pip install ironxl
pip install ironxl
SHELL

Comment lire des fichiers Excel en Python : Figure 3

Écrire le code

À présent, décomposons le code en sections et expliquons chaque partie.

Importer les bibliothèques

from ironxl import *
import sys
from ironxl import *
import sys
PYTHON

Ici, nous importons tout depuis la bibliothèque ironxl , qui fournit les fonctionnalités nécessaires pour travailler avec des fichiers Excel. La commande sys permet de définir le chemin d'accès à Python, ce qui est nécessaire au bon fonctionnement d'IronXL.

Définir le chemin d'installation de Python

sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
PYTHON

sys.prefix se voit attribuer le chemin d'accès à votre répertoire d'installation Python. Cette étape préparatoire n'est peut-être pas nécessaire dans tous les environnements, mais elle est essentielle dans certaines configurations pour éviter les problèmes liés au chemin d'accès.

Définition de la clé de licence

License.LicenseKey = "License-Key"
License.LicenseKey = "License-Key"
PYTHON

La bibliothèque IronXL nécessite une clé de licence valide pour débloquer toutes ses fonctionnalités. C'est dans cette ligne de code , License.LicenseKey = "License-Key", que vous devez insérer votre clé de licence. Sans licence valide, IronXL ne fonctionnera pas.

Chargement du classeur

workbook = WorkBook.Load("data.xlsx")
workbook = WorkBook.Load("data.xlsx")
PYTHON

Cette section du script, workbook = WorkBook.Load("data.xlsx") , montre comment charger un classeur Excel. WorkBook.Load est une méthode fournie par IronXL pour ouvrir un fichier Excel existant, spécifié par son chemin d'accès.

L'exemple utilise le fichier " data.xlsx " , en supposant que ce fichier se trouve dans le même répertoire que le script. Si votre fichier se trouve ailleurs, vous devrez fournir le chemin d'accès complet.

Sélection d'une feuille de calcul

worksheet = workbook.WorkSheets[0]
worksheet = workbook.WorkSheets[0]
PYTHON

Après avoir chargé le classeur, l'étape suivante consiste à sélectionner une feuille de calcul. La ligne workbook.WorkSheets[0] permet d'accéder à la première feuille de calcul du fichier Excel. Les feuilles de calcul étant indexées à partir de 0, cet extrait de code sélectionne effectivement la première feuille.

Lecture et affichage des données

print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
PYTHON

Cette partie du script illustre comment lire et afficher les données de cellules spécifiques. En itérant sur une plage de cellules pour les cellules de la feuille de calcul ["A2:A5"] , nous accédons à l'adresse et à la valeur textuelle de chaque cellule. Vous pouvez extraire des informations à partir de zones prédéfinies dans une feuille.

Effectuer des calculs

IronXL propose des fonctions permettant d'effectuer des calculs simples directement sur des plages de données au sein d'une feuille Excel. Les sections de code suivantes montrent comment effectuer des calculs simples tels que la somme, le minimum et le maximum sur des données comprises dans une plage spécifiée.

total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)

minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)

maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)

minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)

maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
PYTHON

Trouver des valeurs uniques

Cette partie du script montre comment identifier les valeurs uniques dans une plage spécifiée d'une feuille Excel :

unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
PYTHON

Pour ce faire, on utilise une compréhension d'ensemble. En Python, les ensembles sont des collections qui éliminent automatiquement les doublons, ce qui les rend parfaits pour trouver des valeurs uniques. La compréhension itère sur chaque cellule de la plage F2:F10 , accédant au contenu textuel de chaque cellule à l'aide de cell.Text .

En plaçant cette itération dans un ensemble, nous nous assurons que seules les valeurs uniques sont conservées.

Comptage des occurrences d'une valeur spécifique

Enfin, cet extrait de code compte le nombre de fois qu'une valeur spécifique apparaît dans une plage donnée.

specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

L'objectif ici est de quantifier l'occurrence d'une valeur spécifique, désignée ici par specific_value . Le code utilise une expression génératrice qui parcourt chaque cellule de la plage G2:G10 , en comparant le contenu textuel de la cellule à specific_value .

L'expression cell.Text == specific_value renvoie **True pour chaque cellule contenant la valeur cible et False sinon. La fonction sum additionne ces valeurs booléennes, en considérant True comme 1 et False** comme 0, ce qui permet de compter le nombre d'occurrences de la valeur spécifique.

Exemple de code complet

Voici le code complet pour une meilleure compréhension du code :

from ironxl import *
import sys

# Setting Python installation path
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'

# Setting the license key for IronXL
License.LicenseKey = "License-Key"

# Load the workbook
workbook = WorkBook.Load("data.xlsx")

# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]

# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))

# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)

# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)

# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)

# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)

# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
from ironxl import *
import sys

# Setting Python installation path
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'

# Setting the license key for IronXL
License.LicenseKey = "License-Key"

# Load the workbook
workbook = WorkBook.Load("data.xlsx")

# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]

# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))

# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)

# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)

# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)

# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)

# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

Sortie

Après avoir exécuté le fichier Python ReadExcel.py , vous verrez la sortie suivante s'afficher dans votre console, reflétant les résultats des opérations effectuées par le script sur les données Excel.

Comment lire des fichiers Excel en Python : Figure 4

Conclusion

Dans ce tutoriel, nous avons exploré comment configurer un environnement Python pour utiliser IronXL afin de lire des fichiers Excel. Nous avons abordé l'installation du logiciel nécessaire, la rédaction du script pour charger un classeur Excel, sélectionner une feuille de calcul, lire les données, effectuer des opérations d'analyse de données de base, et bien plus encore.

IronXL fournit une API puissante pour travailler avec des fichiers Excel en Python, permettant des tâches d'analyse, de nettoyage et de visualisation des données sans avoir besoin de Microsoft Excel.

Que vous analysiez des données de vente, importiez des données pour des rapports ou créiez des visualisations à partir de données Excel, IronXL offre une solution robuste pour la gestion des fichiers Excel dans les applications Python.

IronXL propose un essai gratuit permettant aux utilisateurs de découvrir ses fonctionnalités, avec des licences à partir de $799 pour ceux qui sont prêts à intégrer pleinement ses capacités.

Questions Fréquemment Posées

Comment puis-je lire des fichiers Excel en Python sans Microsoft Excel ?

IronXL vous permet de lire des fichiers Excel en Python sans avoir besoin de Microsoft Excel sur votre système. Vous pouvez charger des classeurs en utilisant WorkBook.Load("data.xlsx") et accéder directement aux feuilles de calcul et aux données des cellules.

Quelle configuration est requise pour utiliser IronXL pour lire des fichiers Excel en Python ?

Pour utiliser IronXL, assurez-vous d'avoir .NET 6.0 SDK, Python 3.0 ou supérieur, et pip installés. Configurez votre environnement de codage dans Visual Studio Code pour commencer à travailler avec des fichiers Excel.

Comment installer IronXL en Python ?

Installez IronXL en exécutant la commande pip install ironxl dans votre terminal. Cela installe la bibliothèque, vous permettant de lire et manipuler des fichiers Excel.

Puis-je effectuer des opérations d'analyse de données sur des fichiers Excel en utilisant IronXL ?

Oui, IronXL prend en charge diverses opérations d'analyse de données, telles que calculer des sommes, trouver des valeurs minimales et maximales, et identifier des valeurs uniques dans les feuilles Excel.

Comment puis-je trouver des valeurs uniques dans une plage de cellules Excel en utilisant IronXL ?

Pour trouver des valeurs uniques, utilisez une compréhension de set pour itérer sur la plage de cellules et extraire des valeurs textuelles distinctes. Cette méthode identifie efficacement toutes les entrées uniques.

Est-il possible de compter des valeurs spécifiques dans Excel en utilisant IronXL ?

Oui, vous pouvez compter les occurrences d'une valeur spécifique en itérant à travers la plage de cellules avec une expression génératrice et en additionnant les instances où le texte de la cellule correspond à votre valeur cible.

Quels sont les avantages d'utiliser IronXL pour la manipulation d'Excel en Python ?

IronXL offre une API puissante pour la manipulation des fichiers Excel sans nécessiter Microsoft Excel. Il est idéal pour des tâches comme l'analyse de données, le nettoyage et la visualisation, améliorant la productivité dans les projets Python.

Comment écrire un script Python pour lire des fichiers Excel en utilisant IronXL ?

Créez un script Python appelé ReadExcel.py, importez les bibliothèques nécessaires, définissez votre chemin Python et utilisez les méthodes d'IronXL pour charger et interagir avec des classeurs Excel et des données.

Quelles opérations puis-je effectuer sur les données Excel en utilisant IronXL ?

IronXL permet diverses opérations telles que la lecture des valeurs des cellules, la sélection de feuilles de calcul, le calcul de sommes, la recherche de valeurs min/max, et le comptage d'occurrences spécifiques dans des plages de données Excel.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite