UTILISATION D'IRONXL POUR PYTHON

Comment lire des fichiers Excel en Python

Publié juin 6, 2024
Partager:

Travailler avec des fichiers Excel est une exigence courante dans les tâches d'analyse de données et d'automatisation. Python, avec sesun vaste ensemble de bibliothèquesle logiciel XLSX offre plusieurs façons d'interagir avec les fichiers XLSX. Dans ce tutoriel, nous allons apprendre à lire des fichiers Excel en utilisant la fonctionIronXLune bibliothèque Excel en Python.

IronXL : Bibliothèque Excel Python

IronXL for Python est conçu pour aider les développeurs à lire et écrire facilement des fichiers Excel en Python. Vous pouvez non seulement écrire des fichiers Excel, mais aussi travailler avec plusieurs feuilles Excel en une seule fois. Cette bibliothèque est parfaite pour écrire des fichiers Excel sans installer Microsoft Excel sur votre machine.

Lorsque vous devez importer des données directement dans une feuille de calcul Excel, IronXL vient à la rescousse. IronXL simplifie la manipulation des feuilles de calcul Excel. Il permet de gérer facilement les données de plusieurs feuilles d'un fichier XLSX.

Voyons comment nous pouvonslire des fichiers Excel en Python en utilisant IronXL.

Comment lire des fichiers Excel en Python

Les étapes suivantes décrivent le processus de lecture de fichiers Excel en Python.

  1. Créer un fichier Python dans le code Visual Studio.

  2. Installez la bibliothèque Excel de Python à l'aide de pip.

  3. Charger le fichier Excel que nous devons lire

  4. Interroger des données Excel à l'aide de boucles

  5. Afficher les données itérées sur la console

Conditions préalables

Avant de plonger dans le tutoriel, assurez-vous que les prérequis suivants sont installés sur votre système :

  • .NET 6.0 SDK : IronXL est construit sur .NET, ce qui nécessite l'installation du SDK .NET 6.0 sur votre système.
  • Python 3.0+ : Le tutoriel suppose que Python 3.0 ou une version plus récente est installé.
  • pip : Assurez-vous que pip, l'installateur de paquets de Python, est installé car il sera utilisé pour installer IronXL.

Mise en place de l'environnement

1. Création d'un fichier dans Visual Studio Code

Ouvrez Visual Studio Code et créez un nouveau fichier Python nommé ReadExcel.py. Ce fichier contiendra notre script pour lire les fichiers Excel à l'aide d'IronXL.

Comment lire des fichiers Excel en Python : Figure 1

2. Installation d'IronXL

Ouvrez la ligne de commande dans Visual Studio Code en sélectionnant Terminal > Nouveau terminal dans le menu.

Comment lire des fichiers Excel en Python : Figure 2

Installez IronXL en exécutant la commande suivante :

 pip install IronXL

Comment lire des fichiers Excel en Python : Figure 3

Rédiger le code

Maintenant, décomposons le code en sections et expliquons chaque partie.

Importation de bibliothèques

from ironxl import *     import sys
PYTHON

Ici, nous importons tout de la bibliothèque ironxl, qui fournit la fonctionnalité permettant de travailler avec des fichiers Excel. sys est utilisé pour définir le chemin d'accès où Python est installé, ce qui est nécessaire au bon fonctionnement d'IronXL.

Définition du chemin d'installation de Python

sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
PYTHON

sys.prefix se voit attribuer le chemin d'accès à votre répertoire d'installation de Python. Il s'agit d'une étape préparatoire qui n'est peut-être pas nécessaire dans tous les environnements, mais qui est essentielle dans certaines configurations pour éviter les problèmes liés au chemin d'accès.

Définition de la clé de licence

License.LicenseKey = "License-Key";
PYTHON

La bibliothèque IronXL nécessite un numéro d'identification valideclé de licence pour débloquer toutes ses fonctionnalités. Cette ligne de code License.LicenseKey = "License-Key"; est l'endroit où vous devez insérer la clé de licence que vous avez obtenue. Sans licence valide, IronXL ne fonctionnera pas.

Chargement du classeur

workbook = WorkBook.Load("data.xlsx")
PYTHON

Cette section du script, workbook = WorkBook.Load("data.xlsx"), montre comment charger un classeur Excel. WorkBook.Load est une méthode fournie par IronXL pour ouvrir un fichier Excel existant, spécifié par son chemin d'accès.

L'exemple utilise "data.xlsx ", en supposant que ce fichier se trouve dans le même répertoire que le script. Si votre fichier se trouve ailleurs, vous devrez fournir le chemin d'accès complet.

Sélection d'une feuille de calcul

worksheet = workbook.WorkSheets[0]
PYTHON

Après avoir chargé le classeur, l'étape suivante consiste à sélectionner une feuille de calcul. Le *livre de travail.feuilles de travail[0]la ligne * accède à la première feuille de calcul du fichier Excel. Les feuilles de calcul sont indexées à partir de 0, de sorte que cet extrait de code sélectionne effectivement la première feuille.

Lecture et affichage des données

print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
PYTHON

Cette partie du script montre comment lire et afficher des données provenant de cellules spécifiques. En itérant sur une plage de cellules pour les cellules de la feuille de calcul["A2:A5], nous pouvons accéder à l'adresse et à la valeur textuelle de chaque cellule. Vous pouvez récupérer des informations dans des zones prédéfinies d'une feuille.

Effectuer des calculs

IronXL propose des fonctions permettant d'effectuer des calculs simples directement sur les plages de données d'une feuille Excel. Les sections suivantes du code montrent comment effectuer des calculs simples tels que la somme, le minimum et le maximum sur des données comprises dans un intervalle spécifié.

total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
PYTHON

Trouver des valeurs uniques

Cette partie du script montre comment identifier des valeurs uniques dans une plage spécifiée d'une feuille Excel :

unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
PYTHON

Pour ce faire, on utilise une compréhension ensembliste. En Python, les ensembles sont des collections qui éliminent automatiquement les doublons, ce qui les rend parfaits pour trouver des valeurs uniques. La compréhension itère sur chaque cellule de la plage F2:F10, en accédant au contenu textuel de chaque cellule à l'aide de cell.Text.

En plaçant cette itération à l'intérieur d'un ensemble, nous nous assurons que seules les valeurs uniques sont conservées.

Compter les occurrences d'une valeur spécifique

Enfin, cet extrait compte le nombre de fois qu'une valeur spécifique apparaît dans un intervalle donné.

specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

L'objectif est de quantifier l'occurrence d'une valeur spécifique, appelée ici valeur_spécifique. Le code utilise une expression génératrice qui parcourt chaque cellule de la plage G2:G10, en comparant le contenu textuel de la cellule à valeur_spécifique.

L'expression cell.Text == specific_value est évaluée à True pour chaque cellule contenant la valeur cible et False dans le cas contraire. La fonction sum additionne ces valeurs booléennes, en considérant True comme 1 et False comme 0, comptant ainsi le nombre d'occurrences de la valeur spécifique.

Exemple de code complet

Voici le code complet pour une meilleure compréhension du code :

from ironxl import *     import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

Sortie

Après avoir exécuté le fichier Python ReadExcel.py, vous verrez s'afficher dans votre console la sortie suivante, qui reflète les résultats des opérations effectuées par le script sur les données Excel.

Comment lire des fichiers Excel en Python : Figure 4

Conclusion

Dans ce tutoriel, nous avons exploré comment configurer un environnement Python pour utiliser IronXL pour la lecture de fichiers Excel. Nous avons abordé l'installation du logiciel nécessaire, l'écriture du script pour charger un classeur Excel, sélectionner une feuille de calcul, lire les données, effectuer des opérations d'analyse de données de base, etc.

IronXL fournit une API puissante pour travailler avec des fichiers Excel en Python, permettant des tâches d'analyse, de nettoyage et de visualisation de données sans avoir besoin de Microsoft Excel.

Qu'il s'agisse d'analyser des données de vente, d'importer des données pour des rapports ou de créer des visualisations à partir de données Excel, IronXL offre une solution robuste pour la gestion des fichiers Excel dans les applications Python.

IronXL fournit uneessai gratuit pour que les utilisateurs puissent explorer ses fonctionnalités, avec des licences commençant à $749 pour ceux qui sont prêts à intégrer pleinement ses capacités.

< PRÉCÉDENT
Package Python pour les fichiers Excel (sans utiliser l'interopérabilité)
SUIVANT >
Comment visualiser un fichier Excel en Python

Prêt à commencer ? Version : 2024.11 vient de paraître

Téléchargement gratuit de tuyaux Voir les licences > ;