Test dans un environnement réel
Test en production sans filigrane.
Fonctionne partout où vous en avez besoin.
Travailler avec des fichiers Excel est une exigence courante dans les tâches d'analyse de données et d'automatisation. Python, avec sesun vaste ensemble de bibliothèquesle logiciel XLSX offre plusieurs façons d'interagir avec les fichiers XLSX. Dans ce tutoriel, nous allons apprendre à lire des fichiers Excel en utilisant la fonctionIronXLune bibliothèque Excel en Python.
IronXL for Python est conçu pour aider les développeurs à lire et écrire facilement des fichiers Excel en Python. Vous pouvez non seulement écrire des fichiers Excel, mais aussi travailler avec plusieurs feuilles Excel en une seule fois. Cette bibliothèque est parfaite pour écrire des fichiers Excel sans installer Microsoft Excel sur votre machine.
Lorsque vous devez importer des données directement dans une feuille de calcul Excel, IronXL vient à la rescousse. IronXL simplifie la manipulation des feuilles de calcul Excel. Il permet de gérer facilement les données de plusieurs feuilles d'un fichier XLSX.
Voyons comment nous pouvonslire des fichiers Excel en Python en utilisant IronXL.
Les étapes suivantes décrivent le processus de lecture de fichiers Excel en Python.
Créer un fichier Python dans le code Visual Studio.
Installez la bibliothèque Excel de Python à l'aide de pip.
Charger le fichier Excel que nous devons lire
Interroger des données Excel à l'aide de boucles
Avant de plonger dans le tutoriel, assurez-vous que les prérequis suivants sont installés sur votre système :
Ouvrez Visual Studio Code et créez un nouveau fichier Python nommé ReadExcel.py. Ce fichier contiendra notre script pour lire les fichiers Excel à l'aide d'IronXL.
Ouvrez la ligne de commande dans Visual Studio Code en sélectionnant Terminal > Nouveau terminal dans le menu.
Installez IronXL en exécutant la commande suivante :
pip install IronXL
Maintenant, décomposons le code en sections et expliquons chaque partie.
from ironxl import * import sys
Ici, nous importons tout de la bibliothèque ironxl, qui fournit la fonctionnalité permettant de travailler avec des fichiers Excel. sys est utilisé pour définir le chemin d'accès où Python est installé, ce qui est nécessaire au bon fonctionnement d'IronXL.
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
sys.prefix se voit attribuer le chemin d'accès à votre répertoire d'installation de Python. Il s'agit d'une étape préparatoire qui n'est peut-être pas nécessaire dans tous les environnements, mais qui est essentielle dans certaines configurations pour éviter les problèmes liés au chemin d'accès.
License.LicenseKey = "License-Key";
La bibliothèque IronXL nécessite un numéro d'identification valideclé de licence pour débloquer toutes ses fonctionnalités. Cette ligne de code License.LicenseKey = "License-Key"; est l'endroit où vous devez insérer la clé de licence que vous avez obtenue. Sans licence valide, IronXL ne fonctionnera pas.
workbook = WorkBook.Load("data.xlsx")
Cette section du script, workbook = WorkBook.Load("data.xlsx"), montre comment charger un classeur Excel. WorkBook.Load est une méthode fournie par IronXL pour ouvrir un fichier Excel existant, spécifié par son chemin d'accès.
L'exemple utilise "data.xlsx ", en supposant que ce fichier se trouve dans le même répertoire que le script. Si votre fichier se trouve ailleurs, vous devrez fournir le chemin d'accès complet.
worksheet = workbook.WorkSheets[0]
Après avoir chargé le classeur, l'étape suivante consiste à sélectionner une feuille de calcul. Le *livre de travail.feuilles de travail[0]la ligne * accède à la première feuille de calcul du fichier Excel. Les feuilles de calcul sont indexées à partir de 0, de sorte que cet extrait de code sélectionne effectivement la première feuille.
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
Cette partie du script montre comment lire et afficher des données provenant de cellules spécifiques. En itérant sur une plage de cellules pour les cellules de la feuille de calcul["A2:A5], nous pouvons accéder à l'adresse et à la valeur textuelle de chaque cellule. Vous pouvez récupérer des informations dans des zones prédéfinies d'une feuille.
IronXL propose des fonctions permettant d'effectuer des calculs simples directement sur les plages de données d'une feuille Excel. Les sections suivantes du code montrent comment effectuer des calculs simples tels que la somme, le minimum et le maximum sur des données comprises dans un intervalle spécifié.
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
Cette partie du script montre comment identifier des valeurs uniques dans une plage spécifiée d'une feuille Excel :
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
Pour ce faire, on utilise une compréhension ensembliste. En Python, les ensembles sont des collections qui éliminent automatiquement les doublons, ce qui les rend parfaits pour trouver des valeurs uniques. La compréhension itère sur chaque cellule de la plage F2:F10, en accédant au contenu textuel de chaque cellule à l'aide de cell.Text.
En plaçant cette itération à l'intérieur d'un ensemble, nous nous assurons que seules les valeurs uniques sont conservées.
Enfin, cet extrait compte le nombre de fois qu'une valeur spécifique apparaît dans un intervalle donné.
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
L'objectif est de quantifier l'occurrence d'une valeur spécifique, appelée ici valeur_spécifique. Le code utilise une expression génératrice qui parcourt chaque cellule de la plage G2:G10, en comparant le contenu textuel de la cellule à valeur_spécifique.
L'expression cell.Text == specific_value est évaluée à True pour chaque cellule contenant la valeur cible et False dans le cas contraire. La fonction sum additionne ces valeurs booléennes, en considérant True comme 1 et False comme 0, comptant ainsi le nombre d'occurrences de la valeur spécifique.
Voici le code complet pour une meilleure compréhension du code :
from ironxl import * import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
Après avoir exécuté le fichier Python ReadExcel.py, vous verrez s'afficher dans votre console la sortie suivante, qui reflète les résultats des opérations effectuées par le script sur les données Excel.
Dans ce tutoriel, nous avons exploré comment configurer un environnement Python pour utiliser IronXL pour la lecture de fichiers Excel. Nous avons abordé l'installation du logiciel nécessaire, l'écriture du script pour charger un classeur Excel, sélectionner une feuille de calcul, lire les données, effectuer des opérations d'analyse de données de base, etc.
IronXL fournit une API puissante pour travailler avec des fichiers Excel en Python, permettant des tâches d'analyse, de nettoyage et de visualisation de données sans avoir besoin de Microsoft Excel.
Qu'il s'agisse d'analyser des données de vente, d'importer des données pour des rapports ou de créer des visualisations à partir de données Excel, IronXL offre une solution robuste pour la gestion des fichiers Excel dans les applications Python.
IronXL fournit uneessai gratuit pour que les utilisateurs puissent explorer ses fonctionnalités, avec des licences commençant à $749 pour ceux qui sont prêts à intégrer pleinement ses capacités.
9 produits de l'API .NET pour vos documents de bureau