from ironxl import *
# Supported for XLSX, XLS, XLSM, XLTX, CSV, and TSV
workbook = WorkBook.Load("sample.xlsx")
# Select worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Get any existing worksheet
first_sheet = workbook.DefaultWorkSheet
# Select a cell and return the converted value
cell_value = worksheet["A2"].IntValue
# Read from ranges of cells elegantly.
for cell in worksheet["A2:A10"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate aggregate values such as Min, and Sum
total_sum = worksheet["A2:A10"].Sum()
Travailler avec des fichiers Excel est une exigence courante dans les tâches d'analyse de données et d'automatisation. Python, avec son ensemble étendu de bibliothèques, offre différentes manières d'interagir avec les fichiers XLSX. Dans ce tutoriel, nous allons apprendre à lire des fichiers Excel en utilisant IronXL, une bibliothèque Excel pour Python.
IronXL : Bibliothèque Excel Python
IronXL Python est conçu pour aider les développeurs à lire et écrire facilement des fichiers Excel en Python. Vous pouvez non seulement écrire des fichiers Excel, mais aussi travailler avec plusieurs feuilles Excel en une seule fois. Cette bibliothèque est parfaite pour écrire des fichiers Excel sans installer Microsoft Excel sur votre machine.
Lorsque vous devez importer des données directement dans une feuille de calcul Excel, IronXL vient à la rescousse. IronXL simplifie la manipulation des feuilles de calcul Excel. Il permet de gérer facilement les données de plusieurs feuilles d'un fichier XLSX.
Les étapes suivantes décrivent le processus de lecture de fichiers Excel en Python.
Créer un fichier Python dans le code Visual Studio.
Installez la bibliothèque Excel de Python à l'aide de pip.
Charger le fichier Excel que nous devons lire
Interroger des données Excel à l'aide de boucles
Afficher les données itérées sur la console
Conditions préalables
Avant de plonger dans le tutoriel, assurez-vous que les prérequis suivants sont installés sur votre système :
.NET 6.0 SDK : IronXL est construit sur .NET, nécessitant l'installation du SDK .NET 6.0 sur votre système.
Python 3.0+ : Le tutoriel suppose que vous avez Python 3.0 ou une version supérieure installée.
pip : Assurez-vous que pip, l'installateur de packages de Python, est installé car il sera utilisé pour installer IronXL.
Mise en place de l'environnement
1. Création d'un fichier dans Visual Studio Code
Ouvrez Visual Studio Code et créez un nouveau fichier Python nommé ReadExcel.py. Ce fichier contiendra notre script pour lire les fichiers Excel à l'aide d'IronXL.
2. Installation d'IronXL
Ouvrez la ligne de commande dans Visual Studio Code en sélectionnant Terminal > Nouveau terminal dans le menu.
Installez IronXL en exécutant la commande suivante :
pip install IronXL
Rédiger le code
Maintenant, décomposons le code en sections et expliquons chaque partie.
Importation de bibliothèques
from ironxl import * import sys
from ironxl import * import sys
PYTHON
Ici, nous importons tout de la bibliothèque ironxl, qui offre la fonctionnalité pour travailler avec des fichiers Excel. sys est utilisé pour définir le chemin où Python est installé, ce qui est nécessaire pour que IronXL fonctionne correctement.
sys.prefix est attribué au chemin du répertoire d'installation de votre Python. Il s'agit d'une étape préparatoire qui n'est peut-être pas nécessaire dans tous les environnements, mais qui est essentielle dans certaines configurations pour éviter les problèmes liés au chemin d'accès.
Définition de la clé de licence
License.LicenseKey = "License-Key";
License.LicenseKey = "License-Key";
PYTHON
La bibliothèque IronXL nécessite une clé de licence valide pour débloquer toutes ses fonctionnalités. Cette ligne de code License.LicenseKey = "License-Key"; est l'endroit où vous inséreriez votre clé de licence obtenue. Sans licence valide, IronXL ne fonctionnera pas.
Chargement du classeur
workbook = WorkBook.Load("data.xlsx")
workbook = WorkBook.Load("data.xlsx")
PYTHON
Cette section du script, workbook = WorkBook.Load("data.xlsx"), démontre comment charger un classeur Excel. WorkBook.Load est une méthode fournie par IronXL pour ouvrir un fichier Excel existant, spécifié par son chemin de fichier.
L'exemple utilise "data.xlsx", en supposant que ce fichier se trouve dans le même répertoire que le script. Si votre fichier se trouve ailleurs, vous devrez fournir le chemin d'accès complet.
Sélection d'une feuille de calcul
worksheet = workbook.WorkSheets[0]
worksheet = workbook.WorkSheets[0]
PYTHON
Après avoir chargé le classeur, l'étape suivante consiste à sélectionner une feuille de calcul. La ligne workbook.WorkSheets[0] accède à la première feuille de calcul dans le fichier Excel. Les feuilles de calcul sont indexées à partir de 0, donc cet extrait de code sélectionne effectivement la première feuille.
Lecture et affichage des données
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
PYTHON
Cette partie du script montre comment lire et afficher des données provenant de cellules spécifiques. En itérant sur une plage de cellules pour les cellules de la feuille de calcul["A2:A5"], nous pouvons accéder à l'adresse de chaque cellule et à sa valeur textuelle. Vous pouvez récupérer des informations dans des zones prédéfinies d'une feuille.
Effectuer des calculs
IronXL propose des fonctions permettant d'effectuer des calculs simples directement sur les plages de données d'une feuille Excel. Les sections suivantes du code montrent comment effectuer des calculs simples tels que la somme, le minimum et le maximum sur des données comprises dans un intervalle spécifié.
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
PYTHON
Trouver des valeurs uniques
Cette partie du script montre comment identifier des valeurs uniques dans une plage spécifiée d'une feuille Excel :
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
PYTHON
Pour ce faire, on utilise une compréhension ensembliste. En Python, les ensembles sont des collections qui éliminent automatiquement les doublons, ce qui les rend parfaits pour trouver des valeurs uniques. La compréhension itère sur chaque cellule dans la plage F2:F10, accédant au contenu texte de chaque cellule en utilisant cell.Text.
En plaçant cette itération à l'intérieur d'un ensemble, nous nous assurons que seules les valeurs uniques sont conservées.
Compter les occurrences d'une valeur spécifique
Enfin, cet extrait compte le nombre de fois qu'une valeur spécifique apparaît dans un intervalle donné.
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON
L'objectif ici est de quantifier l'occurrence d'une valeur spécifique, intitulée ici specific_value. Le code utilise une expression génératrice qui itère sur chaque cellule de la plage G2:G10, en comparant le contenu texte de la cellule à specific_value.
L'expression cell.Text == specific_value s'évalue à Vrai pour chaque cellule contenant la valeur cible et à Faux sinon. La fonction sum ajoute ces valeurs booléennes, considérant Vrai comme 1 et Faux comme 0, comptant ainsi le nombre de fois où la valeur spécifique apparaît.
Exemple de code complet
Voici le code complet pour une meilleure compréhension du code :
from ironxl import * import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
from ironxl import * import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON
Sortie
Après avoir exécuté le fichier Python ReadExcel.py, vous verrez l'affichage suivant dans votre console, qui reflète les résultats des opérations effectuées par le script sur les données Excel.
Conclusion
Dans ce tutoriel, nous avons exploré comment configurer un environnement Python pour utiliser IronXL pour la lecture de fichiers Excel. Nous avons abordé l'installation du logiciel nécessaire, l'écriture du script pour charger un classeur Excel, sélectionner une feuille de calcul, lire les données, effectuer des opérations d'analyse de données de base, etc.
IronXL fournit une API puissante pour travailler avec des fichiers Excel en Python, permettant des tâches d'analyse, de nettoyage et de visualisation de données sans avoir besoin de Microsoft Excel.
Qu'il s'agisse d'analyser des données de vente, d'importer des données pour des rapports ou de créer des visualisations à partir de données Excel, IronXL offre une solution robuste pour la gestion des fichiers Excel dans les applications Python.
IronXL propose un essai gratuit pour que les utilisateurs puissent explorer ses fonctionnalités, avec des licences à partir de $749 pour ceux prêts à intégrer pleinement ses capacités.
Chaknith travaille sur IronXL et IronBarcode. Il possède une expertise approfondie en C# et .NET, aidant à améliorer le logiciel et à soutenir les clients. Ses idées issues des interactions avec les utilisateurs contribuent à de meilleurs produits, une documentation améliorée et une expérience globale enrichie.
< PRÉCÉDENT Package Python pour les fichiers Excel (sans utiliser l'interopérabilité)
SUIVANT > Comment visualiser un fichier Excel en Python