from ironxl import *
# Supported for XLSX, XLS, XLSM, XLTX, CSV, and TSV
workbook = WorkBook.Load("sample.xlsx")
# Select worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Get any existing worksheet
first_sheet = workbook.DefaultWorkSheet
# Select a cell and return the converted value
cell_value = worksheet["A2"].IntValue
# Read from ranges of cells elegantly.
for cell in worksheet["A2:A10"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate aggregate values such as Min, and Sum
total_sum = worksheet["A2:A10"].Sum()
Travailler avec des fichiers Excel est une exigence courante dans les tâches d'analyse de données et d'automatisation. Python, avec sesun vaste ensemble de bibliothèquesle logiciel XLSX offre plusieurs façons d'interagir avec les fichiers XLSX. Dans ce tutoriel, nous allons apprendre à lire des fichiers Excel en utilisant la fonctionIronXLune bibliothèque Excel en Python.
IronXL : Bibliothèque Excel Python
IronXL for Python est conçu pour aider les développeurs à lire et écrire facilement des fichiers Excel en Python. Vous pouvez non seulement écrire des fichiers Excel, mais aussi travailler avec plusieurs feuilles Excel en une seule fois. Cette bibliothèque est parfaite pour écrire des fichiers Excel sans installer Microsoft Excel sur votre machine.
Lorsque vous devez importer des données directement dans une feuille de calcul Excel, IronXL vient à la rescousse. IronXL simplifie la manipulation des feuilles de calcul Excel. Il permet de gérer facilement les données de plusieurs feuilles d'un fichier XLSX.
Les étapes suivantes décrivent le processus de lecture de fichiers Excel en Python.
Créer un fichier Python dans le code Visual Studio.
Installez la bibliothèque Excel de Python à l'aide de pip.
Charger le fichier Excel que nous devons lire
Interroger des données Excel à l'aide de boucles
Afficher les données itérées sur la console
Conditions préalables
Avant de plonger dans le tutoriel, assurez-vous que les prérequis suivants sont installés sur votre système :
.NET 6.0 SDK : IronXL est construit sur .NET, ce qui nécessite l'installation du SDK .NET 6.0 sur votre système.
Python 3.0+ : Le tutoriel suppose que Python 3.0 ou une version plus récente est installé.
pip : Assurez-vous que pip, l'installateur de paquets de Python, est installé car il sera utilisé pour installer IronXL.
Mise en place de l'environnement
1. Création d'un fichier dans Visual Studio Code
Ouvrez Visual Studio Code et créez un nouveau fichier Python nommé ReadExcel.py. Ce fichier contiendra notre script pour lire les fichiers Excel à l'aide d'IronXL.
2. Installation d'IronXL
Ouvrez la ligne de commande dans Visual Studio Code en sélectionnant Terminal > Nouveau terminal dans le menu.
Installez IronXL en exécutant la commande suivante :
pip install IronXL
Rédiger le code
Maintenant, décomposons le code en sections et expliquons chaque partie.
Importation de bibliothèques
from ironxl import * import sys
from ironxl import * import sys
PYTHON
Ici, nous importons tout de la bibliothèque ironxl, qui fournit la fonctionnalité permettant de travailler avec des fichiers Excel. sys est utilisé pour définir le chemin d'accès où Python est installé, ce qui est nécessaire au bon fonctionnement d'IronXL.
sys.prefix se voit attribuer le chemin d'accès à votre répertoire d'installation de Python. Il s'agit d'une étape préparatoire qui n'est peut-être pas nécessaire dans tous les environnements, mais qui est essentielle dans certaines configurations pour éviter les problèmes liés au chemin d'accès.
Définition de la clé de licence
License.LicenseKey = "License-Key";
License.LicenseKey = "License-Key";
PYTHON
La bibliothèque IronXL nécessite un numéro d'identification valideclé de licence pour débloquer toutes ses fonctionnalités. Cette ligne de code License.LicenseKey = "License-Key"; est l'endroit où vous devez insérer la clé de licence que vous avez obtenue. Sans licence valide, IronXL ne fonctionnera pas.
Chargement du classeur
workbook = WorkBook.Load("data.xlsx")
workbook = WorkBook.Load("data.xlsx")
PYTHON
Cette section du script, workbook = WorkBook.Load("data.xlsx"), montre comment charger un classeur Excel. WorkBook.Load est une méthode fournie par IronXL pour ouvrir un fichier Excel existant, spécifié par son chemin d'accès.
L'exemple utilise "data.xlsx ", en supposant que ce fichier se trouve dans le même répertoire que le script. Si votre fichier se trouve ailleurs, vous devrez fournir le chemin d'accès complet.
Sélection d'une feuille de calcul
worksheet = workbook.WorkSheets[0]
worksheet = workbook.WorkSheets[0]
PYTHON
Après avoir chargé le classeur, l'étape suivante consiste à sélectionner une feuille de calcul. Le *livre de travail.feuilles de travail[0]la ligne * accède à la première feuille de calcul du fichier Excel. Les feuilles de calcul sont indexées à partir de 0, de sorte que cet extrait de code sélectionne effectivement la première feuille.
Lecture et affichage des données
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
PYTHON
Cette partie du script montre comment lire et afficher des données provenant de cellules spécifiques. En itérant sur une plage de cellules pour les cellules de la feuille de calcul["A2:A5], nous pouvons accéder à l'adresse et à la valeur textuelle de chaque cellule. Vous pouvez récupérer des informations dans des zones prédéfinies d'une feuille.
Effectuer des calculs
IronXL propose des fonctions permettant d'effectuer des calculs simples directement sur les plages de données d'une feuille Excel. Les sections suivantes du code montrent comment effectuer des calculs simples tels que la somme, le minimum et le maximum sur des données comprises dans un intervalle spécifié.
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
PYTHON
Trouver des valeurs uniques
Cette partie du script montre comment identifier des valeurs uniques dans une plage spécifiée d'une feuille Excel :
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
PYTHON
Pour ce faire, on utilise une compréhension ensembliste. En Python, les ensembles sont des collections qui éliminent automatiquement les doublons, ce qui les rend parfaits pour trouver des valeurs uniques. La compréhension itère sur chaque cellule de la plage F2:F10, en accédant au contenu textuel de chaque cellule à l'aide de cell.Text.
En plaçant cette itération à l'intérieur d'un ensemble, nous nous assurons que seules les valeurs uniques sont conservées.
Compter les occurrences d'une valeur spécifique
Enfin, cet extrait compte le nombre de fois qu'une valeur spécifique apparaît dans un intervalle donné.
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON
L'objectif est de quantifier l'occurrence d'une valeur spécifique, appelée ici valeur_spécifique. Le code utilise une expression génératrice qui parcourt chaque cellule de la plage G2:G10, en comparant le contenu textuel de la cellule à valeur_spécifique.
L'expression cell.Text == specific_value est évaluée à True pour chaque cellule contenant la valeur cible et False dans le cas contraire. La fonction sum additionne ces valeurs booléennes, en considérant True comme 1 et False comme 0, comptant ainsi le nombre d'occurrences de la valeur spécifique.
Exemple de code complet
Voici le code complet pour une meilleure compréhension du code :
from ironxl import * import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
from ironxl import * import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON
Sortie
Après avoir exécuté le fichier Python ReadExcel.py, vous verrez s'afficher dans votre console la sortie suivante, qui reflète les résultats des opérations effectuées par le script sur les données Excel.
Conclusion
Dans ce tutoriel, nous avons exploré comment configurer un environnement Python pour utiliser IronXL pour la lecture de fichiers Excel. Nous avons abordé l'installation du logiciel nécessaire, l'écriture du script pour charger un classeur Excel, sélectionner une feuille de calcul, lire les données, effectuer des opérations d'analyse de données de base, etc.
IronXL fournit une API puissante pour travailler avec des fichiers Excel en Python, permettant des tâches d'analyse, de nettoyage et de visualisation de données sans avoir besoin de Microsoft Excel.
Qu'il s'agisse d'analyser des données de vente, d'importer des données pour des rapports ou de créer des visualisations à partir de données Excel, IronXL offre une solution robuste pour la gestion des fichiers Excel dans les applications Python.
IronXL fournit uneessai gratuit pour que les utilisateurs puissent explorer ses fonctionnalités, avec des licences commençant à $749 pour ceux qui sont prêts à intégrer pleinement ses capacités.
Regan est diplômé de l'université de Reading, où il a obtenu une licence en ingénierie électronique. Avant de rejoindre Iron Software, il s'était concentré sur une seule tâche. Ce qu'il apprécie le plus chez Iron Software, c'est la diversité des tâches qu'il peut accomplir, qu'il s'agisse d'apporter une valeur ajoutée aux ventes, à l'assistance technique, au développement de produits ou à la commercialisation. Il aime comprendre comment les développeurs utilisent la bibliothèque d'Iron Software et utiliser ces connaissances pour améliorer continuellement la documentation et développer les produits.
< PRÉCÉDENT Package Python pour les fichiers Excel (sans utiliser l'interopérabilité)
SUIVANT > Comment visualiser un fichier Excel en Python