Tutoriel Python sur la lecture de fichiers Excel
Ce guide fournit aux développeurs Python des instructions pas à pas sur l'utilisation de la bibliothèque IronXL pour lire et éditer des documents Microsoft Excel.
IronXL est une bibliothèque complète de traitement de fichiers Excel qui prend en charge plusieurs langages de programmation, notamment.NET etPython les langages de programmation. Ce tutoriel se concentre spécifiquement sur l'utilisation d'IronXL pour les scripts Python afin de lire et d'éditer des documents Microsoft Excel.
Pour un tutoriel séparé sur la manière de lire et de modifier des documents Microsoft Excel dans des applications .NET, veuillez vous référer à ce qui suitici.
La lecture et la création de fichiers Excel en Python sont faciles grâce à la bibliothèque logicielle IronXL for Python.
Vue d'ensemble
Comment lire un fichier Excel en Python
- Télécharger la bibliothèque Python pour lire les fichiers Excel
- Charger et lire un fichier Excel (classeur)
- Créer un classeur Excel en CSV ou XLSX
- Modifier les valeurs d'une cellule dans une plage de cellules
- Valider les données d'une feuille de calcul
- Exporter des données à l'aide d'Entity Framework
Tutoriel
Étape 1 : Ajouter IronXL comme dépendance dans votre projet Python
Pour intégrer la bibliothèque IronXL dans votre projet Python, vous devez l'installer en tant que dépendance à l'aide de l'outil de gestion de paquets Python largement utilisé, pip. Ouvrez le terminal et exécutez la commande suivante :
pip install IronXL
Ceci installera la version spécifiée d'IronXL dans votre projet, la rendant accessible pour l'importation.
[{i :(IronXL for Python s'appuie sur la bibliothèque IronXL for .NET, en particulier .NET 6.0, en tant que technologie sous-jacente. Il est donc nécessaire d'avoir le.NET 6.0 SDK installé sur votre machine afin d'utiliser IronXL pour Python.)}]
2. Charger un classeur Excel
La classe WorkBook
représente une feuille Excel. Pour ouvrir un fichier Excel, nous utilisons la méthode WorkBook.Load
, en spécifiant le chemin du fichier Excel.
# Load existing spreadsheet
workbook = WorkBook.Load("Spreadsheets\\GDP.xlsx")
Chaque WorkBook
peut avoir plusieurs objets WorkSheet
. Chacune représente une seule feuille de calcul Excel dans le document Excel. Utilisez la méthode WorkBook.GetWorkSheet
pour récupérer une référence à une feuille de calcul Excel spécifique.
# Assuming workBook is an existing instance of WorkBook
workSheet = workBook.GetWorkSheet("GDPByCountry")
Création de nouveaux documents Excel
Pour créer un nouveau document Excel, construisez un nouvel objet WorkBook
avec un type de fichier valide.
# Create a new WorkBook with the specified Excel file format
workBook = WorkBook(ExcelFileFormat.XLSX)
Note : Utilisez ExcelFileFormat.XLS
pour supporter les anciennes versions de Microsoft Excel(95 et antérieures).
Ajouter une feuille de calcul à un document Excel
Comme expliqué précédemment, un WorkBook
d'IronXL for Python contient une collection d'une ou plusieurs WorkSheet
.
Pour créer une nouvelle feuille de travail, appelez WorkBook.CreateWorkSheet
avec le nom de la feuille de travail.
workSheet = workBook.CreateWorkSheet("GDPByCountry")
3. Accéder aux valeurs des cellules
Lire et éditer une seule cellule
L'accès aux valeurs des cellules individuelles d'une feuille de calcul s'effectue en récupérant la cellule souhaitée à partir de sa "feuille de travail", comme indiqué ci-dessous :
# Load existing spreadsheet
workbook = WorkBook.Load("test.xlsx")
worksheet = workbook.DefaultWorkSheet
# Access cell B1 in the worksheet
cell = worksheet["B1"]
IronXL for Python's Cell
class représente une cellule inviduelle dans une feuille de calcul Excel. Elle contient des propriétés et des méthodes qui permettent aux utilisateurs d'accéder à la valeur de la cellule et de la modifier directement.
Chaque objet WorkSheet
gère un index d'objets Cell
correspondant à chaque valeur de cellule dans une feuille de calcul Excel. Dans le code source ci-dessus, nous référençons la cellule souhaitée par son index de ligne et de colonne(cellule B1 dans ce cas) en utilisant la syntaxe standard d'indexation des tableaux.
Avec une référence à l'objet Cell, nous pouvons lire et écrire des données dans une cellule de feuille de calcul :
# Access cell B1 in the worksheet
cell = workSheet["B1"]
# Read the value of the cell as a string
value = cell.StringValue
print(value)
# Write a new value to the cell
cell.Value = "10.3289"
print(cell.StringValue)
Lire et écrire une plage de valeurs de cellules
La classe Range
représente une collection bidimensionnelle d'objets Cell
. Cette collection fait référence à une plage littérale de cellules Excel. Obtenir des plages en utilisant l'indexeur de chaînes sur un objet WorkSheet
.
L'argument texte est soit la coordonnée d'une cellule(par exemple "A1", comme indiqué précédemment) ou une série de cellules de gauche à droite, de haut en bas(par exemple "B2:E5"). Il est également possible d'appeler GetRange
sur une WorkSheet
.
# Access range D2:D101 in the worksheet
range_ = workSheet["D2:D101"]
Ajouter une formule à une feuille de calcul
Définir la formule des Cell
s avec la propriété Formula
.
Le code ci-dessous parcourt chaque État et inscrit un pourcentage total dans la colonne C.
# Iterate through all rows with a value
for y in range(2, i):
# Get the C cell
cell = workSheet[f"C{y}"]
# Set the formula for the Percentage of Total column
cell.Formula = f"=B{y}/B{i}"
Résumé
IronXL.Excel est une bibliothèque Python autonome permettant de lire une grande variété de formats de feuilles de calcul. Il ne nécessite pasMicrosoft Excel et ne dépend pas d'Interop.