from ironxl import *
# Supported for XLSX, XLS, XLSM, XLTX, CSV, and TSV
workbook = WorkBook.Load("sample.xlsx")
# Select worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Get any existing worksheet
first_sheet = workbook.DefaultWorkSheet
# Select a cell and return the converted value
cell_value = worksheet["A2"].IntValue
# Read from ranges of cells elegantly.
for cell in worksheet["A2:A10"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate aggregate values such as Min, and Sum
total_sum = worksheet["A2:A10"].Sum()
Lire un fichier Excel en Python sans Pandas (interopérabilité non requise)
Chaknith Bin
janvier 14, 2025
Partager:
Introduction
Lire les fichiers Microsoft Excel en Python est une compétence essentielle pour diverses tâches liées aux données et est devenu une pratique standard dans des domaines tels que la science des données, l'analyse de données, l'intelligence d'affaires et l'automatisation. Excel est l'un des outils les plus couramment utilisés pour stocker et organiser des données grâce à son interface conviviale et ses nombreuses fonctionnalités. Lorsqu'il s'agit de Microsoft Excel, pandas est la première bibliothèque qui vient à l'esprit, mais il existe d'autres bibliothèques robustes comme IronXL qui offrent performance et rapidité.
IronXL pour Python est une bibliothèque robuste conçue pour travailler avec des fichiers Excel. Il permet aux développeurs de créer, lire, analyser des données et manipuler des feuilles de calcul Excel de manière transparente. Les principaux avantages de l'utilisation d'IronXL incluent sa facilité d'utilisation, ses puissantes fonctionnalités, et le fait qu'il ne nécessite pas l'installation de Microsoft Excel sur le serveur.
Comment lire un fichier Excel en Python sans utiliser Pandas avec IronXL.
Étape 1 : Importez la bibliothèque IronXL.
Étape 2 : Ajouter la clé de licence.
Étape 3 : Charger le fichier Excel.
Étape 4 : Lire les fichiers Excel à l'aide d'IronXL.
Présentation d'IronXL
IronXL offre des fonctionnalités robustes pour la gestion des fichiers Excel, y compris la prise en charge de plusieurs feuilles, le formatage des cellules, la lecture et l'écriture de différents formats de fichiers (comme .xlsx et .xls), et le travail avec de grands ensembles de données, ce qui en fait un outil polyvalent pour les tâches de manipulation de données.
Principales caractéristiques de la bibliothèque IronXL pour Python
Gestion facile des fichiers Excel : IronXL simplifie le processus de lecture, d'écriture et d'édition de fichiers Excel en Python. En utilisant IronXL, vous pouvez manipuler des fichiers Excel et les enregistrer facilement. Il prend également en charge les fichiers CSV, les fichiers XLS.
Prise en charge de plusieurs feuilles : IronXL peut facilement lire et écrire des données sur plusieurs feuilles au sein d'un seul classeur Excel. Ceci est idéal lorsque l'on traite des fichiers Excel contenant différents types de données ou de rapports répartis sur plusieurs feuilles.
Lire et écrire des données :
Lecture des données : IronXL vous permet d'accéder à des cellules individuelles ou à des lignes et colonnes entières dans un fichier Excel. Il prend en charge la lecture des valeurs de tous les types de cellules, y compris le texte, les chiffres et les dates.
Écriture de données : La bibliothèque prend en charge l'écriture de fichiers Excel, que vous ayez besoin de mettre à jour des cellules existantes ou d'ajouter de nouvelles données au fichier. Elle prend également en charge le format CSV sans importer de CSV, ainsi que les fichiers XLSX.
Formatage des cellules : IronXL offre la possibilité de formater les cellules Excel. Vous pouvez définir la couleur du texte, la taille de la police, les bordures et d'autres styles visuels directement dans le script Python. Cela est utile pour créer des rapports avec un formatage spécifique ou lorsque vous devez mettre en évidence certains points de données.
Compatibilité avec divers formats Excel : IronXL peut gérer plusieurs formats de fichiers Excel, y compris le format de fichier .xlsx, le format de fichier .xls et le format de fichier .csv. Cela en fait un choix polyvalent pour interagir avec des fichiers Excel partagés ou exportés à partir de divers systèmes.
Prise en charge des fichiers volumineux : IronXL est optimisé pour gérer de grands fichiers Excel avec de nombreuses lignes et colonnes, ce qui le rend adapté aux tâches d'analyse de données impliquant des ensembles de données massifs.
Multi-plateforme : Bien que IronXL soit construit sur des technologies .NET, il est multi-plateforme et peut être utilisé sous Windows, macOS et Linux via Python.
Étape 1 : Importer la bibliothèque IronXL
Importez IronXL en utilisant le gestionnaire de packages Python pour lire les données des feuilles de calcul Excel
pip install ironxl
L'étape suivante consiste à importer les bibliothèques nécessaires depuis IronXL :
from ironxl import License, WorkBook, WorkSheet
from ironxl import License, WorkBook, WorkSheet
PYTHON
Étape 2 : Ajouter la clé de licence
IronXL nécessite une clé de licence, obtenez votre licence gratuite depuis ici et placez la licence en haut du code.
License.LicenseKey = "Your Key"
License.LicenseKey = "Your Key"
PYTHON
Étape 3 : Charger le fichier Excel
Chargez le fichier Excel en utilisant la fonction WorkBook.Load(). Cette méthode retourne un objet Workbook, qui représente l'ensemble du fichier Excel.
workbook = WorkBook.Load('sample.xlsx')
workbook = WorkBook.Load('sample.xlsx')
PYTHON
Étape 4 : Lire les fichiers Excel en utilisant IronXL
Utilisez maintenant l'objet workbook pour lire les feuilles, puis lisez les données dans les feuilles.
for sheet in workbook.WorkSheets:
print(f"Sheet Name: {sheet.Name}")
for row in sheet.Rows:
print([cell.Value for cell in row]) # excel data
for sheet in workbook.WorkSheets:
print(f"Sheet Name: {sheet.Name}")
for row in sheet.Rows:
print([cell.Value for cell in row]) # excel data
PYTHON
Code complet
Fichier Excel d'entrée
from ironxl import License, WorkBook, WorkSheet
License.LicenseKey = "Your Key"
# Load the Excel workbook
workbook = WorkBook.Load('sample.xlsx')
# Read Multiple Sheets
for sheet in workbook.WorkSheets:
print(f"Sheet Name: {sheet.Name}")
for row in sheet.Rows:
print([cell.Value for cell in row])
from ironxl import License, WorkBook, WorkSheet
License.LicenseKey = "Your Key"
# Load the Excel workbook
workbook = WorkBook.Load('sample.xlsx')
# Read Multiple Sheets
for sheet in workbook.WorkSheets:
print(f"Sheet Name: {sheet.Name}")
for row in sheet.Rows:
print([cell.Value for cell in row])
PYTHON
Explication du code
Le code fourni démontre comment utiliser IronXL pour lire les données d'un fichier Excel avec plusieurs feuilles. Voici une explication du code étape par étape :
Configuration de la clé de licence
La première ligne du code configure la licence IronXL en spécifiant la clé de licence à l'aide de la propriété License.LicenseKey. Ceci est nécessaire pour activer la bibliothèque IronXL et s'assurer qu'elle peut être utilisée sans restrictions.
2. Chargement du classeur Excel
La deuxième ligne utilise la méthode WorkBook.Load() pour charger un fichier Excel (sample.xlsx) dans un objet WorkBook. Cet objet représente l'ensemble du classeur (c'est-à-dire le fichier Excel) et contient toutes les feuilles et données à l'intérieur du fichier.
3. Itération à travers les feuilles
Le code commence ensuite une boucle à travers les feuilles du classeur. La propriété WorkBook.WorkSheets donne accès à toutes les feuilles du classeur chargé. Pour chaque feuille, il imprime le nom de la feuille en utilisant le nom de la feuille. Ceci est utile pour identifier quelle feuille est en cours de traitement, surtout lorsqu'on travaille avec plusieurs feuilles.
4. Lecture et impression des données de chaque feuille
Dans chaque feuille, le code parcourt chaque ligne en utilisant sheet.Rows. Chaque ligne est un ensemble de cellules dans cette ligne spécifique. Le code extrait ensuite la valeur de chaque cellule dans la ligne en utilisant cell.Value, et l'imprime sous forme de liste pour chaque ligne.
Sortie
Licence IronXL (Version d'essai disponible)
IronXL fonctionne avec une clé de licence valide dans le code. Les utilisateurs peuvent facilement obtenir une licence d'essai depuis la page de licence. Pour utiliser la licence, placez-la quelque part dans le code comme ci-dessous avant d'utiliser la bibliothèque IronXL.
ironxl.License.LicenseKey = "Your License Key"
ironxl.License.LicenseKey = "Your License Key"
PYTHON
Conclusion
IronXL est la meilleure alternative au module pandas lorsqu'il s'agit de gérer des fichiers Excel. Il offre un moyen puissant et simple de gérer des fichiers Excel en Python sans avoir besoin d'importer pandas. Il prend en charge différents formats Excel, ce qui en fait un excellent choix pour les développeurs cherchant à automatiser les tâches de traitement et de reporting des données. Les développeurs à la recherche d'une alternative à pandas peuvent facilement commencer à utiliser IronXL, qui offre un support complet pour la lecture, l'écriture et la manipulation des feuilles Excel.
Chaknith travaille sur IronXL et IronBarcode. Il possède une expertise approfondie en C# et .NET, aidant à améliorer le logiciel et à soutenir les clients. Ses idées issues des interactions avec les utilisateurs contribuent à de meilleurs produits, une documentation améliorée et une expérience globale enrichie.
< PRÉCÉDENT Comment lire un fichier Excel en Python avec plusieurs feuilles
SUIVANT > Comment insérer une image dans Excel en utilisant Python