Die Arbeit mit Excel-Dateien ist eine häufige Anforderung bei Datenanalysen und Automatisierungsaufgaben. Python bietet mit seinem umfangreichen Satz an Bibliotheken verschiedene Möglichkeiten, um mit XLSX-Dateien zu interagieren. In diesem Tutorial lernen wir, wie man Excel-Dateien mit IronXL, einer Python Excel-Bibliothek, liest.
IronXL: Python Excel-Bibliothek
IronXL Python ist dafür konzipiert, Entwicklern das Lesen und Schreiben von Excel-Dateien in Python zu erleichtern. Sie können nicht nur Excel-Dateien schreiben, sondern auch mit mehreren Excel-Blättern in einem Arbeitsgang arbeiten. Diese Bibliothek eignet sich hervorragend zum Schreiben von Excel-Dateien, ohne dass Microsoft Excel auf Ihrem Rechner installiert sein muss.
Wenn Sie Daten direkt in ein Excel-Tabellenblatt importieren müssen, kommt IronXL zur Hilfe. IronXL macht den Umgang mit Excel-Tabellen einfach. Es hilft, Daten über mehrere Blätter in einer XLSX-Datei einfach zu verwalten.
Schauen wir uns an, wie wir mit IronXL Excel-Dateien in Python lesen können.
Wie man Excel-Dateien in Python liest
In den folgenden Schritten wird der Prozess des Lesens von Excel-Dateien in Python erläutert.
Erstellen Sie eine Python-Datei in Visual Studio-Code.
Installieren Sie die Python-Excel-Bibliothek mit pip.
Laden Sie die Excel-Datei, die wir lesen müssen
Excel-Daten mit Schleifen iterieren
- Iterierte Daten auf der Konsole anzeigen
Voraussetzungen
Bevor Sie mit dem Tutorial beginnen, sollten Sie sicherstellen, dass Sie die folgenden Voraussetzungen auf Ihrem System installiert haben:
- .NET 6.0 SDK: IronXL wird auf .NET aufgebaut und erfordert, dass das .NET 6.0 SDK auf Ihrem System installiert ist.
- Python 3.0+: Das Tutorial setzt voraus, dass Sie Python 3.0 oder höher installiert haben.
- pip: Stellen Sie sicher, dass pip, der Paketmanager von Python, installiert ist, da er zur Installation von IronXL verwendet wird.
Einrichten Ihrer Umgebung
1. Erstellen einer Datei in Visual Studio Code
Öffnen Sie Visual Studio Code und erstellen Sie eine neue Python-Datei mit dem Namen ReadExcel.py. Diese Datei enthält unser Skript zum Lesen von Excel-Dateien mit IronXL.

2. Installation von IronXL
Öffnen Sie die Befehlszeile in Visual Studio Code, indem Sie im Menü "Terminal > Neues Terminal" wählen.

Installieren Sie IronXL, indem Sie den folgenden Befehl ausführen:

Schreiben des Codes
Lassen Sie uns nun den Code in einzelne Abschnitte aufteilen und jeden Teil erklären.
Bibliotheken importieren
from ironxl import * import sys
Hier importieren wir alles aus der ironxl-Bibliothek, die die Funktionalität bietet, um mit Excel-Dateien zu arbeiten. sys wird verwendet, um den Pfad festzulegen, wo Python installiert ist, was notwendig ist, damit IronXL korrekt funktioniert.
Python-Installationspfad festlegen
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
sys.prefix wird der Pfad zu Ihrem Python-Installationsverzeichnis zugewiesen. Dies ist ein vorbereitender Schritt, der vielleicht nicht in jeder Umgebung notwendig ist, aber in einigen Konfigurationen unerlässlich ist, um pfadbezogene Probleme zu vermeiden.
Lizenzschlüssel einstellen
License.LicenseKey = "License-Key";
Die IronXL-Bibliothek erfordert einen gültigen Lizenzschlüssel, um alle Funktionen freizuschalten. Diese Codezeile License.LicenseKey = "License-Key"; ist der Ort, an dem Sie Ihren erworbenen Lizenzschlüssel einfügen würden. Ohne gültige Lizenz wird IronXL nicht funktionieren.
Laden der Arbeitsmappe
workbook = WorkBook.Load("data.xlsx")
Dieser Abschnitt des Skripts, workbook = WorkBook.Load("data.xlsx"), demonstriert, wie man ein Excel-Arbeitsbuch lädt. WorkBook.Load ist eine von IronXL bereitgestellte Methode, um eine vorhandene Excel-Datei zu öffnen, die durch ihren Dateipfad angegeben wird.
Das Beispiel verwendet "data.xlsx", vorausgesetzt, dass sich diese Datei im selben Verzeichnis wie das Skript befindet. Wenn sich Ihre Datei an einem anderen Ort befindet, müssen Sie den vollständigen Dateipfad angeben.
Auswählen eines Arbeitsblatts
worksheet = workbook.WorkSheets[0]
Nach dem Laden der Arbeitsmappe ist der nächste Schritt die Auswahl eines Arbeitsblatts. Die Zeile workbook.WorkSheets[0] greift auf das erste Arbeitsblatt in der Excel-Datei zu. Arbeitsblätter werden beginnend mit 0 indexiert, daher wählt dieser Codeabschnitt effektiv das erste Blatt aus.
Lesen und Anzeigen von Daten
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
Dieser Teil des Scripts veranschaulicht, wie man Daten aus bestimmten Zellen liest und anzeigt. Durch Iteration über einen Zellbereich für die Zellen im Arbeitsblatt["A2:A5"] können wir auf die Adresse und den Textwert jeder Zelle zugreifen. Sie können Informationen aus vordefinierten Bereichen innerhalb eines Blattes abrufen.
Ausführen von Berechnungen
IronXL bietet Funktionen zur Durchführung einfacher Berechnungen direkt auf Datenbereichen in einem Excel-Blatt. In den folgenden Abschnitten des Codes wird gezeigt, wie einfache Berechnungen wie Summe, Minimum und Maximum für Daten innerhalb eines bestimmten Bereichs durchgeführt werden können.
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
Einzigartige Werte finden
Dieser Teil des Skripts demonstriert, wie man eindeutige Werte innerhalb eines bestimmten Bereichs eines Excel-Blatts identifiziert:
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
Um dies zu erreichen, wird ein bestimmtes Verständnis verwendet. Mengen in Python sind Sammlungen, die automatisch doppelte Einträge eliminieren und sich daher perfekt für die Suche nach eindeutigen Werten eignen. Das Verständnis iteriert über jede Zelle im Bereich F2:F10, indem es auf den Textinhalt jeder Zelle mit cell.Text zugreift.
Indem wir diese Iteration innerhalb einer Menge platzieren, stellen wir sicher, dass nur eindeutige Werte gespeichert werden.
Zählen des Auftretens eines bestimmten Wertes
Schließlich zählt dieses Snippet, wie oft ein bestimmter Wert in einem bestimmten Bereich vorkommt.
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
Das Ziel hier besteht darin, das Auftreten eines bestimmten Werts zu quantifizieren, der hier als specific_value bezeichnet wird. Der Code verwendet einen Generatorausdruck, der über jede Zelle im Bereich G2:G10 iteriert und den Textinhalt der Zelle mit specific_value vergleicht.
Der Ausdruck cell.Text == specific_value ergibt True für jede Zelle, die den Zielwert enthält, und False andernfalls. Die sum-Funktion addiert diese Booleschen Werte, wobei True als 1 und False als 0 behandelt wird, wodurch effektiv gezählt wird, wie oft der spezifische Wert vorkommt.
Vollständiges Code-Beispiel
Hier ist der vollständige Code zum besseren Verständnis des Codes:
from ironxl import * import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
Ausgabe
Nach dem Ausführen der Python-Datei ReadExcel.py wird die folgende Ausgabe in Ihrer Konsole angezeigt, die die Ergebnisse der vom Skript an den Excel-Daten durchgeführten Operationen widerspiegelt.

Schlussfolgerung
In diesem Tutorial haben wir uns damit beschäftigt, wie man eine Python-Umgebung einrichtet, um IronXL zum Lesen von Excel-Dateien zu verwenden. Wir haben die Installation der erforderlichen Software, das Schreiben des Skripts zum Laden einer Excel-Arbeitsmappe, die Auswahl eines Arbeitsblatts, das Lesen der Daten, die Durchführung grundlegender Datenanalyseoperationen und vieles mehr behandelt.
IronXL bietet eine leistungsstarke API für die Arbeit mit Excel-Dateien in Python, die Datenanalyse, Datenbereinigung und Visualisierungsaufgaben ermöglicht, ohne dass Microsoft Excel benötigt wird.
Ob Sie nun Verkaufsdaten analysieren, Daten für Berichte importieren oder Visualisierungen aus Excel-Daten erstellen, IronXL bietet eine robuste Lösung für die Verwaltung von Excel-Dateien in Python-Anwendungen.
IronXL bietet eine kostenlose Testversion für Benutzer an, um seine Funktionen zu erkunden, wobei Lizenzen ab $749 für diejenigen beginnen, die bereit sind, seine Fähigkeiten vollständig zu integrieren.