Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
Die Arbeit mit Excel-Dateien ist eine häufige Anforderung bei Datenanalysen und Automatisierungsaufgaben. Python, mit seinem umfangreiche Bibliothekenbietet verschiedene Möglichkeiten zur Interaktion mit XLSX-Dateien. In diesem Lernprogramm lernen wir, wie man Excel-Dateien mit IronXLeine Python-Excel-Bibliothek.
IronXL for Python wurde entwickelt, um Entwicklern das Lesen und Schreiben von Excel-Dateien in Python zu erleichtern. Sie können nicht nur Excel-Dateien schreiben, sondern auch mit mehreren Excel-Blättern in einem Arbeitsgang arbeiten. Diese Bibliothek eignet sich hervorragend zum Schreiben von Excel-Dateien, ohne dass Microsoft Excel auf Ihrem Rechner installiert sein muss.
Wenn Sie Daten direkt in ein Excel-Tabellenblatt importieren müssen, kommt IronXL zur Hilfe. IronXL macht den Umgang mit Excel-Tabellen einfach. Es hilft, Daten über mehrere Blätter in einer XLSX-Datei einfach zu verwalten.
Wir wollen sehen, wie wir excel-Dateien in Python lesen ironXL verwenden.
In den folgenden Schritten wird der Prozess des Lesens von Excel-Dateien in Python erläutert.
Erstellen Sie eine Python-Datei in Visual Studio-Code.
Installieren Sie die Python-Excel-Bibliothek mit pip.
Laden Sie die Excel-Datei, die wir lesen müssen
Excel-Daten mit Schleifen iterieren
Bevor Sie mit dem Tutorial beginnen, sollten Sie sicherstellen, dass Sie die folgenden Voraussetzungen auf Ihrem System installiert haben:
Öffnen Sie Visual Studio Code und erstellen Sie eine neue Python-Datei mit dem Namen ReadExcel.py. Diese Datei enthält unser Skript zum Lesen von Excel-Dateien mit IronXL.
Öffnen Sie die Befehlszeile in Visual Studio Code, indem Sie im Menü "Terminal > Neues Terminal" wählen.
Installieren Sie IronXL, indem Sie den folgenden Befehl ausführen:
pip-Installation IronXL
Lassen Sie uns nun den Code in einzelne Abschnitte aufteilen und jeden Teil erklären.
from ironxl import * import sys
Hier importieren wir alles aus der ironxl-Bibliothek, die die Funktionalität für die Arbeit mit Excel-Dateien bietet. sys wird verwendet, um den Pfad für die Installation von Python festzulegen, die für die korrekte Funktion von IronXL erforderlich ist.
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
sys.prefix wird der Pfad zu Ihrem Python-Installationsverzeichnis zugewiesen. Dies ist ein vorbereitender Schritt, der vielleicht nicht in jeder Umgebung notwendig ist, aber in einigen Konfigurationen unerlässlich ist, um pfadbezogene Probleme zu vermeiden.
License.LicenseKey = "License-Key";
Die IronXL-Bibliothek erfordert eine gültige lizenzschlüssel um alle Funktionen freizuschalten. In diese Codezeile License.LicenseKey = "License-Key"; fügen Sie den erhaltenen Lizenzschlüssel ein. Ohne gültige Lizenz wird IronXL nicht funktionieren.
workbook = WorkBook.Load("data.xlsx")
Dieser Abschnitt des Skripts, workbook = WorkBook.Load("data.xlsx"), demonstriert, wie eine Excel-Arbeitsmappe geladen wird. WorkBook.Load ist eine von IronXL bereitgestellte Methode zum Öffnen einer vorhandenen Excel-Datei, die durch ihren Dateipfad angegeben wird.
Das Beispiel verwendet "data.xlsx ", wobei davon ausgegangen wird, dass sich diese Datei im selben Verzeichnis wie das Skript befindet. Wenn sich Ihre Datei an einem anderen Ort befindet, müssen Sie den vollständigen Dateipfad angeben.
worksheet = workbook.WorkSheets[0]
Nach dem Laden der Arbeitsmappe ist der nächste Schritt die Auswahl eines Arbeitsblatts. Die Workbook.WorkSheets[0] Zeile greift auf das erste Arbeitsblatt in der Excel-Datei zu. Die Indizierung der Arbeitsblätter beginnt bei 0, so dass mit diesem Codeschnipsel tatsächlich das erste Blatt ausgewählt wird.
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
Dieser Teil des Scripts veranschaulicht, wie man Daten aus bestimmten Zellen liest und anzeigt. Durch Iteration über einen Zellbereich für die Zellen im Arbeitsblatt["A2:A5"] können wir auf die Adresse und den Textwert jeder Zelle zugreifen. Sie können Informationen aus vordefinierten Bereichen innerhalb eines Blattes abrufen.
IronXL bietet Funktionen zur Durchführung einfacher Berechnungen direkt auf Datenbereichen in einem Excel-Blatt. In den folgenden Abschnitten des Codes wird gezeigt, wie einfache Berechnungen wie Summe, Minimum und Maximum für Daten innerhalb eines bestimmten Bereichs durchgeführt werden können.
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
Dieser Teil des Skripts demonstriert, wie man eindeutige Werte innerhalb eines bestimmten Bereichs eines Excel-Blatts identifiziert:
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
Um dies zu erreichen, wird ein bestimmtes Verständnis verwendet. Mengen in Python sind Sammlungen, die automatisch doppelte Einträge eliminieren und sich daher perfekt für die Suche nach eindeutigen Werten eignen. Das Verständnis durchläuft jede Zelle im Bereich F2:F10 und greift mit cell.Text auf den Textinhalt jeder Zelle zu.
Indem wir diese Iteration innerhalb einer Menge platzieren, stellen wir sicher, dass nur eindeutige Werte gespeichert werden.
Schließlich zählt dieses Snippet, wie oft ein bestimmter Wert in einem bestimmten Bereich vorkommt.
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
Hier geht es darum, das Auftreten eines bestimmten Wertes zu quantifizieren, der hier als specific_value bezeichnet wird. Der Code verwendet einen Generatorausdruck, der über jede Zelle im Bereich G2:G10 iteriert und den Textinhalt der Zelle mit specific_value vergleicht.
Der Ausdruck Zelle.Text == spezifischer_Wert ergibt True für jede Zelle, die den Zielwert enthält, und False andernfalls. Die Funktion sum addiert diese booleschen Werte, wobei True als 1 und False als 0 behandelt wird, so dass effektiv gezählt wird, wie oft der bestimmte Wert vorkommt.
Hier ist der vollständige Code zum besseren Verständnis des Codes:
from ironxl import * import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
Nachdem Sie die Python-Datei ReadExcel.py ausgeführt haben, sehen Sie in Ihrer Konsole die folgende Ausgabe, die die Ergebnisse der vom Skript mit den Excel-Daten durchgeführten Operationen wiedergibt.
In diesem Tutorial haben wir uns damit beschäftigt, wie man eine Python-Umgebung einrichtet, um IronXL zum Lesen von Excel-Dateien zu verwenden. Wir haben die Installation der erforderlichen Software, das Schreiben des Skripts zum Laden einer Excel-Arbeitsmappe, die Auswahl eines Arbeitsblatts, das Lesen der Daten, die Durchführung grundlegender Datenanalyseoperationen und vieles mehr behandelt.
IronXL bietet eine leistungsstarke API für die Arbeit mit Excel-Dateien in Python, die Datenanalyse, Datenbereinigung und Visualisierungsaufgaben ermöglicht, ohne dass Microsoft Excel benötigt wird.
Ob Sie nun Verkaufsdaten analysieren, Daten für Berichte importieren oder Visualisierungen aus Excel-Daten erstellen, IronXL bietet eine robuste Lösung für die Verwaltung von Excel-Dateien in Python-Anwendungen.
IronXL bietet eine kostenloser Test für Benutzer, um seine Funktionen zu erkunden, mit Lizenzen ab $749 für diejenigen, die bereit sind, seine Fähigkeiten vollständig zu integrieren.
9 .NET API-Produkte für Ihre Bürodokumente