from ironxl import *
# Supported for XLSX, XLS, XLSM, XLTX, CSV, and TSV
workbook = WorkBook.Load("sample.xlsx")
# Select worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Get any existing worksheet
first_sheet = workbook.DefaultWorkSheet
# Select a cell and return the converted value
cell_value = worksheet["A2"].IntValue
# Read from ranges of cells elegantly.
for cell in worksheet["A2:A10"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate aggregate values such as Min, and Sum
total_sum = worksheet["A2:A10"].Sum()
Die Arbeit mit Excel-Dateien ist eine häufige Anforderung bei Datenanalysen und Automatisierungsaufgaben. Python, mit seinemumfangreiche Bibliothekenbietet verschiedene Möglichkeiten zur Interaktion mit XLSX-Dateien. In diesem Lernprogramm lernen wir, wie man Excel-Dateien mitIronXLeine Python-Excel-Bibliothek.
IronXL: Python Excel-Bibliothek
IronXL for Python wurde entwickelt, um Entwicklern das Lesen und Schreiben von Excel-Dateien in Python zu erleichtern. Sie können nicht nur Excel-Dateien schreiben, sondern auch mit mehreren Excel-Blättern in einem Arbeitsgang arbeiten. Diese Bibliothek eignet sich hervorragend zum Schreiben von Excel-Dateien, ohne dass Microsoft Excel auf Ihrem Rechner installiert sein muss.
Wenn Sie Daten direkt in ein Excel-Tabellenblatt importieren müssen, kommt IronXL zur Hilfe. IronXL macht den Umgang mit Excel-Tabellen einfach. Es hilft, Daten über mehrere Blätter in einer XLSX-Datei einfach zu verwalten.
In den folgenden Schritten wird der Prozess des Lesens von Excel-Dateien in Python erläutert.
Erstellen Sie eine Python-Datei in Visual Studio-Code.
Installieren Sie die Python-Excel-Bibliothek mit pip.
Laden Sie die Excel-Datei, die wir lesen müssen
Excel-Daten mit Schleifen iterieren
Iterierte Daten auf der Konsole anzeigen
Voraussetzungen
Bevor Sie mit dem Tutorial beginnen, sollten Sie sicherstellen, dass Sie die folgenden Voraussetzungen auf Ihrem System installiert haben:
.NET 6.0 SDK: IronXL basiert auf .NET, daher muss das .NET 6.0 SDK auf Ihrem System installiert sein.
Python 3.0+: Das Tutorial setzt voraus, dass Sie Python 3.0 oder höher installiert haben.
pip: Stellen Sie sicher, dass pip, das Installationsprogramm für Python-Pakete, installiert ist, da es für die Installation von IronXL verwendet wird.
Einrichten Ihrer Umgebung
1. Erstellen einer Datei in Visual Studio Code
Öffnen Sie Visual Studio Code und erstellen Sie eine neue Python-Datei mit dem Namen ReadExcel.py. Diese Datei enthält unser Skript zum Lesen von Excel-Dateien mit IronXL.
2. Installation von IronXL
Öffnen Sie die Befehlszeile in Visual Studio Code, indem Sie im Menü "Terminal > Neues Terminal" wählen.
Installieren Sie IronXL, indem Sie den folgenden Befehl ausführen:
pip-Installation IronXL
Schreiben des Codes
Lassen Sie uns nun den Code in einzelne Abschnitte aufteilen und jeden Teil erklären.
Bibliotheken importieren
from ironxl import * import sys
from ironxl import * import sys
PYTHON
Hier importieren wir alles aus der ironxl-Bibliothek, die die Funktionalität für die Arbeit mit Excel-Dateien bietet. sys wird verwendet, um den Pfad für die Installation von Python festzulegen, die für die korrekte Funktion von IronXL erforderlich ist.
sys.prefix wird der Pfad zu Ihrem Python-Installationsverzeichnis zugewiesen. Dies ist ein vorbereitender Schritt, der vielleicht nicht in jeder Umgebung notwendig ist, aber in einigen Konfigurationen unerlässlich ist, um pfadbezogene Probleme zu vermeiden.
Lizenzschlüssel einstellen
License.LicenseKey = "License-Key";
License.LicenseKey = "License-Key";
PYTHON
Die IronXL-Bibliothek erfordert eine gültigelizenzschlüssel um alle Funktionen freizuschalten. In diese Codezeile License.LicenseKey = "License-Key"; fügen Sie den erhaltenen Lizenzschlüssel ein. Ohne gültige Lizenz wird IronXL nicht funktionieren.
Laden der Arbeitsmappe
workbook = WorkBook.Load("data.xlsx")
workbook = WorkBook.Load("data.xlsx")
PYTHON
Dieser Abschnitt des Skripts, workbook = WorkBook.Load("data.xlsx"), demonstriert, wie eine Excel-Arbeitsmappe geladen wird. WorkBook.Load ist eine von IronXL bereitgestellte Methode zum Öffnen einer vorhandenen Excel-Datei, die durch ihren Dateipfad angegeben wird.
Das Beispiel verwendet "data.xlsx ", wobei davon ausgegangen wird, dass sich diese Datei im selben Verzeichnis wie das Skript befindet. Wenn sich Ihre Datei an einem anderen Ort befindet, müssen Sie den vollständigen Dateipfad angeben.
Auswählen eines Arbeitsblatts
worksheet = workbook.WorkSheets[0]
worksheet = workbook.WorkSheets[0]
PYTHON
Nach dem Laden der Arbeitsmappe ist der nächste Schritt die Auswahl eines Arbeitsblatts. Die Workbook.WorkSheets[0] Zeile greift auf das erste Arbeitsblatt in der Excel-Datei zu. Die Indizierung der Arbeitsblätter beginnt bei 0, so dass mit diesem Codeschnipsel tatsächlich das erste Blatt ausgewählt wird.
Lesen und Anzeigen von Daten
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
PYTHON
Dieser Teil des Scripts veranschaulicht, wie man Daten aus bestimmten Zellen liest und anzeigt. Durch Iteration über einen Zellbereich für die Zellen im Arbeitsblatt["A2:A5"] können wir auf die Adresse und den Textwert jeder Zelle zugreifen. Sie können Informationen aus vordefinierten Bereichen innerhalb eines Blattes abrufen.
Ausführen von Berechnungen
IronXL bietet Funktionen zur Durchführung einfacher Berechnungen direkt auf Datenbereichen in einem Excel-Blatt. In den folgenden Abschnitten des Codes wird gezeigt, wie einfache Berechnungen wie Summe, Minimum und Maximum für Daten innerhalb eines bestimmten Bereichs durchgeführt werden können.
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
PYTHON
Einzigartige Werte finden
Dieser Teil des Skripts demonstriert, wie man eindeutige Werte innerhalb eines bestimmten Bereichs eines Excel-Blatts identifiziert:
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
PYTHON
Um dies zu erreichen, wird ein bestimmtes Verständnis verwendet. Mengen in Python sind Sammlungen, die automatisch doppelte Einträge eliminieren und sich daher perfekt für die Suche nach eindeutigen Werten eignen. Das Verständnis durchläuft jede Zelle im Bereich F2:F10 und greift mit cell.Text auf den Textinhalt jeder Zelle zu.
Indem wir diese Iteration innerhalb einer Menge platzieren, stellen wir sicher, dass nur eindeutige Werte gespeichert werden.
Zählen des Auftretens eines bestimmten Wertes
Schließlich zählt dieses Snippet, wie oft ein bestimmter Wert in einem bestimmten Bereich vorkommt.
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON
Hier geht es darum, das Auftreten eines bestimmten Wertes zu quantifizieren, der hier als specific_value bezeichnet wird. Der Code verwendet einen Generatorausdruck, der über jede Zelle im Bereich G2:G10 iteriert und den Textinhalt der Zelle mit specific_value vergleicht.
Der Ausdruck Zelle.Text == spezifischer_Wert ergibt True für jede Zelle, die den Zielwert enthält, und False andernfalls. Die Funktion sum addiert diese booleschen Werte, wobei True als 1 und False als 0 behandelt wird, so dass effektiv gezählt wird, wie oft der bestimmte Wert vorkommt.
Vollständiges Code-Beispiel
Hier ist der vollständige Code zum besseren Verständnis des Codes:
from ironxl import * import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
from ironxl import * import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON
Ausgabe
Nachdem Sie die Python-Datei ReadExcel.py ausgeführt haben, sehen Sie in Ihrer Konsole die folgende Ausgabe, die die Ergebnisse der vom Skript mit den Excel-Daten durchgeführten Operationen wiedergibt.
Schlussfolgerung
In diesem Tutorial haben wir uns damit beschäftigt, wie man eine Python-Umgebung einrichtet, um IronXL zum Lesen von Excel-Dateien zu verwenden. Wir haben die Installation der erforderlichen Software, das Schreiben des Skripts zum Laden einer Excel-Arbeitsmappe, die Auswahl eines Arbeitsblatts, das Lesen der Daten, die Durchführung grundlegender Datenanalyseoperationen und vieles mehr behandelt.
IronXL bietet eine leistungsstarke API für die Arbeit mit Excel-Dateien in Python, die Datenanalyse, Datenbereinigung und Visualisierungsaufgaben ermöglicht, ohne dass Microsoft Excel benötigt wird.
Ob Sie nun Verkaufsdaten analysieren, Daten für Berichte importieren oder Visualisierungen aus Excel-Daten erstellen, IronXL bietet eine robuste Lösung für die Verwaltung von Excel-Dateien in Python-Anwendungen.
IronXL bietet einekostenloser Test für Benutzer, um seine Funktionen zu erkunden, mit Lizenzen ab $749 für diejenigen, die bereit sind, seine Fähigkeiten vollständig zu integrieren.
Jordi beherrscht vor allem Python, C# und C++. Wenn er seine Fähigkeiten bei Iron Software nicht einsetzt, programmiert er Spiele. Durch seine Mitverantwortung für Produkttests, Produktentwicklung und Forschung trägt Jordi wesentlich zur kontinuierlichen Produktverbesserung bei. Die vielseitigen Erfahrungen, die er sammelt, bieten ihm immer wieder neue Herausforderungen, und er sagt, dass dies einer seiner Lieblingsaspekte bei Iron Software ist. Jordi wuchs in Miami, Florida, auf und studierte Informatik und Statistik an der University of Florida.
< PREVIOUS Python-Paket für Excel-Dateien (ohne Verwendung von Interop)
NÄCHSTES > Wie man eine Excel-Datei in Python anzeigt