VERWENDUNG VON IRONXL FOR PYTHON

Wie man Excel-Dateien in Python liest

Veröffentlicht 6. Juni 2024
Teilen Sie:

Die Arbeit mit Excel-Dateien ist eine häufige Anforderung bei Datenanalysen und Automatisierungsaufgaben. Python, mit seinem umfangreiche Bibliothekenbietet verschiedene Möglichkeiten zur Interaktion mit XLSX-Dateien. In diesem Lernprogramm lernen wir, wie man Excel-Dateien mit IronXLeine Python-Excel-Bibliothek.

IronXL: Python Excel-Bibliothek

IronXL for Python wurde entwickelt, um Entwicklern das Lesen und Schreiben von Excel-Dateien in Python zu erleichtern. Sie können nicht nur Excel-Dateien schreiben, sondern auch mit mehreren Excel-Blättern in einem Arbeitsgang arbeiten. Diese Bibliothek eignet sich hervorragend zum Schreiben von Excel-Dateien, ohne dass Microsoft Excel auf Ihrem Rechner installiert sein muss.

Wenn Sie Daten direkt in ein Excel-Tabellenblatt importieren müssen, kommt IronXL zur Hilfe. IronXL macht den Umgang mit Excel-Tabellen einfach. Es hilft, Daten über mehrere Blätter in einer XLSX-Datei einfach zu verwalten.

Wir wollen sehen, wie wir excel-Dateien in Python lesen ironXL verwenden.

Wie man Excel-Dateien in Python liest

In den folgenden Schritten wird der Prozess des Lesens von Excel-Dateien in Python erläutert.

  1. Erstellen Sie eine Python-Datei in Visual Studio-Code.

  2. Installieren Sie die Python-Excel-Bibliothek mit pip.

  3. Laden Sie die Excel-Datei, die wir lesen müssen

  4. Excel-Daten mit Schleifen iterieren

  5. Iterierte Daten auf der Konsole anzeigen

Voraussetzungen

Bevor Sie mit dem Tutorial beginnen, sollten Sie sicherstellen, dass Sie die folgenden Voraussetzungen auf Ihrem System installiert haben:

  • .NET 6.0 SDK: IronXL basiert auf .NET, daher muss das .NET 6.0 SDK auf Ihrem System installiert sein.
  • Python 3.0+: Das Tutorial setzt voraus, dass Sie Python 3.0 oder höher installiert haben.
  • pip: Stellen Sie sicher, dass pip, das Installationsprogramm für Python-Pakete, installiert ist, da es für die Installation von IronXL verwendet wird.

Einrichten Ihrer Umgebung

1. Erstellen einer Datei in Visual Studio Code

Öffnen Sie Visual Studio Code und erstellen Sie eine neue Python-Datei mit dem Namen ReadExcel.py. Diese Datei enthält unser Skript zum Lesen von Excel-Dateien mit IronXL.

Wie man Excel-Dateien in Python liest: Abbildung 1

2. Installation von IronXL

Öffnen Sie die Befehlszeile in Visual Studio Code, indem Sie im Menü "Terminal > Neues Terminal" wählen.

Wie man Excel-Dateien in Python liest: Abbildung 2

Installieren Sie IronXL, indem Sie den folgenden Befehl ausführen:

 pip-Installation IronXL

Wie man Excel-Dateien in Python liest: Abbildung 3

Schreiben des Codes

Lassen Sie uns nun den Code in einzelne Abschnitte aufteilen und jeden Teil erklären.

Bibliotheken importieren

from ironxl import *     import sys
PYTHON

Hier importieren wir alles aus der ironxl-Bibliothek, die die Funktionalität für die Arbeit mit Excel-Dateien bietet. sys wird verwendet, um den Pfad für die Installation von Python festzulegen, die für die korrekte Funktion von IronXL erforderlich ist.

Python-Installationspfad festlegen

sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
PYTHON

sys.prefix wird der Pfad zu Ihrem Python-Installationsverzeichnis zugewiesen. Dies ist ein vorbereitender Schritt, der vielleicht nicht in jeder Umgebung notwendig ist, aber in einigen Konfigurationen unerlässlich ist, um pfadbezogene Probleme zu vermeiden.

Lizenzschlüssel einstellen

License.LicenseKey = "License-Key";
PYTHON

Die IronXL-Bibliothek erfordert eine gültige lizenzschlüssel um alle Funktionen freizuschalten. In diese Codezeile License.LicenseKey = "License-Key"; fügen Sie den erhaltenen Lizenzschlüssel ein. Ohne gültige Lizenz wird IronXL nicht funktionieren.

Laden der Arbeitsmappe

workbook = WorkBook.Load("data.xlsx")
PYTHON

Dieser Abschnitt des Skripts, workbook = WorkBook.Load("data.xlsx"), demonstriert, wie eine Excel-Arbeitsmappe geladen wird. WorkBook.Load ist eine von IronXL bereitgestellte Methode zum Öffnen einer vorhandenen Excel-Datei, die durch ihren Dateipfad angegeben wird.

Das Beispiel verwendet "data.xlsx ", wobei davon ausgegangen wird, dass sich diese Datei im selben Verzeichnis wie das Skript befindet. Wenn sich Ihre Datei an einem anderen Ort befindet, müssen Sie den vollständigen Dateipfad angeben.

Auswählen eines Arbeitsblatts

worksheet = workbook.WorkSheets[0]
PYTHON

Nach dem Laden der Arbeitsmappe ist der nächste Schritt die Auswahl eines Arbeitsblatts. Die Workbook.WorkSheets[0] Zeile greift auf das erste Arbeitsblatt in der Excel-Datei zu. Die Indizierung der Arbeitsblätter beginnt bei 0, so dass mit diesem Codeschnipsel tatsächlich das erste Blatt ausgewählt wird.

Lesen und Anzeigen von Daten

print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
PYTHON

Dieser Teil des Scripts veranschaulicht, wie man Daten aus bestimmten Zellen liest und anzeigt. Durch Iteration über einen Zellbereich für die Zellen im Arbeitsblatt["A2:A5"] können wir auf die Adresse und den Textwert jeder Zelle zugreifen. Sie können Informationen aus vordefinierten Bereichen innerhalb eines Blattes abrufen.

Ausführen von Berechnungen

IronXL bietet Funktionen zur Durchführung einfacher Berechnungen direkt auf Datenbereichen in einem Excel-Blatt. In den folgenden Abschnitten des Codes wird gezeigt, wie einfache Berechnungen wie Summe, Minimum und Maximum für Daten innerhalb eines bestimmten Bereichs durchgeführt werden können.

total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
PYTHON

Einzigartige Werte finden

Dieser Teil des Skripts demonstriert, wie man eindeutige Werte innerhalb eines bestimmten Bereichs eines Excel-Blatts identifiziert:

unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
PYTHON

Um dies zu erreichen, wird ein bestimmtes Verständnis verwendet. Mengen in Python sind Sammlungen, die automatisch doppelte Einträge eliminieren und sich daher perfekt für die Suche nach eindeutigen Werten eignen. Das Verständnis durchläuft jede Zelle im Bereich F2:F10 und greift mit cell.Text auf den Textinhalt jeder Zelle zu.

Indem wir diese Iteration innerhalb einer Menge platzieren, stellen wir sicher, dass nur eindeutige Werte gespeichert werden.

Zählen des Auftretens eines bestimmten Wertes

Schließlich zählt dieses Snippet, wie oft ein bestimmter Wert in einem bestimmten Bereich vorkommt.

specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

Hier geht es darum, das Auftreten eines bestimmten Wertes zu quantifizieren, der hier als specific_value bezeichnet wird. Der Code verwendet einen Generatorausdruck, der über jede Zelle im Bereich G2:G10 iteriert und den Textinhalt der Zelle mit specific_value vergleicht.

Der Ausdruck Zelle.Text == spezifischer_Wert ergibt True für jede Zelle, die den Zielwert enthält, und False andernfalls. Die Funktion sum addiert diese booleschen Werte, wobei True als 1 und False als 0 behandelt wird, so dass effektiv gezählt wird, wie oft der bestimmte Wert vorkommt.

Vollständiges Code-Beispiel

Hier ist der vollständige Code zum besseren Verständnis des Codes:

from ironxl import *     import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

Ausgabe

Nachdem Sie die Python-Datei ReadExcel.py ausgeführt haben, sehen Sie in Ihrer Konsole die folgende Ausgabe, die die Ergebnisse der vom Skript mit den Excel-Daten durchgeführten Operationen wiedergibt.

Wie man Excel-Dateien in Python liest: Abbildung 4

Schlussfolgerung

In diesem Tutorial haben wir uns damit beschäftigt, wie man eine Python-Umgebung einrichtet, um IronXL zum Lesen von Excel-Dateien zu verwenden. Wir haben die Installation der erforderlichen Software, das Schreiben des Skripts zum Laden einer Excel-Arbeitsmappe, die Auswahl eines Arbeitsblatts, das Lesen der Daten, die Durchführung grundlegender Datenanalyseoperationen und vieles mehr behandelt.

IronXL bietet eine leistungsstarke API für die Arbeit mit Excel-Dateien in Python, die Datenanalyse, Datenbereinigung und Visualisierungsaufgaben ermöglicht, ohne dass Microsoft Excel benötigt wird.

Ob Sie nun Verkaufsdaten analysieren, Daten für Berichte importieren oder Visualisierungen aus Excel-Daten erstellen, IronXL bietet eine robuste Lösung für die Verwaltung von Excel-Dateien in Python-Anwendungen.

IronXL bietet eine kostenloser Test für Benutzer, um seine Funktionen zu erkunden, mit Lizenzen ab $749 für diejenigen, die bereit sind, seine Fähigkeiten vollständig zu integrieren.

< PREVIOUS
Python-Paket für Excel-Dateien (ohne Verwendung von Interop)
NÄCHSTES >
Wie man eine Excel-Datei in Python anzeigt

Sind Sie bereit, loszulegen? Version: 2024.9 gerade veröffentlicht

Kostenloser Pip-Download Lizenzen anzeigen >