Zum Fußzeileninhalt springen
VERWENDUNG VON IRONXL FüR PYTHON

Wie man Excel-Dateien in Python liest

Die Arbeit mit Excel-Dateien ist eine gängige Voraussetzung bei Datenanalyse- und Automatisierungsaufgaben. Python bietet mit seinen umfangreichen Bibliotheken verschiedene Möglichkeiten zur Interaktion mit XLSX-Dateien. In diesem Tutorial lernen wir, wie man Excel-Dateien mit IronXL , einer Python-Excel-Bibliothek, liest.

IronXL: Python Excel-Bibliothek

IronXL für Python wurde entwickelt, um Entwicklern das einfache Lesen und Schreiben von Excel-Dateien in Python zu ermöglichen. Sie können nicht nur Excel-Dateien schreiben, sondern auch mehrere Excel-Tabellen gleichzeitig bearbeiten. Diese Bibliothek eignet sich perfekt zum Schreiben von Excel-Dateien, ohne Microsoft Excel auf Ihrem Rechner installieren zu müssen.

Wenn Sie Daten direkt in eine Excel-Tabelle importieren müssen, ist IronXL die Lösung. IronXL vereinfacht die Arbeit mit Excel-Tabellen. Es erleichtert die Datenverwaltung über mehrere Tabellenblätter in einer XLSX-Datei hinweg.

Schauen wir uns an, wie man mit IronXL in Python Excel-Dateien lesen kann.

Wie man Excel-Dateien in Python liest

Im Folgenden wird der Prozess des Einlesens von Excel-Dateien in Python erläutert.

  1. Erstellen Sie eine Python-Datei in Visual Studio Code.
  2. Installieren Sie die Python Excel-Bibliothek mit pip.
  3. Laden Sie die Excel-Datei, die wir lesen müssen.
  4. Excel-Daten mithilfe von Schleifen iterieren
  5. Die iterierten Daten in der Konsole anzeigen.

Voraussetzungen

Bevor Sie mit dem Tutorial beginnen, stellen Sie sicher, dass die folgenden Voraussetzungen auf Ihrem System erfüllt sind:

  • .NET 6.0 SDK : IronXL basiert auf .NET und erfordert daher die Installation des .NET 6.0 SDK auf Ihrem System.
  • Python 3.0+ : Für dieses Tutorial wird vorausgesetzt, dass Sie Python 3.0 oder höher installiert haben.
  • pip : Stellen Sie sicher, dass pip, der Paketinstaller von Python, installiert ist, da er zur Installation von IronXL verwendet wird.

Einrichten Ihrer Umgebung

1. Erstellen einer Datei in Visual Studio Code

Öffnen Sie Visual Studio Code und erstellen Sie eine neue Python-Datei mit dem Namen ReadExcel.py . Diese Datei enthält unser Skript zum Lesen von Excel-Dateien mit IronXL.

So lesen Sie Excel-Dateien in Python: Abbildung 1

2. Installation von IronXL

Öffnen Sie die Befehlszeile in Visual Studio Code, indem Sie im Menü Terminal > New Terminal auswählen.

So lesen Sie Excel-Dateien in Python: Abbildung 2

Installieren Sie IronXL, indem Sie folgenden Befehl ausführen:

pip install ironxl
pip install ironxl
SHELL

So lesen Sie Excel-Dateien in Python: Abbildung 3

Den Code schreiben

Nun wollen wir den Code in Abschnitte unterteilen und jeden Teil erläutern.

Importieren von Bibliotheken

from ironxl import *
import sys
from ironxl import *
import sys
PYTHON

Hier importieren wir alles aus der ironxl -Bibliothek, die die Funktionalität für die Arbeit mit Excel-Dateien bereitstellt. Mit sys wird der Pfad festgelegt, unter dem Python installiert ist. Dies ist notwendig, damit IronXL korrekt funktioniert.

Festlegen des Python-Installationspfads

sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
PYTHON

sys.prefix wird der Pfad zu Ihrem Python-Installationsverzeichnis zugewiesen. Dieser vorbereitende Schritt ist möglicherweise nicht in jeder Umgebung notwendig, aber in einigen Konfigurationen unerlässlich, um pfadbezogene Probleme zu vermeiden.

Lizenzschlüssel einstellen

License.LicenseKey = "License-Key"
License.LicenseKey = "License-Key"
PYTHON

Für die Nutzung der IronXL-Bibliothek ist ein gültiger Lizenzschlüssel erforderlich, um alle Funktionen freizuschalten. In dieser Codezeile License.LicenseKey = "License-Key" fügen Sie Ihren erhaltenen Lizenzschlüssel ein. Ohne eine gültige Lizenz funktioniert IronXL nicht.

Arbeitsmappe wird geladen

workbook = WorkBook.Load("data.xlsx")
workbook = WorkBook.Load("data.xlsx")
PYTHON

Dieser Abschnitt des Skripts, workbook = WorkBook.Load("data.xlsx") , zeigt, wie man eine Excel-Arbeitsmappe lädt. WorkBook.Load ist eine von IronXL bereitgestellte Methode zum Öffnen einer vorhandenen Excel-Datei, die durch ihren Dateipfad angegeben wird.

Im Beispiel wird "data.xlsx" verwendet, wobei davon ausgegangen wird, dass sich diese Datei im selben Verzeichnis wie das Skript befindet. Befindet sich Ihre Datei an einem anderen Ort, müssen Sie den vollständigen Dateipfad angeben.

Auswahl eines Arbeitsblatts

worksheet = workbook.WorkSheets[0]
worksheet = workbook.WorkSheets[0]
PYTHON

Nach dem Laden der Arbeitsmappe besteht der nächste Schritt darin, ein Arbeitsblatt auszuwählen. Die Zeile workbook.WorkSheets[0] greift auf das erste Tabellenblatt der Excel-Datei zu. Da die Tabellenblätter ab 0 indiziert werden, wählt dieser Codeabschnitt effektiv das erste Tabellenblatt aus.

Lesen und Anzeigen von Daten

print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
PYTHON

Dieser Teil des Skripts veranschaulicht, wie Daten aus bestimmten Zellen gelesen und angezeigt werden. Durch Iteration über einen Zellbereich für die Zellen im Arbeitsblatt["A2:A5"] erhalten wir Zugriff auf die Adresse und den Textwert jeder Zelle. Sie können Informationen aus vordefinierten Bereichen innerhalb eines Tabellenblatts abrufen.

Berechnungen durchführen

IronXL bietet Funktionen, mit denen sich einfache Berechnungen direkt auf Datenbereichen innerhalb eines Excel-Arbeitsblatts durchführen lassen. Die folgenden Abschnitte des Codes demonstrieren, wie man einfache Berechnungen wie Summe, Minimum und Maximum für Daten innerhalb eines bestimmten Bereichs durchführt.

total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)

minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)

maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)

minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)

maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
PYTHON

Einzigartige Werte finden

Dieser Teil des Skripts demonstriert, wie man eindeutige Werte innerhalb eines bestimmten Bereichs eines Excel-Arbeitsblatts ermittelt:

unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
PYTHON

Um dies zu erreichen, wird eine Mengenkomprehension verwendet. Sets in Python sind Sammlungen, die doppelte Einträge automatisch eliminieren, wodurch sie sich perfekt zum Auffinden eindeutiger Werte eignen. Die Comprehension durchläuft jede Zelle im Bereich F2:F10 und greift mit cell.Text auf den Textinhalt jeder Zelle zu.

Indem wir diese Iteration in ein Set einbetten, stellen wir sicher, dass nur eindeutige Werte beibehalten werden.

Zählen des Vorkommens eines bestimmten Wertes

Schließlich zählt dieser Codeabschnitt, wie oft ein bestimmter Wert in einem vorgegebenen Bereich vorkommt.

specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

Ziel ist es, das Auftreten eines bestimmten Wertes zu quantifizieren, der hier als spezifischer_Wert bezeichnet wird. Der Code verwendet einen Generatorausdruck, der über jede Zelle im Bereich G2:G10 iteriert und den Textinhalt der Zelle mit specific_value vergleicht.

Der Ausdruck cell.Text == specific_value ergibt für jede Zelle, die den Zielwert enthält, den Wert True , andernfalls False . Die Summenfunktion addiert diese booleschen Werte, wobei True als 1 und False als 0 interpretiert wird. Dadurch wird die Häufigkeit des jeweiligen Werts gezählt.

Vollständiges Codebeispiel

Hier ist der vollständige Code zum besseren Verständnis:

from ironxl import *
import sys

# Setting Python installation path
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'

# Setting the license key for IronXL
License.LicenseKey = "License-Key"

# Load the workbook
workbook = WorkBook.Load("data.xlsx")

# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]

# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))

# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)

# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)

# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)

# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)

# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
from ironxl import *
import sys

# Setting Python installation path
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'

# Setting the license key for IronXL
License.LicenseKey = "License-Key"

# Load the workbook
workbook = WorkBook.Load("data.xlsx")

# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]

# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))

# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)

# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)

# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)

# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)

# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

Ausgabe

Nach dem Ausführen der Python-Datei ReadExcel.py wird in Ihrer Konsole die folgende Ausgabe angezeigt, die die Ergebnisse der vom Skript auf den Excel-Daten durchgeführten Operationen widerspiegelt.

So lesen Sie Excel-Dateien in Python: Abbildung 4

Abschluss

In diesem Tutorial haben wir untersucht, wie man eine Python-Umgebung einrichtet, um mit IronXL Excel-Dateien zu lesen. Wir haben die Installation der notwendigen Software, das Schreiben des Skripts zum Laden einer Excel-Arbeitsmappe, die Auswahl eines Arbeitsblatts, das Einlesen der Daten, die Durchführung grundlegender Datenanalyseoperationen und vieles mehr behandelt.

IronXL bietet eine leistungsstarke API für die Arbeit mit Excel-Dateien in Python und ermöglicht so Datenanalyse, Datenbereinigung und Visualisierungsaufgaben, ohne dass Microsoft Excel benötigt wird.

Egal ob Sie Verkaufsdaten analysieren, Daten für Berichte importieren oder Visualisierungen aus Excel-Daten erstellen, IronXL bietet eine robuste Lösung für die Verwaltung von Excel-Dateien in Python-Anwendungen.

IronXL bietet eine kostenlose Testversion an, damit Benutzer die Funktionen erkunden können. Lizenzen sind ab $799 für diejenigen erhältlich, die bereit sind, die Funktionen vollständig zu integrieren.

Häufig gestellte Fragen

Wie kann ich Excel-Dateien in Python ohne Microsoft Excel lesen?

IronXL ermöglicht Ihnen das Lesen von Excel-Dateien in Python, ohne dass Microsoft Excel auf Ihrem System erforderlich ist. Sie können Arbeitsmappen mit WorkBook.Load("data.xlsx") laden und direkt auf Arbeitsblätter und Zellen zugreifen.

5. Welches Setup ist erforderlich, um IronXL zum Lesen von Excel-Dateien in Python zu verwenden?

Um IronXL zu verwenden, stellen Sie sicher, dass Sie das .NET 6.0 SDK, Python 3.0 oder höher und pip installiert haben. Richten Sie Ihre Programmierumgebung in Visual Studio Code ein, um mit Excel-Dateien zu arbeiten.

Wie installiere ich IronXL in Python?

Installieren Sie IronXL, indem Sie den Befehl pip install ironxl in Ihrem Terminal ausführen. Dies installiert die Bibliothek, sodass Sie Excel-Dateien lesen und bearbeiten können.

Kann ich Datenanalyse-Operationen auf Excel-Dateien mit IronXL durchführen?

Ja, IronXL unterstützt verschiedene Datenanalyse-Operationen, wie das Berechnen von Summen, das Finden von Minimal- und Maximalwerten und das Identifizieren von einzigartigen Werten innerhalb von Excel-Blättern.

Wie kann ich einzigartige Werte in einem Excel-Bereich mit IronXL finden?

Um einzigartige Werte zu finden, verwenden Sie eine Mengenverständnis, um über den Zellbereich zu iterieren und unterschiedliche Textwerte zu extrahieren. Diese Methode identifiziert effizient alle einzigartigen Einträge.

Ist es möglich, spezifische Werte in Excel mithilfe von IronXL zu zählen?

Ja, Sie können das Vorkommen eines spezifischen Wertes zählen, indem Sie mit einem Generatorausdruck durch den Zellbereich iterieren und die Instanzen summieren, bei denen der Zelltext Ihrem Zielwert entspricht.

Was sind die Vorteile der Verwendung von IronXL für die Excel-Manipulation in Python?

IronXL bietet eine leistungsstarke API für die Manipulation von Excel-Dateien, ohne dass Microsoft Excel erforderlich ist. Es ist ideal für Aufgaben wie Datenanalyse, Bereinigung und Visualisierung und erhöht die Produktivität in Python-Projekten.

Wie schreibe ich ein Python-Skript, um Excel-Dateien mit IronXL zu lesen?

Erstelle ein Python-Skript namens ReadExcel.py, importiere die notwendigen Bibliotheken, setze deinen Python-Pfad und nutze die Methoden von IronXL, um Arbeitsmappen zu laden und mit Daten zu interagieren.

Welche Operationen kann ich mit IronXL auf Excel-Daten ausführen?

IronXL erlaubt verschiedene Operationen wie das Lesen von Zellwerten, das Auswählen von Arbeitsblättern, das Berechnen von Summen, das Finden von Min-/Max-Werten und das Zählen spezifischer Vorkommen in Excel-Datenbereichen.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen