使用IRONXL FOR PYTHON

如何在 Python 中讀取 Excel 文件

查克尼思·賓

2024年6月6日

在資料分析和自動化任務中，處理 Excel 文件是一個常見的需求。 Python 具備廣泛的庫集，提供多種方式來與 XLSX 文件進行互動。在本教程中，我們將學習如何使用IronXL（一個 Python 的 Excel 庫）來讀取 Excel 文件。

IronXL：Python Excel 函式庫

IronXL Python 設計用來幫助開發人員輕鬆地在 Python 中讀寫 Excel 文件。您不僅可以撰寫 Excel 檔案，還可以一次處理多個 Excel 工作表。該庫非常適合在不安裝 Microsoft Excel 的情況下撰寫 Excel 文件。

當您需要將資料直接匯入到 Excel 試算表時，IronXL 就派上用場了。 IronXL 讓處理 Excel 試算表變得簡單。它可以輕鬆管理XLSX檔案中的多個工作表數據。

讓我們看看如何使用 IronXL 在 Python 中讀取 Excel 文件。

如何在 Python 中讀取 Excel 文件

以下步驟介紹了在 Python 中讀取 Excel 文件的過程。

在 Visual Studio Code 中創建一個 Python 檔案。
使用 pip 安裝 Python Excel 庫。
加載我們需要閱讀的 Excel 文件
使用迴圈遍歷 Excel 數據
在控制台上顯示迭代資料

先決條件

在進入教程之前，請確保您的系統上已安裝以下先決條件：

.NET 6.0 SDK：IronXL 建立在 .NET 之上，要求在您的系統上安裝 .NET 6.0 SDK。
Python 3.0+：本教程假設您已安裝 Python 3.0 或更高版本。
pip: 確保安裝了 pip，即 Python 的套件安裝工具，因為需要使用它來安裝 IronXL。

設定您的環境

1. 在 Visual Studio Code 中創建文件

打開 Visual Studio Code，然後建立一個名為 ReadExcel.py 的新 Python 檔案。此文件將包含我們使用IronXL讀取Excel文件的腳本。

如何在 Python 中讀取 Excel 文件：圖 1

2. 安裝 IronXL

在 Visual Studio Code 中，從選單中選擇 終端 > 新終端 以打開命令列。

如何在 Python 中读取 Excel 文件：图 2

通過運行以下命令安裝IronXL：

pip install IronXL

如何在Python中讀取Excel文件：圖3

撰寫程式碼

現在，讓我們將代碼分成幾個部分並解釋每一部分。

匯入庫文件

from ironxl import *     import sys

python

PYTHON

在這裡，我們從ironxl庫中導入所有內容，這個庫提供了處理Excel文件的功能。 sys 用於設定 Python 安裝的路徑，這對於 IronXL 正常運行是必要的。

設定 Python 安裝路徑

sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'

python

PYTHON

sys.prefix 被指定為 Python 安裝目錄的路徑。這是一個準備步驟，在每種環境中可能不是必需的，但在某些配置中是必不可少的，以防止路徑相關的問題。

設定授權碼

License.LicenseKey = "License-Key";

python

PYTHON

IronXL 函式庫需要有效的授權金鑰來解鎖所有功能。這行程式碼 License.LicenseKey = "License-Key"; 是您將取得的授權金鑰插入的地方。如果沒有有效的授權，IronXL 將無法運作。

讀取工作簿

workbook = WorkBook.Load("data.xlsx")

python

PYTHON

這段腳本的範例，workbook = WorkBook.Load("data.xlsx")，展示了如何載入 Excel 工作簿。 WorkBook.Load 是由 IronXL 提供的方法，用於打開現有的 Excel 文件，根據其文件路徑指定。

範例使用「data.xlsx」，假設此檔案位於與腳本相同的目錄中。如果您的文件在其他位置，您需要提供完整的文件路徑。

選擇工作表

worksheet = workbook.WorkSheets[0]

python

PYTHON

載入活頁簿後，下一步是選擇一個工作表。 workbook.WorkSheets[0] 行存取 Excel 檔中的第一個工作表。工作表的索引從 0 開始，因此此段代碼有效地選取第一個工作表。

讀取和顯示資料

print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))

python

PYTHON

這部分腳本範例展示了如何從特定單元格讀取和顯示數據。透過迭代工作表中 worksheet["A2:A5"] 的單元格範圍，我們可以訪問每個單元格的地址和文本值。您可以從工作表中的預定義區域檢索資訊。

執行計算

IronXL 提供功能，可以直接在 Excel 工作表中的資料範圍上進行簡單計算。以下代碼部分示範如何在指定範圍內對資料進行簡單計算，如求和、最小值和最大值。

total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)

python

PYTHON

尋找唯一值

以下部分的腳本演示了如何識別 Excel 工作表中指定範圍內的唯一值：

unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)

python

PYTHON

為了實現這一點，使用了一個集合理解。在 Python 中，集合是一種會自動消除重複項目的集合，非常適合用來尋找唯一值。這個理解會遍歷範圍F2:F10中的每個單元格，使用cell.Text來獲取每個單元格的文本內容。

通過將此迭代放入集合中，我們確保只保留唯一的值。

計算特定值的出現次數

最後，此程式碼片段計算特定值在給定範圍內出現的次數。

specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)

python

PYTHON

這裡的目標是量化一個特定值的出現，這個值標記為specific_value。這段程式碼使用了一個生成器表達式，遍歷範圍G2:G10中的每個單元格，將單元格的文字內容與specific_value進行比較。

表達式cell.Text == specific_value對於每個包含目標值的單元格計算為True，否則為False。sum 函數將這些布林值相加，將True視為1，False視為0，有效地計算特定值出現的次數。

完整代碼範例

以下是完整的程式碼，以便更好地理解程式碼：

from ironxl import *     import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)