使用IRONXL FOR PYTHON

如何在 Python 中讀取 Excel 文件

發佈 2024年6月6日
分享:

在資料分析和自動化任務中,處理 Excel 文件是一個常見的需求。 Python,其廣泛的庫集合,提供多種方式與 XLSX 檔案互動。 在本教程中,我們將學習如何使用來讀取 Excel 文件IronXL, 一個 Python Excel 函式庫。

IronXL:Python Excel 函式庫

IronXL for Python旨在幫助開發人員在 Python 中輕鬆讀寫 Excel 文件。 您不僅可以撰寫 Excel 檔案,還可以一次處理多個 Excel 工作表。 該庫非常適合在不安裝 Microsoft Excel 的情況下撰寫 Excel 文件。

當您需要將資料直接匯入到 Excel 試算表時,IronXL 就派上用場了。 IronXL 讓處理 Excel 試算表變得簡單。 它可以輕鬆管理XLSX檔案中的多個工作表數據。

讓我們看看我們可以如何在 Python 中讀取 Excel 文件使用IronXL。

如何在 Python 中讀取 Excel 文件

以下步驟介紹了在 Python 中讀取 Excel 文件的過程。

  1. 在 Visual Studio Code 中創建一個 Python 檔案。

  2. 使用 pip 安裝 Python Excel 庫。

  3. 加載我們需要閱讀的 Excel 文件

  4. 使用迴圈遍歷 Excel 數據

  5. 在控制台上顯示迭代資料

先決條件

在進入教程之前,請確保您的系統上已安裝以下先決條件:

  • .NET 6.0 SDK:IronXL 基於 .NET 開發,需要在您的系統上安裝 .NET 6.0 SDK。
  • Python 3.0+:本教程假設您已安裝 Python 3.0 或更高版本。
  • pip:確保已安裝 pip,Python 的套件安裝程序,因為它將被用來安裝 IronXL。

設定您的環境

1. 在 Visual Studio Code 中創建文件

打開 Visual Studio Code,並創建一個名為 ReadExcel.py 的新的 Python 文件。 此文件將包含我們使用IronXL讀取Excel文件的腳本。

如何在 Python 中读取 Excel 文件:图 1

2. 安裝 IronXL

在 Visual Studio Code 中,從選單中選擇 終端 > 新終端 以打開命令列。

如何在 Python 中閱讀 Excel 文件:圖 2

通過運行以下命令安裝IronXL:

pip install IronXL

如何在 Python 中閱讀 Excel 文件:圖 3

撰寫程式碼

現在,讓我們將代碼分成幾個部分並解釋每一部分。

匯入庫文件

from ironxl import *     import sys
PYTHON

在此,我們從 ironxl 庫中導入所有內容,該庫提供操作 Excel 文件的功能。 sys 用於設置 Python 的安裝路徑,這對於 IronXL 正常運行是必要的。

設定 Python 安裝路徑

sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
PYTHON

sys.prefix 被指定為您的 Python 安裝目錄路徑。 這是一個準備步驟,在每種環境中可能不是必需的,但在某些配置中是必不可少的,以防止路徑相關的問題。

設定授權碼

License.LicenseKey = "License-Key";
PYTHON

IronXL 程式庫需要有效的授權碼解鎖其所有功能。 這行程式碼 License.LicenseKey = "License-Key"; 是您插入所獲取的授權金鑰的地方。 如果沒有有效的授權,IronXL 將無法運作。

讀取工作簿

workbook = WorkBook.Load("data.xlsx")
PYTHON

此段腳本,workbook = WorkBook.Load("data.xlsx"),演示如何加载 Excel 工作簿。 WorkBook.Load 是由 IronXL 提供的一種方法,用於通過指定的檔案路徑打開現有的 Excel 文件。

該示例使用 "data.xlsx",假設此檔案位於與腳本相同的目錄中。 如果您的文件在其他位置,您需要提供完整的文件路徑。

選擇工作表

worksheet = workbook.WorkSheets[0]
PYTHON

載入活頁簿後,下一步是選擇一個工作表。 **workbook.WorkSheets[0]該行訪問 Excel 文件中的第一個工作表。工作表的索引從0開始,因此這段代碼片段有效地選擇了第一個工作表。

讀取和顯示資料

print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
PYTHON

這部分腳本範例展示了如何從特定單元格讀取和顯示數據。 通過迭代工作表中的儲存格範圍來處理儲存格["A2:A5"],我們可以訪問每個單元格的地址和文本值。 您可以從工作表中的預定義區域檢索資訊。

執行計算

IronXL 提供功能,可以直接在 Excel 工作表中的資料範圍上進行簡單計算。 以下代碼部分示範如何在指定範圍內對資料進行簡單計算,如求和、最小值和最大值。

total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
PYTHON

尋找唯一值

以下部分的腳本演示了如何識別 Excel 工作表中指定範圍內的唯一值:

unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
PYTHON

為了實現這一點,使用了一個集合理解。 在 Python 中,集合是一種會自動消除重複項目的集合,非常適合用來尋找唯一值。 理解過程遍歷了範圍 F2:F10 中的每個儲存格,通過 cell.Text 訪問每個儲存格的文字內容。

通過將此迭代放入集合中,我們確保只保留唯一的值。

計算特定值的出現次數

最後,此程式碼片段計算特定值在給定範圍內出現的次數。

specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

在這裡的目標是量化特定值的出現次數,這個特定值在此標記為 specific_value。 該程式碼使用生成器表達式來遍歷範圍 G2:G10 中的每個單元格,將單元格的文本內容與 specific_value 進行比較。

表達式 cell.Text == specific_value 對於每個包含目標值的單元格判斷為 True,否則為 Falsesum 函數將這些布林值加總,將 True 視為 1,將 False 視為 0,有效地計算特定值出現的次數。

完整代碼範例

以下是完整的程式碼,以便更好地理解程式碼:

from ironxl import *     import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

輸出

在運行 ReadExcel.py Python 文件後,您將在控制台中看到以下輸出,這反映了該腳本對 Excel 數據執行操作的結果。

如何在 Python 中讀取 Excel 文件:圖 4

結論

在本教程中,我們已經探討了如何設置 Python 環境以使用 IronXL 來讀取 Excel 文件。 我們已經介紹了安裝必要的軟體、編寫載入 Excel 工作簿的腳本、選擇工作表、讀取數據、執行基本數據分析操作等內容。

IronXL提供一個強大的API,用於在Python中處理Excel文件,使得數據分析、數據清理和可視化任務無需使用Microsoft Excel即可完成。

無論您是在分析銷售數據、匯入報告數據,還是從 Excel 數據創建可視化,IronXL 為在 Python 應用程式中管理 Excel 文件提供了一個強大的解決方案。

IronXL 提供了一個免費試用供用戶探索其功能,授權價格自 $liteLicense 起,適合準備全面整合其功能的用戶。

< 上一頁
適用於Excel文件的Python套件(不使用Interop)
下一個 >
如何在 Python 中查看 Excel 文件

準備開始了嗎? 版本: 2024.11 剛剛發布

免費 pip 下載 查看許可證 >