使用IRONXL FOR PYTHON

如何在 Python 中讀取 Excel 文件

發佈 2024年6月6日
分享:

處理 Excel 文件是資料分析和自動化任務中的常見需求。Python 與其 廣泛的庫集合,提供了多種與XLSX文件進行互動的方法。在本教程中,我們將學習如何使用 IronXL, 一個 Python Excel 函式庫。

IronXL: Python Excel Library

IronXL for Python 旨在幫助開發人員輕鬆讀取和編寫 Python 中的 Excel 文件。不僅可以編寫 Excel 文件,還可以一次性處理多個 Excel 工作表。此庫適用於在不安裝 Microsoft Excel 的情況下編寫 Excel 文件。

當您需要將數據直接導入 Excel 試算表時,IronXL 可以派上用場。IronXL 使處理 Excel 試算表變得簡單。它有助於輕鬆管理 XLSX 文件中多個工作表之間的數據。

讓我們看看如何 在 Python 中讀取 Excel 文件 使用IronXL。

如何在 Python 中讀取 Excel 檔案

以下步驟說明在 Python 中讀取 Excel 檔案的過程。

  1. 在 Visual Studio code 中建立一個 Python 檔案。

  2. 使用 pip 安裝 Python Excel 套件庫。

  3. 載入我們需要讀取的 Excel 檔案。

  4. 使用迴圈遍歷 Excel 資料。

  5. 在控制台上顯示遍歷的資料。

先決條件

在進入教程之前,請確保您的系統中已安裝以下先決條件:

  • .NET 6.0 SDK: IronXL 是基於 .NET 構建的,需要在您的系統中安裝 .NET 6.0 SDK。
  • Python 3.0+: 教程假設您已安裝 Python 3.0 或更高版本。
  • pip: 確保已安裝 pip,這是 Python 的包管理工具,教程將使用它來安裝 IronXL。

設定您的環境

1. 在 Visual Studio Code 中建立檔案

打開 Visual Studio Code,並建立一個名為 ReadExcel.py 的新 Python 檔案。這個檔案將包含我們使用 IronXL 讀取 Excel 檔案的腳本。

如何在 Python 中读取 Excel 文件:图 1

2. 安裝 IronXL

在 Visual Studio Code 中打開命令行,從菜單中選擇 `終端 > 新終端`。

如何在 Python 中閱讀 Excel 文件:圖 2

通過運行以下命令安裝 IronXL:

 pip install IronXL

如何在 Python 中閱讀 Excel 文件:圖 3

撰寫程式碼

現在,讓我們把程式碼分成幾個部分並解釋每一部分。

匯入庫文件

from ironxl import *     import sys
PYTHON

在這裡,我們從 ironxl 庫中導入所有內容,該庫提供處理 Excel 文件的功能。sys 被用來設置 Python 的安裝路徑,這對於 IronXL 正確運行是必要的。

設定 Python 安裝路徑

sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
PYTHON

sys.prefix 被賦予您的 Python 安裝目錄的路徑。這是一個準備步驟,可能在每個環境中並非都必須,但在某些配置中是必要的,以防止與路徑相關的問題。

設定授權碼

License.LicenseKey = "License-Key";
PYTHON

IronXL 程式庫需要有效的 授權碼 要解鎖所有功能。這行程式碼 License.LicenseKey = "License-Key"; 是您插入獲得的授權金鑰的地方。沒有有效的授權,IronXL 將無法運作。

讀取工作簿

workbook = WorkBook.Load("data.xlsx")
PYTHON

此段腳本,workbook = WorkBook.Load("data.xlsx"),展示如何載入 Excel 工作簿。WorkBook.Load 是由 IronXL 提供的一種方法,用於打開一個已存在的 Excel 文件,指定其文件路徑。

示例使用 "data.xlsx",假設該文件位於腳本的同一目錄下。如果你的文件在其他地方,你需要提供完整的文件路徑。

選擇工作表

worksheet = workbook.WorkSheets[0]
PYTHON

載入工作簿後,下一步是選擇一個工作表。workbook.WorkSheets[0]該行訪問 Excel 文件中的第一個工作表。工作表的索引從0開始,因此這段代碼片段有效地選擇了第一個工作表。

讀取和顯示資料

print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
PYTHON

這部分腳本展示了如何從特定單元格讀取並顯示數據。通過迭代單元格範圍來處理工作表中的單元格["A2:A5"],我們可以訪問每個單元格的地址和文本值。您可以從工作表中的預定區域檢索信息。

執行計算

IronXL提供函式,可以直接在Excel工作表內的資料範圍上執行簡單的計算。以下的程式碼部分展示了如何在指定範圍內的資料上執行像是加總、最小值、最大值等簡單的計算。

total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
PYTHON

找到唯一值

這部分的腳本展示了如何在指定的 Excel 範圍內識別唯一值:

unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
PYTHON

為達成此目標,使用了集合推導。Python中的集合是自動消除重複條目的集合,非常適合用於尋找獨特的值。該推導在範圍 F2:F10 中迭代每個單元格,使用 cell.Text 獲取每個單元格的文本內容。

通過將此迭代放置在一個集合中,我們確保只保留唯一的值。

計算特定值的出現次數

最後,這段程式碼計算特定值在給定範圍內出現的次數。

specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

目標在於量化specific_value的出現次數。代碼使用生成器表達式來遍歷範圍G2:G10內的每個單元格,比較每個單元格的文本內容與specific_value

表達式cell.Text == specific_value對於包含目標值的每個單元格計算結果為True,其他情況下為Falsesum函數將這些布爾值相加,把True當作1,把False當作0,有效地計算特定值出現的次數。

完整程式碼範例

以下是完整的程式碼,以便更好地理解程式碼:

from ironxl import *     import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

輸出

運行 ReadExcel.py Python 文件後,您將在控制台中看到以下輸出,這反映了腳本對 Excel 數據進行的操作結果。

如何在 Python 中讀取 Excel 文件:圖 4

結論

在本教程中,我們探討了如何設置Python環境以使用IronXL來讀取Excel文件。我們涵蓋了安裝必要的軟件、編寫加載Excel工作簿的腳本、選擇工作表、讀取數據、執行基本數據分析操作等內容。

IronXL為在Python中處理Excel文件提供了一個強大的API,能夠進行數據分析、數據清理和可視化任務,無需使用Microsoft Excel。

無論您是分析銷售數據、導入報告數據,還是從Excel數據創建可視化圖表,IronXL都為在Python應用程序中管理Excel文件提供了一個強大的解決方案。

IronXL提供了一個 免費試用 供用戶探索其功能,授權價格自 $liteLicense 起,適合準備全面整合其功能的用戶。

< 上一頁
適用於Excel文件的Python套件(不使用Interop)
下一個 >
如何在 Python 中查看 Excel 文件

準備開始了嗎? 版本: 2024.9 剛剛發布

免費 pip 下載 查看許可證 >