在生產環境中測試,無水印。
在任何需要的地方都能運行。
獲得 30 天的全功能產品。
在幾分鐘內上手運行。
試用產品期間完全訪問我們的支援工程團隊
在資料分析和自動化任務中,處理 Excel 文件是一個常見的需求。 Python 具備廣泛的庫集,提供多種方式來與 XLSX 文件進行互動。 在本教程中,我們將學習如何使用IronXL(一個 Python 的 Excel 庫)來讀取 Excel 文件。
IronXL Python 設計用來幫助開發人員輕鬆地在 Python 中讀寫 Excel 文件。 您不僅可以撰寫 Excel 檔案,還可以一次處理多個 Excel 工作表。 該庫非常適合在不安裝 Microsoft Excel 的情況下撰寫 Excel 文件。
當您需要將資料直接匯入到 Excel 試算表時,IronXL 就派上用場了。 IronXL 讓處理 Excel 試算表變得簡單。 它可以輕鬆管理XLSX檔案中的多個工作表數據。
讓我們看看如何使用 IronXL 在 Python 中讀取 Excel 文件。
以下步驟介紹了在 Python 中讀取 Excel 文件的過程。
在 Visual Studio Code 中創建一個 Python 檔案。
使用 pip 安裝 Python Excel 庫。
加載我們需要閱讀的 Excel 文件
使用迴圈遍歷 Excel 數據
在進入教程之前,請確保您的系統上已安裝以下先決條件:
打開 Visual Studio Code,然後建立一個名為 ReadExcel.py 的新 Python 檔案。 此文件將包含我們使用IronXL讀取Excel文件的腳本。
在 Visual Studio Code 中,從選單中選擇 終端 > 新終端
以打開命令列。
通過運行以下命令安裝IronXL:
pip install IronXL
現在,讓我們將代碼分成幾個部分並解釋每一部分。
from ironxl import * import sys
在這裡,我們從ironxl庫中導入所有內容,這個庫提供了處理Excel文件的功能。 sys 用於設定 Python 安裝的路徑,這對於 IronXL 正常運行是必要的。
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
sys.prefix 被指定為 Python 安裝目錄的路徑。 這是一個準備步驟,在每種環境中可能不是必需的,但在某些配置中是必不可少的,以防止路徑相關的問題。
License.LicenseKey = "License-Key";
IronXL 函式庫需要有效的授權金鑰來解鎖所有功能。 這行程式碼 License.LicenseKey = "License-Key"; 是您將取得的授權金鑰插入的地方。 如果沒有有效的授權,IronXL 將無法運作。
workbook = WorkBook.Load("data.xlsx")
這段腳本的範例,workbook = WorkBook.Load("data.xlsx"),展示了如何載入 Excel 工作簿。 WorkBook.Load 是由 IronXL 提供的方法,用於打開現有的 Excel 文件,根據其文件路徑指定。
範例使用「data.xlsx」,假設此檔案位於與腳本相同的目錄中。 如果您的文件在其他位置,您需要提供完整的文件路徑。
worksheet = workbook.WorkSheets[0]
載入活頁簿後,下一步是選擇一個工作表。 workbook.WorkSheets[0] 行存取 Excel 檔中的第一個工作表。工作表的索引從 0 開始,因此此段代碼有效地選取第一個工作表。
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
這部分腳本範例展示了如何從特定單元格讀取和顯示數據。 透過迭代工作表中 worksheet["A2:A5"] 的單元格範圍,我們可以訪問每個單元格的地址和文本值。 您可以從工作表中的預定義區域檢索資訊。
IronXL 提供功能,可以直接在 Excel 工作表中的資料範圍上進行簡單計算。 以下代碼部分示範如何在指定範圍內對資料進行簡單計算,如求和、最小值和最大值。
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
以下部分的腳本演示了如何識別 Excel 工作表中指定範圍內的唯一值:
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
為了實現這一點,使用了一個集合理解。 在 Python 中,集合是一種會自動消除重複項目的集合,非常適合用來尋找唯一值。 這個理解會遍歷範圍F2:F10中的每個單元格,使用cell.Text來獲取每個單元格的文本內容。
通過將此迭代放入集合中,我們確保只保留唯一的值。
最後,此程式碼片段計算特定值在給定範圍內出現的次數。
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
這裡的目標是量化一個特定值的出現,這個值標記為specific_value。 這段程式碼使用了一個生成器表達式,遍歷範圍G2:G10中的每個單元格,將單元格的文字內容與specific_value進行比較。
表達式cell.Text == specific_value對於每個包含目標值的單元格計算為True,否則為False。sum 函數將這些布林值相加,將True視為1,False視為0,有效地計算特定值出現的次數。
以下是完整的程式碼,以便更好地理解程式碼:
from ironxl import * import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
在運行 ReadExcel.py Python 檔案後,您會在控制台中看到以下輸出,這反映了腳本對 Excel 數據執行的操作結果。
在本教程中,我們已經探討了如何設置 Python 環境以使用 IronXL 來讀取 Excel 文件。 我們已經介紹了安裝必要的軟體、編寫載入 Excel 工作簿的腳本、選擇工作表、讀取數據、執行基本數據分析操作等內容。
IronXL提供一個強大的API,用於在Python中處理Excel文件,使得數據分析、數據清理和可視化任務無需使用Microsoft Excel即可完成。
無論您是在分析銷售數據、匯入報告數據,還是從 Excel 數據創建可視化,IronXL 為在 Python 應用程式中管理 Excel 文件提供了一個強大的解決方案。
IronXL 為用戶提供免費試用來探索其功能,並為準備充分整合其功能的用戶提供價格為$749的授權。