在实际环境中测试
在生产中测试无水印。
随时随地为您服务。
在数据分析和自动化任务中,使用 Excel 文件是一项常见要求。 Python丰富的图书馆XLSX、.NET、Java、Python 或 Node.js 提供了多种与 XLSX 文件交互的方法。 在本教程中,我们将学习如何使用IronXL是一个 Python Excel 库。
IronXL PythonExcel "旨在帮助开发人员用 Python 轻松读写 Excel 文件。 您不仅可以编写 Excel 文件,还可以一次性处理多个 Excel 表单。 该库是编写 Excel 文件的完美工具,无需在机器上安装 Microsoft Excel。
当您需要将数据直接导入 Excel 电子表格时,IronXL.Excel 将为您提供帮助。 IronXL.Excel 让处理 Excel 电子表格变得简单。 它有助于轻松管理 XLSX 文件中多个表单的数据。
让我们看看我们如何用 Python 读取 Excel 文件使用 IronXL。
以下步骤将介绍用 Python 阅读 Excel 文件的过程。
在 Visual Studio 代码中创建一个 Python 文件。
使用 pip 安装 Python Excel 库。
加载我们需要阅读的 Excel 文件
使用循环迭代 Excel 数据
在深入学习本教程之前,请确保您的系统已安装以下先决条件:
打开 Visual Studio 代码,新建一个 Python 文件,文件名为 ReadExcel.py。 该文件将包含我们使用 IronXL.Excel 读取 Excel 文件的脚本。
在 Visual Studio Code 中打开命令行,从菜单中选择 "终端">"新建终端"。
运行以下命令安装 IronXL:
pip install IronXL
现在,让我们将代码分成几个部分,并对每个部分进行解释。
from ironxl import * import sys
在这里,我们从 ironxl 库中导入了所有内容,该库提供了处理 Excel 文件的功能。 sys 用于设置安装 Python 的路径,这是 IronXL 正常运行所必需的。
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
sys.prefix 指定为 Python 安装目录的路径。 这是一个准备步骤,可能不是每个环境都需要,但在某些配置中是必不可少的,以防止出现与路径相关的问题。
License.LicenseKey = "License-Key";
IronXL 库需要一个有效的许可证密钥以解锁其所有功能。 这行代码 License.LicenseKey = "License-Key";就是插入您获得的许可证密钥的地方。 没有有效的许可证,IronXL 将无法工作。
workbook = WorkBook.Load("data.xlsx")
本节脚本 workbook = WorkBook.Load("data.xlsx") 演示如何加载 Excel 工作簿。 WorkBook.Load是 IronXL 提供的一种方法,用于打开由文件路径指定的现有 Excel 文件。
示例使用了 "data.xlsx ",假设该文件与脚本位于同一目录下。 如果您的文件在其他地方,您需要提供完整的文件路径。
worksheet = workbook.WorkSheets[0]
加载工作簿后,下一步是选择工作表。 workbook.WorkSheets[0] 行访问 Excel 文件中的第一个工作表。工作表的索引从 0 开始,因此该代码段实际上选择了第一个工作表。
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
这部分脚本演示了如何读取和显示特定单元格中的数据。 通过在单元格范围内迭代工作表中的单元格["A2:A5"]我们可以访问每个单元格的地址和文本值。 您可以从工作表中的预定义区域检索信息。
IronXL.Excel 提供了直接在 Excel 表内的数据范围上执行简单计算的功能。 代码的以下部分演示了如何对指定范围内的数据执行简单的计算,如求和、求最小值和求最大值。
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
这部分脚本演示了如何识别 Excel 表指定范围内的唯一值:
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
为此,我们使用了一套理解方法。 Python 中的集合是自动消除重复条目的集合,因此非常适合查找唯一值。 理解迭代F2:F10范围内的每个单元格,使用cell.Text访问每个单元格的文本内容。
通过将此迭代放在集合中,我们确保只保留唯一值。
最后,该代码段统计了特定值在给定范围内出现的次数。
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
这里的目标是量化一个特定值的出现,在此标记为specific_value。 代码采用一个生成器表达式,迭代范围 G2:G10 中的每个单元格,将单元格的文本内容与 specific_value 进行比较。
表达式 cell.Text==specific_value在每个包含目标值的单元格中求值为true,否则为false。sum函数将这些布尔值相加,将True视为 1,False视为 0,从而有效计算特定值出现的次数。
以下是完整的代码,以便更好地理解代码:
from ironxl import * import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5' # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
运行ReadExcel.py Python 文件后,您将在控制台中看到以下输出,这些输出反映了脚本对 Excel 数据进行操作的结果。
在本教程中,我们探讨了如何设置 Python 环境,使用 IronXL 读取 Excel 文件。 我们已经介绍了安装必要的软件、编写脚本以加载 Excel 工作簿、选择工作表、读取数据、执行基本数据分析操作等内容。
IronXL 为在 Python 中处理 Excel 文件提供了功能强大的 API,无需 Microsoft Excel 即可执行数据分析、数据清理和可视化任务。
无论您是分析销售数据、为报告导入数据,还是从 Excel 数据创建可视化,IronXL.Excel 都能为在 Python 应用程序中管理 Excel 文件提供强大的解决方案。
IronXL 提供了一种免费试用供用户探索其功能,对于准备完全集成其功能的用户,许可证从 $749 开始。
9个 .NET API 产品 用于您的办公文件