使用 IRONXL FOR PYTHON

如何在Python中读取Excel文件

发布 2024年六月6日
分享:

在数据分析和自动化任务中,处理 Excel 文件是一项常见要求。Python 凭借其 丰富的图书馆XLSX 文件提供了多种交互方式。在本教程中,我们将学习如何使用 IronXL是一个 Python Excel 库。

IronXL:Python Excel 库

IronXL Python 旨在帮助开发人员用 Python 轻松读写 Excel 文件。您不仅可以编写 Excel 文件,还可以一次性处理多个 Excel 表单。该库非常适合编写 Excel 文件,而无需在机器上安装 Microsoft Excel。

当你需要将数据直接导入 Excel 电子表格时,IronXL 就能帮上忙。IronXL 让处理 Excel 电子表格变得简单。它能帮助你轻松管理 XLSX 文件中多个表单的数据。

让我们看看如何 用 Python 读取 Excel 文件 使用 IronXL。

如何用 Python 读取 Excel 文件

以下步骤将介绍用 Python 读取 Excel 文件的过程。

1.在 Visual Studio 代码中创建 Python 文件。

2.使用 pip 安装 Python Excel 库。

3.加载我们需要读取的 Excel 文件

4.使用循环迭代 Excel 数据

5.在控制台显示迭代数据

先决条件

在学习本教程之前,请确保您的系统已安装以下先决条件:

  • .NET 6.0 SDK:IronXL 基于 .NET 开发,需要在系统中安装 .NET 6.0 SDK。
  • Python 3.0+:本教程假定您已安装 Python 3.0 或更高版本。

  • pip:确保安装了 Python 的软件包安装程序 pip,因为它将用于安装 IronXL。

设置环境

1.在 Visual Studio 代码中创建文件

打开 Visual Studio 代码,新建一个 Python 文件,文件名为 ReadExcel.py。该文件将包含我们使用 IronXL 读取 Excel 文件的脚本。

如何用 Python 读取 Excel 文件:图 1

2.安装 IronXL

在 Visual Studio Code 中打开命令行,从菜单中选择 "终端">"新建终端"。

如何用 Python 读取 Excel 文件:图 2

运行以下命令安装 IronXL:

 pip install IronXL

如何用 Python 读取 Excel 文件:图 3

编写代码

现在,让我们把代码分成几个部分,并解释每个部分。

导入图书馆

from ironxl import *     import sys
PYTHON

在这里,我们从 ironxl 库中导入了所有内容,该库提供了处理 Excel 文件的功能。 sys 用于设置 Python 的安装路径,这是 IronXL 正常运行所必需的。

设置 Python 安装路径

sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
PYTHON

sys.prefix 指定了 Python 安装目录的路径。这是一个准备步骤,可能不是每个环境都需要,但在某些配置中是必不可少的,以防止出现与路径相关的问题。

设置许可证密钥

License.LicenseKey = "License-Key";
PYTHON

IronXL 库需要一个有效的 许可证密钥 以解锁其所有功能。这行代码 License.LicenseKey = "License-Key";就是插入您获得的许可证密钥的地方。如果没有有效的许可证,IronXL 将无法运行。

加载工作簿

workbook = WorkBook.Load("data.xlsx")
PYTHON

本节脚本 workbook = WorkBook.Load("data.xlsx")演示如何加载 Excel 工作簿。 WorkBook.Load是 IronXL 提供的一种方法,用于打开由文件路径指定的现有 Excel 文件。

示例中使用了 "data.xlsx ",假定该文件与脚本位于同一目录下。如果文件位于其他目录,则需要提供完整的文件路径。

选择工作表

worksheet = workbook.WorkSheets[0]
PYTHON

加载工作簿后,下一步是选择工作表。工作簿.工作表[0] 行访问 Excel 文件中的第一个工作表。工作表的索引从 0 开始,因此该代码段实际上选择了第一个工作表。

读取和显示数据

print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
PYTHON

这部分脚本演示了如何读取和显示特定单元格中的数据。通过迭代单元格区域工作表中的单元格["A2:A5"]我们可以访问每个单元格的地址和文本值。您可以从工作表中的预定义区域获取信息。

进行计算

IronXL 提供了直接对 Excel 表单中的数据范围执行简单计算的函数。代码的以下部分演示了如何对指定范围内的数据执行简单的计算,如求和、最小值和最大值。

total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
PYTHON

寻找独特值

本部分脚本演示如何在 Excel 表的指定范围内查找唯一值:

unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
PYTHON

为此,我们使用了集合理解。Python 中的集合能自动消除重复条目,因此非常适合查找唯一值。该理解遍历范围 F2:F10 中的每个单元格,使用 cell.Text 访问每个单元格的文本内容。

通过将此迭代放在集合内,我们可以确保只保留唯一的值。

计算特定值的出现次数

最后,该代码段将计算特定值在给定范围内出现的次数。

specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

这里的目标是量化一个特定值的出现,在此标记为 specific_value。代码使用一个生成器表达式,遍历范围 G2:G10 中的每个单元格,将单元格的文本内容与 specific_value 进行比较。

对于包含目标值的每个单元格,表达式 cell.Text == specific_value 的值为true,否则为falsesum函数将这些布尔值相加,将True视为 1,False视为 0,从而有效计算特定值出现的次数。

完整代码示例

以下是完整的代码,以便更好地理解代码:

from ironxl import *     import sys
sys.prefix = r'C:\Users\User Name\AppData\Local\Programs\Python\Python312'
License.LicenseKey = "License-Key";
# Load the workbook
workbook = WorkBook.Load("data.xlsx")
# Select the worksheet at index 0
worksheet = workbook.WorkSheets[0]
# Display values in a specific range as an example
print("Sample data from A2:A5:")
for cell in worksheet["A2:A5"]:
    print("Cell {} has value '{}'".format(cell.AddressString, cell.Text))
# Calculate the sum of values in a different range
total_sum = worksheet["B2:B10"].Sum()
print("Total Sum of B2:B10: ", total_sum)
# Calculate the minimum value in another range
minimum_value = worksheet["C2:C10"].Min()
print("Minimum Value in C2:C10: ", minimum_value)
# Calculate the maximum value in a different range
maximum_value = worksheet["D2:D10"].Max()
print("Maximum Value in D2:D10: ", maximum_value)
# Find unique values in a specified range
unique_values = set(cell.Text for cell in worksheet["F2:F10"])
print("Unique Values in F2:F10: ", unique_values)
# Count occurrences of a specific value in a different range
specific_value = '5'  # Adjust this as needed based on your data
occurrences = sum(cell.Text == specific_value for cell in worksheet["G2:G10"])
print(f"Occurrences of value '{specific_value}' in G2:G10: ", occurrences)
PYTHON

输出

运行ReadExcel.py Python 文件后,您将在控制台中看到以下输出,它反映了脚本对 Excel 数据进行操作的结果。

如何用 Python 读取 Excel 文件:图 4

结论

在本教程中,我们探讨了如何设置 Python 环境,使用 IronXL 读取 Excel 文件。我们介绍了安装必要的软件、编写脚本以加载 Excel 工作簿、选择工作表、读取数据、执行基本数据分析操作等内容。

IronXL 为在 Python 中处理 Excel 文件提供了强大的应用程序接口,无需 Microsoft Excel 即可执行数据分析、数据清理和可视化任务。

无论您是分析销售数据、为报告导入数据,还是从 Excel 数据创建可视化,IronXL 都能为在 Python 应用程序中管理 Excel 文件提供强大的解决方案。

IronXL 提供了 免费试用 供用户探索其功能,对于准备完全集成其功能的用户,许可证从 $749 开始。

< 前一页
用于 Excel 文件的 Python 包(无需使用 Interop)
下一步 >
如何在Python中查看Excel文件

准备开始了吗? 版本: 2024.9 刚刚发布

免费下载pip 查看许可证 >