在文档中读取表格

VB C#

using IronOcr;
using System.Linq;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var input = new OcrInput();
input.LoadPdf("table.pdf");

// Perform OCR
var result = ocr.ReadDocumentAdvanced(input);

var cellList = result.Tables.First().CellInfos;

Imports IronOcr
Imports System.Linq

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private input = New OcrInput()
input.LoadPdf("table.pdf")

' Perform OCR
Dim result = ocr.ReadDocumentAdvanced(input)

Dim cellList = result.Tables.First().CellInfos

Install-Package IronOcr

在文档中读取表格

该代码示例演示了如何使用 IronTesseract OCR 引擎从PDF文档中提取文本和表格数据。

创建 IronTesseract OCR 引擎的实例。
初始化一个 OcrInput 对象，并使用 LoadPdf 方法加载一个PDF文件（table.pdf）。
OCR 引擎使用 ReadDocumentAdvanced 方法处理文档，返回更详细的 OcrResult 对象。
使用 result.Tables.First() 访问文档中找到的第一个表格，并使用 CellInfos 提取该表格的单元信息。
现在 cellList 中的单元数据列表包含了表格的单元，包括文本内容和其他详细信息（例如，单元位置、大小）。
此方法可用于从 PDF 中提取结构化数据（如表格），允许以编程方式访问和处理每个表格单元格中的文本。

探索如何使用 IronOCR 读取 PDF 中的表格。

准备开始了吗？

Nuget 下载 6,175,195 | 版本: 2026.7 刚刚发布

查看许可证

还在滚动吗？

想快速获得证据？ PM > Install-Package IronOcr
运行示例观看您的图像变成可搜索文本。

查看许可证

免费开始

无需信用卡

在实际环境中测试

在生产环境中测试，没有水印。
在您需要的地方使用。

功能齐全的产品

使用功能齐全的产品30天。
几分钟内即可启动和运行。

24/5 技术支持

在产品试用期间，全面访问我们的支持工程团队

免费开始

试用表单已成功提交。

预定免费现场演示

无联系方式、无银行卡信息、无承诺预约 30 分钟的个人演示。

下面是您可以期待的内容：

我们产品及其关键功能的在线演示

获取项目特定功能建议

我们会回答您的所有问题，确保您获得所需的全部信息。(无任何承诺）。

预定免费现场演示

您的预订已完成请检查您的电子邮件以获得确认。

在线 24/5

需要帮助吗？我们的销售团队很乐意为您服务。

试用Enterprise版

无需信用卡或创建账户无任何限制。100% 解锁。无需信用卡。

加入数百万试用过 IronPDF 的工程师行列

钢铁支援团队

我们每周 5 天，每天 24 小时在线。

聊天

电子邮件

打电话给我