如何在 OCR C# 中读取 PDF

How to Read PDFs

This article was translated from English: Does it need improvement?
Translated
View the article in English

PDF 是 "便携式文档格式 "的缩写。它是由 Adobe 公司开发的一种文件格式,可以保留任何源文件的字体、图像、图形和布局,而与创建文件时使用的应用程序和平台无关。 PDF 文件通常用于共享和查看格式一致的文档,无论使用何种软件或硬件打开。 IronOcr 可以轻松处理各种版本的 PDF 文档。

as-heading:2(快速入门:几秒钟内 OCR 一个 PDF 文件)</em

使用 IronOCR 快速设置 OCR,只需构建一个指向 PDF 的 OcrPdfInput,然后调用 Read 即可,无需复杂的配置。 这个单行示例展示了使用 IronOCR 从 PDF 中提取文本是多么容易。

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    using var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrPdfInput("document.pdf", PdfContents.TextAndImages));
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer

常见问题解答

如何在 C# 中读取 PDF 文件?

您可以通过使用 IronOCR 在 C# 中读取 PDF 文件。首先实例化 IronTesseract 类,然后使用 'using' 语句创建一个带有文件路径的 OcrPdfInput 对象。最后,应用 Read 方法对文档进行 OCR。

执行 PDF 特定页面上的 OCR 需要哪些步骤?

要使用 IronOCR 在 PDF 的特定页面上执行 OCR,请在构造 OcrPdfInput 时将页面索引列表传递给 PageIndices 参数。在 IronOCR 中,页面索引是从零开始的,因此第一页的索引为 0。

如何提高 PDF 上的 OCR 准确性?

您可以在构造 OcrPdfInput 时指定更高的 DPI,以提高 IronOCR 中 PDF 的 OCR 准确性。虽然通常没有必要,但更高的 DPI 可以提高阅读精度。

是否可以选择 PDF 的特定区域进行 OCR 处理?

是的,使用 IronOCR,您可以使用 SelectRegion 方法选择 PDF 的特定区域进行 OCR 处理。这使您能够专注于从定义的区域提取内容,从而提高效率。

在读取 PDF 页面时,零基编号的重要性是什么?

在 IronOCR 中,零基编号用于指定读取 PDF 页面的页面索引。这意味着第一页的索引为 0,这有助于准确指定要处理的页面。

在对 PDF 执行 OCR 时,我需要手动管理资源吗?

使用 IronOCR 时,建议在使用 OcrInput 对象时使用 'using' 语句。这可确保在 OCR 过程完成后正确释放资源。

如何开始使用 IronOCR 进行 PDF 阅读?

要开始使用 IronOCR 阅读 PDF,请从 NuGet 下载 C# 库,准备您的 PDF,使用文件路径构造 OcrPdfInput 对象,并使用 Read 方法进行 OCR 处理。

Curtis Chau
技术作家

Curtis Chau 拥有卡尔顿大学的计算机科学学士学位,专注于前端开发,精通 Node.js、TypeScript、JavaScript 和 React。他热衷于打造直观且美观的用户界面,喜欢使用现代框架并创建结构良好、视觉吸引力强的手册。

除了开发之外,Curtis 对物联网 (IoT) 有浓厚的兴趣,探索将硬件和软件集成的新方法。在空闲时间,他喜欢玩游戏和构建 Discord 机器人,将他对技术的热爱与创造力相结合。

审核者
Jeff Fritz
Jeffrey T. Fritz
首席项目经理 - .NET 社区团队
Jeff 也是 .NET 和 Visual Studio 团队的首席项目经理。他是 .NET Conf 虚拟会议系列的执行制片人,并主持“Fritz and Friends”直播节目,每周两次与观众一起谈论技术并编写代码。Jeff 撰写研讨会、演示文稿并计划包括 Microsoft Build、Microsoft Ignite、.NET Conf 和 Microsoft MVP 峰会在内的最大型微软开发者活动的内容。
准备开始了吗?
Nuget 下载 5,044,537 | 版本: 2025.11 刚刚发布