PDF OCR文字提取

VB C#

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

using var ocrInput = new OcrInput();

// OCR entire document
ocrInput.LoadPdf("example.pdf", Password: "password");

int[] pages = { 1, 2, 3, 4, 5 };

// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");

var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);

Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()

Private ocrInput = New OcrInput()

' OCR entire document
ocrInput.LoadPdf("example.pdf", Password:= "password")

Dim pages() As Integer = { 1, 2, 3, 4, 5 }

' Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")

Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)

Install-Package IronOcr

PDF OCR文字提取

Iron Tesseract 可以读取多种图像格式以及 PDF 文档。传统的免费 Tesseract 引擎无法实现此功能。

OcrInput提供了如果扫描质量不好，则自动纠正PDF特征的选项。

开发者可以指定读取整个 PDF 文件、选定的页面或单个裁剪区域。

如何在 C# 中对 PDF 文件进行 OCR 识别

下载用于 OCR PDF 文件的 C# 库
使用AddPdf方法添加 PDF 文档
使用AddPdfPages方法添加 PDF 文档的特定页面
使用Read方法对添加的PDF文件执行OCR识别。
在Barcodes属性中查看所有二维码值。访问"文本"属性以检索 OCR 结果。

C# PDF OCR

许多 OCR 工具在最佳条件下都能正常工作，但如果您需要一款在任何条件下都能以更高的稳定性和准确性完成工作的 OCR 工具，那么 IronOCR 文本提取解决方案就是您的理想之选。

IronOCR 是一款用于文本提取的工具，从底层架构开始构建，能够以 99% 的准确率转换真实世界的图像。

,IronTesseract,我们的原生C# OCR库，可以从不总是高质量并且有时倾斜的现实世界图像中以近乎人类的方式识别字符。

如果扫描质量较差，我们的 OCR 功能可以自动纠正 PDF 或图像特征。

我将带您了解目前最好的 OCR 解决方案，您就会亲眼见证它的优势。

为什么选择 IronOCR 进行图像或 PDF OCR 文本提取？

选择 IronOCR 解决方案进行 Tesseract 管理显然是明智之举，因为它具备以下独特功能：

IronOCR 的 PDF OCR 文本提取引擎可在纯 .NET 环境中开箱即用。
它不要求您的机器上安装 Tesseract。
它与最新的引擎 Tesseract 5（以及 Tesseract 4 和 3）配合使用效果非常好。
它适用于任何 .NET 项目：.NET Framework 4.5 +、.NET Standard 2 + 以及 .NET Core 2、3 和 5！
与其他开源 Tesseract 相比，它提高了准确性和速度。
IronOCR 支持 Xamarin、Mono、Azure 和 Docker 开发平台。
您可以使用 NuGet 包管理复杂的 Tesseract 字典系统。
它可以从 PDF、多帧 Tiff 和所有主要图像文件中提取文本，无需任何额外的处理。
它可以校正低质量和倾斜的图像扫描，从而在文本提取项目中获得最佳结果。

你们有低质量的扫描件吗？没问题！

在 OCR 任务方面，IronOCR 表现出色，处于更高的水平。实际上，许多类似产品都是为了配合机器打印的高分辨率完美文本或图像而设计的，因此在实际应用中会变得不准确或失效。然而，IronOCR 的情况并非如此。

IronOCR 在纠正不完美文档方面表现出色。它可以矫正倾斜的扫描图像，并增强低质量照片，使它们变成可搜索的 PDF 文档或图像。这正是我们产品区别于其他产品的优势所在。

调整 IronOCR 性能以适应您的工作流程

借助 Iron Software OCR 解决方案，您可以调整文本提取任务的性能，从而为您的工作流程找到合适的平衡点。我们知道这对许多用户和开发者来说非常重要，因此我们构建的 OCR 解决方案具有性能可调性和灵活性。

例如，影响 OCR 作业速度的一个非常重要的因素是输入图像的质量。背景噪声越少，图像的 dpi 越高（200 dpi 是一个不错的范围），OCR 的生成速度就越快，结果也越准确。但是，借助 IronOCR 的性能调优功能，即使是低质量图像的任务也能快速完成。

此外，选择数字噪声较小的输入图像或扫描文本格式（如 PNG 或 TIFF）也可以比选择 JPEG 等低质量图像格式更快地获得结果。

安装 IronOCR 解决方案非常简单

Iron Software 套件安装和运行都非常简便。它适用于大多数主流开发平台。我们的解决方案具有跨平台支持，包括 Windows、Linux、macOS、Azure、AWS 和 Docker——C# 成为开发人员最青睐的 Tesseract OCR 引擎是有原因的。

支持超过 125 种国际语言

对于 OCR 工作而言，如果一款软件支持多种语言，那么它的实用性就会大大提高。 IronOCR解决方案之所以不可或缺，是因为它支持125种国际语言。这些语言可以通过以 DLL 文件形式分发的语言包进行安装。可以从本网站或 Visual Studio 的 NuGet 程序包管理器下载。

如何安装OCR语言包

支持一百二十种语言。您可以使用以下两种方法下载任何其他 OCR 语言包：

安装 NuGet 包

在NuGet中搜索IronOCR语言。

使用OCR数据方法

下载ocrdata文件并将其添加到您的.NET项目或程序文件中。

轻松地从扫描的文件或图像创建可搜索的文档

我们非常引以为豪的一项功能是，我们的 Tesseract 软件能够从输入的图像或扫描的 PDF 文件创建可搜索的 PDF 文档或文本。您可以使用 C# 和 VB.NET 将 OCR 结果导出为可搜索的 PDF 文档。这确实可以帮助企业和政府进行数据库填充、搜索引擎优化和PDF文件生成。

充分利用最佳 OCR 工具的强大功能

IronOCR 是同类产品中从图像和文档中提取文本的最佳工具。它具备许多特性、功能和解决方案，让您在完成 OCR 任务时获得轻松流畅的体验。

我们的 OCR Tesseract C# 库可以帮助您在 C# 和 .NET 应用程序等开发环境中从图像和扫描文档中提取文本。

using IronOCR，您甚至可以轻松打开受密码保护的 PDF 文档，并顺利提取文本。

它还具有以下特点：

不需要可执行文件或 C++ 代码
完全支持 PDF OCR
兼容 MVC、Web 应用程序、桌面应用程序、控制台应用程序和服务器应用程序。
完全支持 .NET Core、Standard 和 Framework
使用C# & VB .NET读取
可读取二维码和条形码
将 OCR 内容导出为 XHTML 或可搜索的 PDF 文档
支持多线程
提取图像、坐标、统计数据、字体等等

迈出进阶铁人障碍赛的勇敢一步

考虑到这款出色的 OCR 解决方案的诸多功能，如果您决定尝试 IronOCR，绝对不会错。

使用我们的软件只需点击几下鼠标。首先安装 IronOCR——这非常简单。此外，我们还提供了非常有帮助且详细的分步指南，指导您如何使用我们的任何工具和操作方法，更不用说我们资源丰富的支持中心，该中心会尽快（几乎是立即）回复您的查询。

不要犹豫——今天就选择 IronOCR。这是学习如何在 C# 中读取 PDF 文件的第一步，也是最重要的一步。

如果您还有任何疑虑，我们的免费试用许可证密钥正是您所需要的。它可以帮助您充分探索最新版本 IronOCR 的全部潜力，且无需任何财务条件。它可以帮助您决定哪种软件许可证最适合您。如果您不确定，请随时联系我们的专家团队，无论您身在何处。

学习如何使用 IronOCR 创建可搜索的 PDF

准备开始了吗？

Nuget 下载 6,136,090 | 版本: 2026.7 刚刚发布

查看许可证

还在滚动吗？

想快速获得证据？ PM > Install-Package IronOcr
运行示例观看您的图像变成可搜索文本。

查看许可证

免费开始

无需信用卡

在实际环境中测试

在生产环境中测试，没有水印。
在您需要的地方使用。

功能齐全的产品

使用功能齐全的产品30天。
几分钟内即可启动和运行。

24/5 技术支持

在产品试用期间，全面访问我们的支持工程团队

免费开始

试用表单已成功提交。

预定免费现场演示

无联系方式、无银行卡信息、无承诺预约 30 分钟的个人演示。

下面是您可以期待的内容：

我们产品及其关键功能的在线演示

获取项目特定功能建议

我们会回答您的所有问题，确保您获得所需的全部信息。(无任何承诺）。

预定免费现场演示

您的预订已完成请检查您的电子邮件以获得确认。

在线 24/5

需要帮助吗？我们的销售团队很乐意为您服务。

试用Enterprise版

无需信用卡或创建账户

加入数百万试用过 IronPDF 的工程师行列

钢铁支援团队

我们每周 5 天，每天 24 小时在线。

聊天

电子邮件

打电话给我