IronOCR 操作指南 可搜索的 PDFs How to Save Results as a Searchable PDF Chaknith Bin 已更新:九月 23, 2025 Download IronOCR NuGet 下载 DLL 下载 Windows 安装程序 Start Free Trial Copy for LLMs Copy for LLMs Copy page as Markdown for LLMs Open in ChatGPT Ask ChatGPT about this page Open in Gemini Ask Gemini about this page Open in Grok Ask Grok about this page Open in Perplexity Ask Perplexity about this page Share Share on Facebook Share on X (Twitter) Share on LinkedIn Copy URL Email article This article was translated from English: Does it need improvement? Translated View the article in English 可搜索 PDF 通常称为 OCR(光学字符识别)PDF,是一种同时包含扫描图像和机器可读文本的 PDF 文档。 这些 PDF 是通过对扫描的纸质文档或图像进行 OCR 处理、识别图像中的文本并将其转换为可选择和可搜索的文本而创建的。 IronOCR 提供了对文档进行光学字符识别并将结果导出为可搜索 PDF 的解决方案。 它支持将可搜索的 PDF 导出为文件、字节和流。 as-heading:2(快速入门:一行导出可搜索 PDF)</em 设置 RenderSearchablePdf = true,在您的输入上运行 Read(...) 并调用 SaveAsSearchablePdf(...) - 这就是使用 IronOCR 生成完全可搜索 PDF 的全部过程。 Get started making PDFs with NuGet now: Install IronOCR with NuGet Package Manager PM > Install-Package IronOcr Copy and run this code snippet. new IronOcr.IronTesseract { Configuration = { RenderSearchablePdf = true } } .Read(new IronOcr.OcrImageInput("file.jpg")).SaveAsSearchablePdf("searchable.pdf"); Deploy to test on your live environment Start using IronOCR in your project today with a free trial Free 30 day Trial 最小工作流程(5 个步骤)下载一个 C# 库,将结果保存为可搜索的 PDF 为 OCR 准备图像和 PDF 文档。 将 RenderSearchablePdf 属性设置为 true 使用 SaveAsSearchablePdf 方法输出可搜索的 PDF 文件。 以字节和字符串形式导出可搜索的 PDF. ## 导出为可搜索的 PDF 示例 下面介绍如何使用 IronOCR 将结果导出为可搜索的 PDF。 您必须首先将 `Configuration.RenderSearchablePdf` 属性设置为 `true`。 从 `Read` 方法中获取 OCR 结果对象后,使用 `SaveAsSearchablePdf` 方法指定输出文件路径。 下面的代码演示了如何使用示例 TIFF 文件。 ```csharp :path=/static-assets/ocr/content-code-examples/how-to/searchable-pdf-searchable-pdf.cs ``` 下面是 TIFF 样本的截图和嵌入的可搜索 PDF。 尝试选择 PDF 中的文本以确认其可搜索性。 选择功能还意味着可以在 PDF 浏览器中搜索文本。 {i:(IronOCR 使用特定字体在图像文件上叠加文字,这可能会导致文字大小上的一些差异)}] TIFF 文件 可搜索 PDF 导出为应用过滤器的可搜索 PDF 文件可搜索的字节和流 PDF 文件 常见问题解答 什么是可搜索的PDF? 可搜索的PDF是通过对扫描文档或图像进行OCR而生成的兼有扫描图像和可机读文本的文档,允许用户选择和搜索文件中的文本。 如何在C#中将扫描的文档转换为可搜索的PDF? 要在C#中将扫描文档转换为可搜索的PDF,请使用IronOCR,将Configuration.RenderSearchablePdf属性设置为true,使用Read方法执行OCR,然后使用SaveAsSearchablePdf保存输出。 我可以将可搜索的PDF导出为字节或流吗? 可以,IronOCR允许通过SaveAsSearchablePdfBytes导出为字节和通过SaveAsSearchablePdfStream导出为流。 如何处理不同文件格式以进行OCR处理? IronOCR支持TIFF等多种文件格式以进行OCR处理,允许从这些格式创建可搜索的PDF。 使用OCR技术创建的可搜索PDF中可以选择和搜索文本吗? 可以,使用IronOCR技术创建的可搜索PDF允许在PDF查看器中选择和搜索文本。 使用OCR创建可搜索PDF的步骤是什么? 步骤包括下载IronOCR C#库,为OCR准备文档,将RenderSearchablePdf属性设置为true,并使用SaveAsSearchablePdf方法保存文件。 如何确保我的PDF文件中的文本是可搜索的? 确保文本可搜索,使用IronOCR对图像执行OCR,并在保存文档前将RenderSearchablePdf属性设置为true。 IronOCR使用具体字体作为可搜索的PDF覆盖文本吗? 是的,IronOCR在图像文件上的覆盖文本使用具体字体,可能会导致文本大小出现差异。 Chaknith Bin 立即与工程团队聊天 软件工程师 Chaknith 在 IronXL 和 IronBarcode 工作。他在 C# 和 .NET 方面有着深厚的专业知识,帮助改进软件并支持客户。他从用户互动中获得的见解有助于更好的产品、文档和整体体验。 审核者 Jeffrey T. Fritz 首席项目经理 - .NET 社区团队 Jeff 也是 .NET 和 Visual Studio 团队的首席项目经理。他是 .NET Conf 虚拟会议系列的执行制片人,并主持“Fritz and Friends”直播节目,每周两次与观众一起谈论技术并编写代码。Jeff 撰写研讨会、演示文稿并计划包括 Microsoft Build、Microsoft Ignite、.NET Conf 和 Microsoft MVP 峰会在内的最大型微软开发者活动的内容。 准备开始了吗? Nuget 下载 5,044,537 | 版本: 2025.11 刚刚发布 免费 NuGet 下载 总下载量:5,044,537 查看许可证