如何在 C# 中将结果保存为可搜索的 PDF

How to Save Results as a Searchable PDF

This article was translated from English: Does it need improvement?
Translated
View the article in English

可搜索 PDF 通常称为 OCR(光学字符识别)PDF,是一种同时包含扫描图像和机器可读文本的 PDF 文档。 这些 PDF 是通过对扫描的纸质文档或图像进行 OCR 处理、识别图像中的文本并将其转换为可选择和可搜索的文本而创建的。

IronOCR 提供了对文档进行光学字符识别并将结果导出为可搜索 PDF 的解决方案。 它支持将可搜索的 PDF 导出为文件、字节和流。

as-heading:2(快速入门:一行导出可搜索 PDF)</em

设置 RenderSearchablePdf = true,在您的输入上运行 Read(...) 并调用 SaveAsSearchablePdf(...) - 这就是使用 IronOCR 生成完全可搜索 PDF 的全部过程。

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    new IronOcr.IronTesseract { Configuration = { RenderSearchablePdf = true } } .Read(new IronOcr.OcrImageInput("file.jpg")).SaveAsSearchablePdf("searchable.pdf");
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer