将任何 PDF 制作成可搜索、可复制的文本
我们可以使用 Iron 先进的 Tesseract 引擎,使扫描的 PDF 文档具有可搜索性和可索引性,用户可以复制和粘贴文本。
using IronOcr; var ocrTesseract = new IronTesseract(); using var ocrInput = new OcrInput(); ocrInput.LoadPdf("scan.pdf", Password: "password"); // Clean up twisted pages ocrInput.Deskew(); var ocrResult = ocrTesseract.Read(ocrInput); ocrResult.SaveAsSearchablePdf("searchable.pdf");
Imports IronOcr Private ocrTesseract = New IronTesseract() Private ocrInput = New OcrInput() ocrInput.LoadPdf("scan.pdf", Password:= "password") ' Clean up twisted pages ocrInput.Deskew() Dim ocrResult = ocrTesseract.Read(ocrInput) ocrResult.SaveAsSearchablePdf("searchable.pdf")
Install-Package IronOcr
我们可以使用 Iron 先进的 Tesseract 引擎,使扫描的 PDF 文档具有可搜索性和可索引性,用户可以复制和粘贴文本。