将任何 PDF 制作成可搜索、可复制的文本
我们可以使用 Iron 先进的 Tesseract 引擎,使扫描的 PDF 文档具有可搜索性和可索引性,用户可以复制和粘贴文本。
using IronOcr;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadPdf("scan.pdf", Password: "password");
// Clean up twisted pages
ocrInput.Deskew();
var ocrResult = ocrTesseract.Read(ocrInput);
ocrResult.SaveAsSearchablePdf("searchable.pdf");Imports IronOcr
Private ocrTesseract = New IronTesseract()
Private ocrInput = New OcrInput()
ocrInput.LoadPdf("scan.pdf", Password:= "password")
' Clean up twisted pages
ocrInput.Deskew()
Dim ocrResult = ocrTesseract.Read(ocrInput)
ocrResult.SaveAsSearchablePdf("searchable.pdf")Install-Package IronOcr
我们可以使用 Iron 先进的 Tesseract 引擎,使扫描的 PDF 文档具有可搜索性和可索引性,用户可以复制和粘贴文本。