讓任何 PDF 擁有可搜索、可複製的文本
我們可以使用 Iron 的先進 Tesseract 引擎,使掃描的 PDF 文件可搜索和可索引,並且用戶可以複製和粘貼文本。
using IronOcr; var ocrTesseract = new IronTesseract(); using var ocrInput = new OcrInput(); ocrInput.LoadPdf("scan.pdf", Password: "password"); // Clean up twisted pages ocrInput.Deskew(); var ocrResult = ocrTesseract.Read(ocrInput); ocrResult.SaveAsSearchablePdf("searchable.pdf");
Imports IronOcr Private ocrTesseract = New IronTesseract() Private ocrInput = New OcrInput() ocrInput.LoadPdf("scan.pdf", Password:= "password") ' Clean up twisted pages ocrInput.Deskew() Dim ocrResult = ocrTesseract.Read(ocrInput) ocrResult.SaveAsSearchablePdf("searchable.pdf")
Install-Package IronOcr
我們可以使用 Iron 的先進 Tesseract 引擎,使掃描的 PDF 文件可搜索和可索引,並且用戶可以複製和粘貼文本。