任意のPDFを検索可能でコピー可能なテキストにする
Ironの高度なTesseractエンジンを使用して、スキャンされたPDFドキュメントを検索可能およびインデックス化可能にし、ユーザーがコピー&ペーストできるテキストを提供します。
using IronOcr; var ocrTesseract = new IronTesseract(); using var ocrInput = new OcrInput(); ocrInput.LoadPdf("scan.pdf", Password: "password"); // Clean up twisted pages ocrInput.Deskew(); var ocrResult = ocrTesseract.Read(ocrInput); ocrResult.SaveAsSearchablePdf("searchable.pdf");
Imports IronOcr Private ocrTesseract = New IronTesseract() Private ocrInput = New OcrInput() ocrInput.LoadPdf("scan.pdf", Password:= "password") ' Clean up twisted pages ocrInput.Deskew() Dim ocrResult = ocrTesseract.Read(ocrInput) ocrResult.SaveAsSearchablePdf("searchable.pdf")
Install-Package IronOcr
Ironの高度なTesseractエンジンを使用して、スキャンされたPDFドキュメントを検索可能およびインデックス化可能にし、ユーザーがコピー&ペーストできるテキストを提供します。
10 の .NET API 製品 オフィス文書用