Hacer que cualquier PDF tenga texto que se pueda buscar y copiar
Podemos utilizar el avanzado motor Tesseract de Iron para hacer que los documentos PDF escaneados se puedan buscar e indexar, con texto que los usuarios puedan copiar y pegar.
using IronOcr; var ocrTesseract = new IronTesseract(); using var ocrInput = new OcrInput(); ocrInput.LoadPdf("scan.pdf", Password: "password"); // Clean up twisted pages ocrInput.Deskew(); var ocrResult = ocrTesseract.Read(ocrInput); ocrResult.SaveAsSearchablePdf("searchable.pdf");
Imports IronOcr Private ocrTesseract = New IronTesseract() Private ocrInput = New OcrInput() ocrInput.LoadPdf("scan.pdf", Password:= "password") ' Clean up twisted pages ocrInput.Deskew() Dim ocrResult = ocrTesseract.Read(ocrInput) ocrResult.SaveAsSearchablePdf("searchable.pdf")
Install-Package IronOcr
Podemos utilizar el avanzado motor Tesseract de Iron para hacer que los documentos PDF escaneados se puedan buscar e indexar, con texto que los usuarios puedan copiar y pegar.
9 productos API .NET para sus documentos de oficina