在 IronOCR 中减小 PDF 文件大小
如何在IronOCR中减小输出PDF的文件大小?
IronOCR将自动放大检测为低质量(低于150DPI)的输入,以确保准确的读取结果。
如果检测到 DPI 低于 150,则 TargetDPI(默认 225DPI)定义了 PDF 的渲染 DPI——这与手动设置 TargetDPI = 225 是相同的。
要减小输出文件的大小,您可以设置较低的TargetDPI,这将创建更小的PDF文件,但过低可能会影响OCR的性能。 一切都在平衡中。
建议的值为96、72、48
// how to reduce and usage by by reducing DPI
//Example 1
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.TargetDPI = 96; // DPI of output, default is 225
Input.AddPdf("example.pdf", "password");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
//Example 2
var ocr = new IronTesseract();
using (var ocrInput = new OcrInput())
{
ocrInput.AddPdf("img/Input.pdf", 72); //TargetDPI
var ocrResult = ocr.Read(ocrInput);
ocrResult.SaveAsSearchablePdf(@"Output.pdf");
}
// how to reduce and usage by by reducing DPI
//Example 1
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.TargetDPI = 96; // DPI of output, default is 225
Input.AddPdf("example.pdf", "password");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
//Example 2
var ocr = new IronTesseract();
using (var ocrInput = new OcrInput())
{
ocrInput.AddPdf("img/Input.pdf", 72); //TargetDPI
var ocrResult = ocr.Read(ocrInput);
ocrResult.SaveAsSearchablePdf(@"Output.pdf");
}
' how to reduce and usage by by reducing DPI
'Example 1
Imports IronOcr
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.TargetDPI = 96 ' DPI of output, default is 225
Input.AddPdf("example.pdf", "password")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
'Example 2
Dim ocr = New IronTesseract()
Using ocrInput As New OcrInput()
ocrInput.AddPdf("img/Input.pdf", 72) 'TargetDPI
Dim ocrResult = ocr.Read(ocrInput)
ocrResult.SaveAsSearchablePdf("Output.pdf")
End Using
要禁用自动放大,请使用 TargetDPI = 0
。 这将忽略TargetDPI值,输入文件将按原样读取。
有关更多信息,请查看 API:https://ironsoftware.com/csharp/ocr/object-reference/api/IronOcr.OcrInput.html?q=targetdpi#IronOcr_OcrInput_TargetDPI