Réduire la taille du fichier de sortie PDF dans IronOCR
Comment réduire la taille du fichier de sortie PDF dans IronOCR ?
IronOCR augmente automatiquement l'échelle des entrées détectées comme étant de faible qualité (inférieur à 150DPI) pour garantir des résultats de lecture précis.
Si un DPI inférieur à 150 est détecté, TargetDPI (par défaut 225DPI) définit le DPI auquel un PDF est rendu - cela revient à définir manuellement TargetDPI = 225.
Pour réduire la taille du fichier de sortie, vous pouvez définir une valeur plus faible pour le paramètre TargetDPI, ce qui créera des PDF plus petits, mais une valeur trop faible risque d'affecter les performances de l'OCR. Tout est en équilibre.
Les valeurs suggérées sont 96, 72, 48
// how to reduce and usage by by reducing DPI
//Example 1
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.TargetDPI = 96; // DPI of output, default is 225
Input.AddPdf("example.pdf", "password");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
//Example 2
var ocr = new IronTesseract();
using (var ocrInput = new OcrInput())
{
ocrInput.AddPdf("img/Input.pdf", 72); //TargetDPI
var ocrResult = ocr.Read(ocrInput);
ocrResult.SaveAsSearchablePdf(@"Output.pdf");
}
// how to reduce and usage by by reducing DPI
//Example 1
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.TargetDPI = 96; // DPI of output, default is 225
Input.AddPdf("example.pdf", "password");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
//Example 2
var ocr = new IronTesseract();
using (var ocrInput = new OcrInput())
{
ocrInput.AddPdf("img/Input.pdf", 72); //TargetDPI
var ocrResult = ocr.Read(ocrInput);
ocrResult.SaveAsSearchablePdf(@"Output.pdf");
}
' how to reduce and usage by by reducing DPI
'Example 1
Imports IronOcr
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.TargetDPI = 96 ' DPI of output, default is 225
Input.AddPdf("example.pdf", "password")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
'Example 2
Dim ocr = New IronTesseract()
Using ocrInput As New OcrInput()
ocrInput.AddPdf("img/Input.pdf", 72) 'TargetDPI
Dim ocrResult = ocr.Read(ocrInput)
ocrResult.SaveAsSearchablePdf("Output.pdf")
End Using
Pour désactiver la mise à l'échelle automatique, utilisez TargetDPI = 0
. La valeur TargetDPI est alors ignorée et le fichier d'entrée est lu tel quel.
Voir l'API pour plus d'informations : https://ironsoftware.com/csharp/ocr/object-reference/api/IronOcr.OcrInput.html?q=targetdpi#IronOcr_OcrInput_TargetDPI