Réduire la taille des fichiers PDF dans IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

Comment réduire la taille du fichier de sortie PDF dans IronOCR ?

IronOCR augmente automatiquement l'échelle des entrées détectées comme étant de faible qualité(inférieur à 150DPI) pour garantir des résultats de lecture précis.

Si un DPI inférieur à 150 est détecté, TargetDPI(par défaut 225DPI) définit le DPI auquel un PDF est rendu - cela revient à définir manuellement TargetDPI = 225.

Pour réduire la taille du fichier de sortie, vous pouvez définir une valeur plus faible pour le paramètre TargetDPI, ce qui créera des PDF plus petits, mais une valeur trop faible risque d'affecter les performances de l'OCR. Tout est en équilibre.

Les valeurs suggérées sont 96, 72, 48

// how to reduce and usage by by reducing DPI
    //Example 1
    using IronOcr;
    var Ocr = new IronTesseract();
    using (var Input = new OcrInput())
    {
        Input.TargetDPI = 96;    // DPI of output, default is 225
        Input.AddPdf("example.pdf", "password");
        var Result = Ocr.Read(Input);
        Console.WriteLine(Result.Text);
    }

    //Example 2
    var ocr = new IronTesseract();
    using (var ocrInput = new OcrInput())
    {
    ocrInput.AddPdf("img/Input.pdf", 72); //TargetDPI
    var ocrResult = ocr.Read(ocrInput);
    ocrResult.SaveAsSearchablePdf(@"Output.pdf");
    }
// how to reduce and usage by by reducing DPI
    //Example 1
    using IronOcr;
    var Ocr = new IronTesseract();
    using (var Input = new OcrInput())
    {
        Input.TargetDPI = 96;    // DPI of output, default is 225
        Input.AddPdf("example.pdf", "password");
        var Result = Ocr.Read(Input);
        Console.WriteLine(Result.Text);
    }

    //Example 2
    var ocr = new IronTesseract();
    using (var ocrInput = new OcrInput())
    {
    ocrInput.AddPdf("img/Input.pdf", 72); //TargetDPI
    var ocrResult = ocr.Read(ocrInput);
    ocrResult.SaveAsSearchablePdf(@"Output.pdf");
    }
' how to reduce and usage by by reducing DPI
	'Example 1
	Imports IronOcr
	Private Ocr = New IronTesseract()
	Using Input = New OcrInput()
		Input.TargetDPI = 96 ' DPI of output, default is 225
		Input.AddPdf("example.pdf", "password")
		Dim Result = Ocr.Read(Input)
		Console.WriteLine(Result.Text)
	End Using

	'Example 2
	Dim ocr = New IronTesseract()
	Using ocrInput As New OcrInput()
	ocrInput.AddPdf("img/Input.pdf", 72) 'TargetDPI
	Dim ocrResult = ocr.Read(ocrInput)
	ocrResult.SaveAsSearchablePdf("Output.pdf")
	End Using
VB   C#

Pour désactiver la mise à l'échelle automatique, utilisez TargetDPI = 0. La valeur TargetDPI est alors ignorée et le fichier d'entrée est lu tel quel.

Voir l'API pour plus d'informations :https://ironsoftware.com/csharp/ocr/object-reference/api/IronOcr.OcrInput.html?q=targetdpi#IronOcr_OcrInput_TargetDPI