How to set DPI Setting in OCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

Le nombre de points par pouce (DPI) est une mesure fondamentale de la qualité de l'image, qui détermine le niveau de détail d'un document scanné ou d'une photographie numérique. Si la numérisation de documents est un moyen rapide et efficace de numériser des documents physiques, le processus peut souvent donner lieu à des fichiers de faible résolution, en particulier lorsque l'on utilise les paramètres par défaut ou les paramètres de "numérisation rapide". Ce manque de détails rend le texte flou ou pixellisé, ce qui constitue un obstacle important pour l'extraction des données.

C'est là que les performances de l'OCR sont directement affectées. Les moteurs OCR analysent les formes et les motifs précis des caractères pour les convertir en texte lisible par une machine. Lorsqu'une image a un faible DPI, il n'y a pas assez de pixels pour définir clairement chaque lettre, ce qui entraîne une perte de détails et des résultats imprécis.

Cependant, IronOCR est conçu pour surmonter ces défis courants. Elle a été finement réglée pour atteindre une grande précision sur des scans avec des résolutions aussi basses que 225 DPI.

Démarrage rapide : définir l'interface utilisateur cible pour des résultats d'OCR plus nets

En une simple ligne, vous pouvez configurer IronOCR pour mettre à l'échelle les images de faible résolution - améliorant ainsi la clarté et la reconnaissance du texte avec un minimum d'effort. Les développeurs peuvent démarrer instantanément en utilisant l'API propre d'IronOCR.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrInput { TargetDPI = 300 }.LoadImage("low-res.png"));
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer

Exemple de réglage du DPI

Cet exemple utilise un échantillon d'image avec une faible résolution d'environ 100 DPI et ajoute du bruit artificiel pour démontrer l'efficacité de la fonctionnalitéTargetDPI.

Le texte de l'image est le suivant : "Testing testing testing testing blurry text example example example".

Blurry Text Image

Exemple de code

Dans cet exemple, nous allons définir leTargetDPI à 300 pour augmenter la résolution de l'image à 300 DPI. Ensuite, nous chargerons l'image d'entrée ci-dessus et imprimerons le test extrait avecText et le niveau de confiance avecConfidence.

:path=/static-assets/ocr/content-code-examples/how-to/dpi-setting.cs
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

using var ocrInput = new OcrInput();
// Set the target DPI to 300 for better OCR accuracy
ocrInput.TargetDPI = 300;

ocrInput.LoadImage(@"images\image.png");

// Perform OCR on the image with the specified DPI
var ocrResult = ocrTesseract.Read(ocrInput);
// Display the text extracted from the image
Console.WriteLine(ocrResult.Text);
// Display the confidence level of the OCR result
Console.WriteLine(ocrResult.Confidence);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Sortie

Text Output

Comme le montre le résultat, IronOCR obtient un score de confiance de 85 %. Malgré le bruit important et le faible DPI initial de l'image source, le résultat est exceptionnellement précis, ce qui démontre la puissance de la fonction de mise à l'échelle.

IronOCR comprend des fonctionnalités intégrées capables d'améliorer automatiquement les images basse résolution en les mettant à l'échelle, le tout au sein d'une bibliothèque unique.

Comparaison des paramètres DPI

Pour illustrer la différence, voici le résultat du traitement de la même image basse résolution sans définir la propriétéTargetDPI.

Trouver le bon DPI est un équilibre. Une résolution élevée est plus précise mais plus lente ; le faible DPI est plus rapide mais moins fiable. En cas de doute, laissez le prétraitement automatique d'Iron Tesseract déterminer les paramètres optimaux. Vous pouvez également désactiver la mise à l'échelle automatique en définissant la propriété TargetDPI sur 0 .

Sortie

Text Output

Sans mise à l'échelle, le taux de confiance tombe à 79 % et le texte extrait est nettement moins précis. Cette comparaison montre clairement comment la définition d'un TargetDPI peut améliorer considérablement les résultats de l'OCR sur des images de faible qualité.

Configuration du DPI pour les PDF

Lors du traitement d'un PDF, IronOcr met à l'échelle l'ensemble du document en fonction du DPI cible, et pas seulement les images qu'il contient.

Si un DPI plus élevé permet souvent d'obtenir de meilleurs résultats en matière d'OCR, le réglage optimal peut varier considérablement d'un PDF à l'autre. Supposons que vous ne sachiez pas quelle valeur utiliser. Dans ce cas, il est préférable de laisser le DPI à sa valeur par défaut et de permettre à IronOcr de déterminer automatiquement la meilleure configuration pour votre document.

[La valeur maximale pour TargetDPI est de 32 766. La définition d'un DPI supérieur à cette limite entraînera une exception. En effet, les dimensions de l'image résultante dépasseraient la taille maximale supportée par Tesseract, à savoir 32 767 x 32 767 pixels. Si la limite est dépassée, vous recevrez le message d'erreur suivant : targetDPI est trop élevé et donnerait une image trop grande ({nouvelle_largeur} x {nouvelle_hauteur}) pour Tesseract. La taille maximale de l'image pour Tesseract est de 32767 x 32767')}]

Questions Fréquemment Posées

Qu'est-ce que le DPI dans le contexte de l'OCR ?

DPI signifie points par pouce, qui mesure la résolution d'une image. Dans l'OCR, définir le DPI approprié peut améliorer la précision de la reconnaissance de texte, notamment dans les images basse résolution.

Comment le paramétrage DPI affecte-t-il la précision OCR dans IronOCR ?

Définir le bon DPI dans IronOCR peut considérablement améliorer la précision de reconnaissance de texte en fournissant des entrées d'image plus claires, réduisant les erreurs d'identification des caractères, notamment dans les images basse résolution.

Quels sont les paramètres DPI recommandés pour des résultats OCR optimaux ?

Pour des résultats OCR optimaux, il est recommandé d'utiliser des images avec un DPI d'au moins 300. Cependant, IronOCR propose des fonctionnalités pour augmenter la résolution des images, permettant un OCR efficace sur les images à DPI plus bas.

Puis-je augmenter la résolution des images basse résolution dans IronOCR pour de meilleurs résultats ?

Oui, IronOCR offre une fonctionnalité d'amélioration de la résolution d'image qui peut augmenter la résolution des images de faible qualité, améliorant ainsi la précision OCR.

IronOCR prend-il en charge le réglage automatique des DPI ?

IronOCR permet des paramètres DPI personnalisables, permettant des ajustements automatiques pour optimiser les performances OCR en fonction de la qualité de l'image entrée.

Comment définir le DPI dans IronOCR en utilisant C# ?

Vous pouvez définir le DPI dans IronOCR en spécifiant la valeur DPI souhaitée dans votre code C#. La documentation fournit des exemples de code pour vous guider dans ce processus.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Prêt à commencer?
Nuget Téléchargements 5,044,537 | Version : 2025.11 vient de sortir