Comment configurer la résolution DPI en OCR avec C

This article was translated from English: Does it need improvement?
Translated
View the article in English

Le nombre de points par pouce (DPI) est une mesure fondamentale de la qualité d'image, déterminant le niveau de détail présent dans un document numérisé ou une photographie numérique. Bien que la numérisation de documents soit un moyen rapide et efficace de numériser des documents physiques, le processus peut souvent aboutir à des fichiers de faible résolution, en particulier lors de l'utilisation des paramètres par défaut ou de " numérisation rapide ". Ce manque de détails rend le texte flou ou pixélisé, ce qui constitue un obstacle important à l'extraction des données.

C'est là que les performances de la reconnaissance optique de caractères (OCR) sont directement impactées. Les moteurs OCR fonctionnent en analysant les formes et les motifs précis des caractères pour les convertir en texte lisible par machine. Lorsqu'une image a une faible résolution (DPI), il n'y a pas assez de pixels pour définir clairement chaque lettre, ce qui entraîne une perte de détails fins et des résultats inexacts.

Cependant, IronOCR est conçu pour surmonter ces difficultés courantes. Il a été optimisé pour obtenir une grande précision sur des numérisations avec des résolutions aussi faibles que 225 DPI.

Démarrage rapide : Définir la résolution cible pour des résultats OCR plus nets

En une seule ligne de commande, vous pouvez configurer IronOCR pour améliorer la résolution des images basse résolution, ce qui améliore la clarté et la reconnaissance du texte avec un minimum d'effort. Les développeurs peuvent démarrer immédiatement grâce à l'API claire d'IronOCR.

Nuget IconCommencez dès maintenant à créer des PDF avec NuGet :

  1. Installez IronOCR avec le gestionnaire de packages NuGet

    PM > Install-Package IronOcr

  2. Copiez et exécutez cet extrait de code.

    var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrInput { TargetDPI = 300 }.LoadImage("low-res.png"));
  3. Déployez pour tester sur votre environnement de production.

    Commencez à utiliser IronOCR dans votre projet dès aujourd'hui grâce à un essai gratuit.
    arrow pointer

Exemple de configuration DPI

Cet exemple utilise une image de test avec une faible résolution d'environ 100 DPI et ajoute du bruit artificiel pour démontrer l'efficacité de la fonction TargetDPI .

Le texte réel de l'image est : " Test test test texte flou exemple exemple exemple ".

Image de texte floue

Exemple de Code

Dans cet exemple, nous allons définir la TargetDPI à 300 pour augmenter la résolution de l'image à 300 DPI. Ensuite, nous chargerons l'image d'entrée ci-dessus et imprimerons le test extrait avec Text et le niveau de confiance avec Confidence .

:path=/static-assets/ocr/content-code-examples/how-to/dpi-setting.cs
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

using var ocrInput = new OcrInput();
// Set the target DPI to 300 for better OCR accuracy
ocrInput.TargetDPI = 300;

ocrInput.LoadImage(@"images\image.png");

// Perform OCR on the image with the specified DPI
var ocrResult = ocrTesseract.Read(ocrInput);
// Display the text extracted from the image
Console.WriteLine(ocrResult.Text);
// Display the confidence level of the OCR result
Console.WriteLine(ocrResult.Confidence);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Sortie

Sortie de texte

Comme le montrent les résultats, IronOCR atteint un score de confiance de 85 %. Malgré le bruit important et la faible résolution initiale de l'image source, le résultat est d'une précision exceptionnelle, démontrant la puissance de la fonction de mise à l'échelle.

IronOCR intègre des fonctionnalités permettant d'améliorer automatiquement les images basse résolution en les agrandissant, le tout au sein d'une seule bibliothèque.

Comparaison des paramètres DPI

Pour illustrer la différence, voici le résultat du traitement de la même image basse résolution sans définir la propriété TargetDPI .

Trouver le bon DPI est une question d'équilibre. Un DPI élevé est plus précis mais plus lent ; Un faible DPI est plus rapide mais moins fiable. En cas de doute, laissez le prétraitement automatique d'Iron Tesseract déterminer les paramètres optimaux. Vous pouvez également désactiver la mise à l'échelle automatique en définissant la propriété TargetDPI sur 0.

Sortie

Sortie de texte

Sans mise à l'échelle, le score de confiance chute à 79 % et le texte extrait est nettement moins précis. Cette comparaison met clairement en évidence comment la définition d'un TargetDPI peut améliorer considérablement les résultats de la reconnaissance optique de caractères (OCR) sur des images de faible qualité.

Paramètres DPI pour PDF

Lors du traitement d'un PDF, IronOCR mettra à l'échelle l'ensemble du document à la résolution cible (DPI), et non seulement les images qu'il contient.

Bien qu'une résolution DPI plus élevée puisse souvent conduire à de meilleurs résultats OCR, le réglage optimal peut varier considérablement d'un PDF à l'autre. Supposons que vous ne sachiez pas quelle valeur utiliser. Dans ce cas, il est préférable de laisser le DPI à sa valeur par défaut et de laisser IronOCR déterminer automatiquement la meilleure configuration pour votre document.

Avertissement La valeur maximale de TargetDPI est de 32 766. Définir une valeur DPI supérieure à cette limite entraînera une exception. Cela se produit car les dimensions de l'image résultante dépasseraient la taille maximale prise en charge par Tesseract, soit 32 767 x 32 767 pixels. Si la limite est dépassée, vous recevrez le message d'erreur suivant :
'La résolution cible est trop élevée et donnerait une image trop grande ({new_width} x {new_height}) pour Tesseract. La taille maximale d'image pour Tesseract est de 32767 x 32767 pixels.

Questions Fréquemment Posées

Qu'est-ce que le DPI dans le contexte de l'OCR ?

DPI signifie points par pouce, qui mesure la résolution d'une image. Dans l'OCR, définir le DPI approprié peut améliorer la précision de la reconnaissance de texte, notamment dans les images basse résolution.

Comment le paramétrage DPI affecte-t-il la précision OCR dans IronOCR ?

Définir le bon DPI dans IronOCR peut considérablement améliorer la précision de reconnaissance de texte en fournissant des entrées d'image plus claires, réduisant les erreurs d'identification des caractères, notamment dans les images basse résolution.

Quels sont les paramètres DPI recommandés pour des résultats OCR optimaux ?

Pour des résultats OCR optimaux, il est recommandé d'utiliser des images avec un DPI d'au moins 300. Cependant, IronOCR propose des fonctionnalités pour augmenter la résolution des images, permettant un OCR efficace sur les images à DPI plus bas.

Puis-je augmenter la résolution des images basse résolution dans IronOCR pour de meilleurs résultats ?

Oui, IronOCR offre une fonctionnalité d'amélioration de la résolution d'image qui peut augmenter la résolution des images de faible qualité, améliorant ainsi la précision OCR.

IronOCR prend-il en charge le réglage automatique des DPI ?

IronOCR permet des paramètres DPI personnalisables pour optimiser les performances OCR selon la qualité d'image.

Comment définir le DPI dans IronOCR en utilisant C# ?

Vous pouvez définir le DPI dans IronOCR en spécifiant la valeur DPI souhaitée dans votre code C#. La documentation fournit des exemples de code pour vous guider dans ce processus.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Prêt à commencer?
Nuget Téléchargements 5,167,857 | Version: 2025.11 vient de sortir