Comment définir le DPI dans l'OCR en utilisant C
Définissez la propriété TargetDPI dans OcrInput d'IronOCR pour agrandir les images à basse résolution et améliorer la précision de l'OCR. Cette configuration permet d'améliorer considérablement la reconnaissance de texte sur des documents flous ou pixellisés, même avec des résolutions aussi faibles que 100 DPI.
Les points par pouce (DPI) mesurent la qualité de l'image et déterminent le niveau de détail des documents numérisés ou des photographies numériques. Bien que la numérisation de documents soit rapide et efficace, le processus aboutit souvent à des fichiers de faible résolution, en particulier lorsque l'on utilise les paramètres de numérisation par défaut ou rapide. Ce manque de détails rend le texte flou ou pixellisé, ce qui crée des obstacles à l'extraction des données.
Les performances de l'OCR dépendent de la qualité de l'image. Les moteurs OCR analysent les formes et les motifs des caractères pour les convertir en texte lisible par une machine. Lorsqu'une image a un faible DPI, il n'y a pas assez de pixels pour définir clairement chaque lettre, ce qui entraîne une perte de détails et des résultats imprécis. Pour les développeurs qui travaillent avec des documents numérisés ou d'anciens systèmes de numérisation, il est essentiel de comprendre l'optimisation de l'IAP pour une extraction de texte fiable.
IronOCR relève ces défis avec efficacité. Elle atteint une grande précision sur des scans dont la résolution ne dépasse pas 225 DPI. Les capacités de prétraitement d'images de la bibliothèque détectent et compensent automatiquement divers problèmes de qualité d'image, ce qui la rend adaptée au traitement de documents provenant de diverses sources. Qu'il s'agisse de mettre en œuvre un OCR simple en une ligne de code ou de construire des pipelines de traitement de documents complexes, l'optimisation de l'IAP reste un facteur essentiel.
Démarrage rapide : Définir le DPI cible pour des résultats OCR plus nets
Configurez IronOcr pour mettre à l'échelle des images de faible résolution en une seule ligne - améliorant la clarté du texte et la reconnaissance avec un minimum d'effort.
-
Installez IronOCR avec le Gestionnaire de Packages NuGet
PM > Install-Package IronOcr -
Copiez et exécutez cet extrait de code.
var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrInput { TargetDPI = 300 }.LoadImage("low-res.png")); -
Déployez pour tester sur votre environnement de production.
Commencez à utiliser IronOCR dans votre projet dès aujourd'hui avec un essai gratuit
Flux de travail minimal (5 étapes)
- Téléchargez une bibliothèque C# pour configurer les paramètres DPI de la reconnaissance optique de caractères (OCR).
- Instancier un nouvel
OcrInput - Définissez la
TargetDPIen fonction de vos besoins. - Charger l'image souhaitée dans
- Lire et extraire des données de l'image à l'aide
Read
Comment régler le DPI pour obtenir de meilleurs résultats d'OCR?
Cet exemple utilise une image de basse résolution d'environ 100 DPI et ajoute du bruit artificiel pour démontrer l'efficacité de la fonctionnalité TargetDPI. Il est essentiel de comprendre comment configurer les paramètres DPI lorsque l'on travaille avec la classe OcrInput, qui offre un contrôle complet sur le prétraitement des images.
Le texte réel de l'image est : " Test test test texte flou exemple exemple exemple ".
Quel est le code dont j'ai besoin pour augmenter le DPI d'une image?
Dans cet exemple, nous allons définir TargetDPI sur 300 pour augmenter la résolution de l'image. Ensuite, nous chargerons l'image d'entrée et PRINTirons le texte extrait avec Text et le niveau de confiance avec Confidence. Le réglage optimal du DPI se situe généralement entre 250 et 400 DPI, en fonction de votre cas d'utilisation et de la qualité du matériel source. Pour les scénarios avancés impliquant plusieurs filtres d'image, reportez-vous à notre guide sur les filtres d'optimisation d'image OCR.
:path=/static-assets/ocr/content-code-examples/how-to/dpi-setting.cs
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// Set the target DPI to 300 for better OCR accuracy
ocrInput.TargetDPI = 300;
ocrInput.LoadImage(@"images\image.png");
// Perform OCR on the image with the specified DPI
var ocrResult = ocrTesseract.Read(ocrInput);
// Display the text extracted from the image
Console.WriteLine(ocrResult.Text);
// Display the confidence level of the OCR result
Console.WriteLine(ocrResult.Confidence);
Imports IronOcr
Imports System
Dim ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput()
' Set the target DPI to 300 for better OCR accuracy
ocrInput.TargetDPI = 300
ocrInput.LoadImage("images\image.png")
' Perform OCR on the image with the specified DPI
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Display the text extracted from the image
Console.WriteLine(ocrResult.Text)
' Display the confidence level of the OCR result
Console.WriteLine(ocrResult.Confidence)
End Using
Quels résultats puis-je attendre avec Upscaled DPI?
Le résultat montre qu'IronOCR obtient un score de confiance de 85 %. Malgré un bruit important et le faible DPI initial de l'image source, le résultat est précis, ce qui démontre l'efficacité de la fonction de mise à l'échelle. Ce niveau de précision surpasse les solutions traditionnelles d'OCR qui se débattent avec des entrées de faible qualité. Pour les applications nécessitant une précision encore plus grande, envisagez de mettre en place un suivi de progression pour surveiller les niveaux de confiance en temps réel et ajuster les paramètres de manière dynamique.
IronOcr comprend des fonctionnalités intégrées qui améliorent automatiquement les images à faible résolution en les mettant à l'échelle au sein d'une bibliothèque unique. Cette approche élimine la nécessité d'utiliser des outils de traitement d'images externes, ce qui rationalise votre flux de travail et réduit les dépendances. Pour les développeurs qui commencent à utiliser IronOcr sur Windows, cette fonctionnalité fonctionne immédiatement sans configuration supplémentaire.
Comment les paramètres DPI influencent-ils la précision de l'OCR ?
Pour illustrer la différence, voici le résultat du traitement de la même image en basse résolution sans définir la propriété TargetDPI. Cette comparaison montre pourquoi une configuration DPI appropriée est cruciale pour une extraction de texte fiable.
Trouver le bon DPI demande un certain équilibre. Un DPI élevé offre une plus grande précision mais un traitement plus lent ; Un faible DPI est plus rapide mais moins fiable. En cas de doute, laissez le prétraitement automatique de IronTesseract déterminer les paramètres optimaux. Vous pouvez désactiver la conversion automatique en définissant la propriété TargetDPI sur 0. Pour les applications spécialisées, consultez notre guide sur l'optimisation de la résolution d'image (DPI) avec Tesseract.
Qu'est-ce qui se passe sans mise à l'échelle DPI?
Sans mise à l'échelle, le score de confiance chute à 79 % et le texte extrait est nettement moins précis. Cette comparaison montre comment le réglage d'un TargetDPI améliore les résultats de l'OCR sur des images de mauvaise qualité. La différence s'accentue lorsqu'il s'agit de documents complexes contenant des tableaux, des formulaires ou des mises en page à plusieurs colonnes.
Comment définir le DPI pour les documents PDF?
Lors du traitement d'un PDF, IronOcr met à l'échelle l'ensemble du document au DPI cible, et pas seulement les images qu'il contient. Cette approche globale garantit une qualité constante dans l'ensemble du document, ce qui est important pour l'extraction de texte OCR au format PDF dans les applications professionnelles. Pour le traitement avancé des PDF, tel que le travail avec des PDF consultables, la configuration correcte du DPI devient encore plus critique.
Bien qu'un DPI plus élevé conduise souvent à de meilleurs résultats d'OCR, le réglage optimal varie d'un PDF à l'autre. Si vous ne savez pas quelle valeur utiliser, laissez le DPI à sa valeur par défaut et laissez IronOcr déterminer automatiquement la meilleure configuration. Les algorithmes de la bibliothèque analysent les caractéristiques du document, telles que la taille de la police, la qualité de l'image et la densité du contenu, afin de sélectionner les paramètres de prétraitement appropriés.
// Example: Processing a PDF with custom DPI settings
using IronOcr;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// Configure DPI specifically for PDF processing
ocrInput.TargetDPI = 250; // Lower DPI often works well for PDFs
// Load a multi-page PDF document
ocrInput.LoadPdf(@"documents\scanned-report.pdf");
// Optional: Process only specific pages
// ocrInput.LoadPdf(@"documents\scanned-report.pdf", PageSelection: new int[] {1, 3, 5});
// Apply additional filters if needed
ocrInput.DeNoise(); // Remove digital noise
ocrInput.Sharpen(); // Enhance text edges
// Perform OCR with confidence tracking
var ocrResult = ocrTesseract.Read(ocrInput);
// Process results page by page
foreach (var page in ocrResult.Pages)
{
Console.WriteLine($"Page {page.PageNumber}: {page.Confidence}% confidence");
Console.WriteLine(page.Text);
}
// Example: Processing a PDF with custom DPI settings
using IronOcr;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// Configure DPI specifically for PDF processing
ocrInput.TargetDPI = 250; // Lower DPI often works well for PDFs
// Load a multi-page PDF document
ocrInput.LoadPdf(@"documents\scanned-report.pdf");
// Optional: Process only specific pages
// ocrInput.LoadPdf(@"documents\scanned-report.pdf", PageSelection: new int[] {1, 3, 5});
// Apply additional filters if needed
ocrInput.DeNoise(); // Remove digital noise
ocrInput.Sharpen(); // Enhance text edges
// Perform OCR with confidence tracking
var ocrResult = ocrTesseract.Read(ocrInput);
// Process results page by page
foreach (var page in ocrResult.Pages)
{
Console.WriteLine($"Page {page.PageNumber}: {page.Confidence}% confidence");
Console.WriteLine(page.Text);
}
Imports IronOcr
' Example: Processing a PDF with custom DPI settings
Dim ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput()
' Configure DPI specifically for PDF processing
ocrInput.TargetDPI = 250 ' Lower DPI often works well for PDFs
' Load a multi-page PDF document
ocrInput.LoadPdf("documents\scanned-report.pdf")
' Optional: Process only specific pages
' ocrInput.LoadPdf("documents\scanned-report.pdf", PageSelection:=New Integer() {1, 3, 5})
' Apply additional filters if needed
ocrInput.DeNoise() ' Remove digital noise
ocrInput.Sharpen() ' Enhance text edges
' Perform OCR with confidence tracking
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Process results page by page
For Each page In ocrResult.Pages
Console.WriteLine($"Page {page.PageNumber}: {page.Confidence}% confidence")
Console.WriteLine(page.Text)
Next
End Using
TargetDPI est 32 766. Définir une résolution (DPI) supérieure à cette limite provoquera une exception. Cela se produit car les dimensions de l'image résultante dépasseraient la taille maximale prise en charge par Tesseract, soit 32 767 x 32 767 pixels. Si la limite est dépassée, vous recevrez le message d'erreur suivant : 'TargetDPI est trop élevé et entraînerait une image trop grande ({new_width} x {new_height}) pour Tesseract. La taille maximale de l'image pour Tesseract est de 32767 x 32767'Pour les applications d'entreprise traitant de gros volumes de documents, envisagez de mettre en œuvre une stratégie d'ajustement dynamique de l'IAP. Commencez par un réglage modéré (300 DPI) et ajustez en fonction des scores de confiance. Cette approche permet d'équilibrer la vitesse de traitement et la précision, ce qui garantit des performances optimales pour divers types de documents. La combinaison de l'optimisation de l'IAP avec d'autres techniques de prétraitement peut donner de meilleurs résultats pour les documents difficiles.
Lorsque vous travaillez avec des types de documents spécifiques, les exigences en matière de DPI peuvent varier. Par exemple, la lecture des plaques d'immatriculation nécessite généralement des paramètres DPI plus élevés en raison de la petite taille des caractères et de la distorsion potentielle de l'image due aux angles de la caméra. De même, le traitement des chèques MICR bénéficie de configurations DPI spécifiques pour capturer avec précision les caractères spécialisés de la police MICR.
Pour les développeurs qui intègrent l'OCR dans des applications web ou des services cloud, la compréhension de l'optimisation DPI devient cruciale pour gérer les temps de traitement et les ressources du serveur. La possibilité d'affiner les paramètres DPI vous permet d'optimiser l'équilibre entre la précision et la performance en fonction des exigences spécifiques de votre application et des contraintes de votre infrastructure.
Questions Fréquemment Posées
Qu'est-ce que le DPI et pourquoi est-il important pour la précision de l'OCR ?
Le DPI (Dots Per Inch) mesure la qualité de l'image et détermine le niveau de détail des documents numérisés. Pour la précision de l'OCR, un DPI plus élevé signifie des définitions de caractères plus claires. IronOcr peut traiter des images avec des résolutions aussi basses que 225 DPI tout en conservant une grande précision, grâce à ses capacités avancées de prétraitement d'images.
Comment puis-je améliorer les résultats de l'OCR sur des images à faible résolution ?
Définissez la propriété TargetDPI dans la classe OcrInput d'IronOcr pour mettre à l'échelle les images à faible résolution. Par exemple, en fixant la valeur de TargetDPI à 300, on peut améliorer de manière significative la reconnaissance de texte sur des documents flous ou pixellisés, même ceux dont la résolution n'excède pas 100 DPI.
Quel est le moyen le plus rapide de définir le DPI pour l'OCR dans C# ?
Vous pouvez configurer le DPI en une ligne de code à l'aide d'IronOCR : var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrInput { TargetDPI = 300 }.LoadImage("low-res.png")). Cela permet d'augmenter automatiquement la taille de l'image pour une meilleure clarté du texte et une meilleure reconnaissance.
L'OCR peut-il fonctionner efficacement sur des documents numérisés à faible résolution ?
Oui, IronOCR est spécialement conçu pour traiter efficacement les documents numérisés à faible résolution. Il atteint une grande précision sur des numérisations dont la résolution ne dépasse pas 225 DPI et comprend des fonctions de prétraitement automatique des images qui détectent et compensent divers problèmes de qualité.
Quelles sont les étapes de base pour mettre en œuvre les paramètres DPI pour l'OCR ?
Le processus se déroule en cinq étapes : 1) Télécharger la bibliothèque IronOcr, 2) Instancier un nouvel objet OcrInput, 3) Définir la propriété TargetDPI à la valeur souhaitée, 4) Charger votre image à l'aide de la méthode LoadImage, et 5) Extraire le texte à l'aide de la méthode Read.
Pourquoi les paramètres de numérisation par défaut se traduisent-ils souvent par des performances médiocres en matière d'OCR ?
Les paramètres de numérisation par défaut ou rapide produisent généralement des fichiers à faible résolution afin d'économiser du temps et de l'espace de stockage. Il en résulte un texte flou ou pixellisé où les détails fins sont perdus, ce qui rend difficile l'identification précise des formes de caractères par les moteurs OCR. La fonction TargetDPI d'IronOCR permet de surmonter cette limitation.
IronOCR peut-il être intégré dans des applications existantes ?
IronOCR est conçu pour être facilement intégré dans les applications existantes en utilisant C#, permettant aux développeurs d'ajouter des fonctionnalités OCR à leur logiciel avec un minimum d'effort.
Quels sont les avantages d'utiliser IronOCR pour la gestion des documents ?
Utiliser IronOCR pour la gestion des documents rationalise le flux de travail en convertissant les documents numérisés en texte modifiable et consultable, réduisant le besoin de saisie manuelle des données et améliorant l'accessibilité des documents.
Comment IronOCR peut-il améliorer la précision des données ?
IronOCR améliore la précision des données grâce à ses algorithmes de reconnaissance avancés et ses fonctionnalités de correction d'image, garantissant que le processus d'extraction de texte est à la fois fiable et précis.
Y a-t-il un essai gratuit disponible pour IronOCR ?
Oui, Iron Software propose un essai gratuit d'IronOCR, permettant aux utilisateurs de tester ses fonctionnalités et capacités avant de prendre une décision d'achat.

