Correction des scans et des images de mauvaise qualité
La classe IronTesseract
OCR offre un contrôle granulaire aux développeurs C# et .NET afin d'ajouter des fonctionnalités OCR (image et PDF en texte) à leur application, et également d'affiner les performances selon leur propre cas d'utilisation spécifique.
En définissant des variables, il est possible de trouver un équilibre parfait entre la vitesse et la précision en travaillant sur des exemples concrets. Les paramètres incluent : CleanBackgroundNoise
, EnhanceContrast
, EnhanceResolution
, Langue, Stratégie, RotateAndStraighten
, ColorSpace
, DetectWhiteTextOnDarkBackgrounds
, InputImageType
.
Cela permet de lire des scans de faible qualité que le Tesseract libre ne serait pas en mesure de traiter.