Caractéristiques de l'IronOCR
IronOCR for .NET est une bibliothèque permettant aux développeurs de scanner et de lire du texte ou des codes-barres à partir d'images.
Compatibilité
langues .NET
- C# (Tutoriel Référence API)
- Numériser et lire des textes ou des codes-barres à partir d'images(jpg, png, gif, tiff, bmp) en C#.
- VB.NET
- Numériser et lire des textes ou des codes-barres à partir d'images(jpg, png, gif, tiff, bmp) en VB.NET.
F#
- Numériser et lire du texte ou des codes-barres à partir d'images(jpg, png, gif, tiff, bmp) en fa#.
Plates-formes
- .NET 5, 6, 7 et 8 (Tutoriel)
- IronOCR est disponible pour .NET 5, 6, 7 et 8.
.NET Core 2 et 3 (Tutoriel)
IronOCR est disponible pour .NET Core 2 et 3.
- La version actuelle prend en charge .NET Core sur les systèmes d'exploitation clients Linux, Unix et macOS, ainsi que Mono.
- Une prochaine version prendra en charge MAUI et Xamarin
- .NET Standard 2+ (Référence API)
- IronOCR est compatible avec le Standard .NET 2 et les versions ultérieures.
framework .NET 4.6.2+ (Exemple de code Référence API)
- Scannez et lisez des textes ou des codes-barres à partir d'images avec le Framework .NET 4.6.2 et plus.
Types d'applications
Console, Web et bureau (Tutoriel Référence API)
- Créer des applications pour le Web, le bureau et la console à l'aide d'IronOCR.
Systèmes d'exploitation
IDE
- Microsoft Visual Studio (Tutoriel)
- Jetbrains ReSharper et Rider
Certification
Authenticode de Microsoft
- DigiCert Trusted G4 Code Signing RSA4096 SHA384 2021 CA1
Moteur OCR
Moteur d'OCR sous-jacent
- Tesseract 5 (Tutoriel Exemple de code)
- Tesseract est un logiciel libre de reconnaissance de texte(OCR) disponible sous la licence Apache 2.0. L'une des bibliothèques les plus précises et les plus rapides est disponible pour C#.NET. Actuellement, Tesseract 5 est la version la plus stable.
Configuration détaillée(Exemple de code)
L'objet
IronTesseract.Configuration
permet d'accéder à l'API Tesseract sous-jacente en C# / .NET afin de configurer l'installation pour les utilisateurs avancés.La configuration peut aider à améliorer le résultat après l'exécution de l'OCR.
- Pour améliorer la vitesse de l'OCR, veuillez vérifiercet exemple de code pour une configuration rapide de l'OCR.
Langues internationales
- 25 Langues (Liste Exemple de code)
- Qualité élevée, moyenne et rapide pour la plupart des langues (Exemple de code)
- Langues personnalisées (Exemple de code)
- Formation aux polices de caractères personnalisées (Comment faire)
Lecture de textes et de codes-barres
- Texte et chiffres (Exemple de code)
- Plusieurs langues à la fois (Comment faire Exemple de code)
- Code barre (Plus de 20 formats) and QR Code (Comment faire Exemple de code)
Documents spécialisés (Comment faire)
Cette méthode utilise l'apprentissage automatique pour améliorer la reconnaissance de texte.
- Document
- Optimisé pour la lecture de documents numérisés ou de photos de documents papier contenant beaucoup de texte.
- Plaque d'immatriculation
- Optimisé pour lire les plaques d'immatriculation à partir de photos.
- Passeport
- Optimisé pour la lecture et l'extraction des informations de passeport à partir de photos en scannant la zone lisible par machine(MRZ) contenu.
- Photo
- Optimisé pour lire les images contenant du texte difficile à lire.
Capture d'écran
- Optimisé pour lire les captures d'écran contenant du texte difficile à lire.
Concurrence
- Simple et multithreading (Comment faire Exemple de code)
- Support asynchrone (Comment faire Référence API)
- Jeton d'abandon (Exemple de code)
- Permet aux utilisateurs de suspendre le thread en cours pendant une période spécifiée en millisecondes dans le cas de la lecture d'un fichier d'entrée volumineux et d'un blocage pendant l'exécution du programme ou de l'application.
Délai d'attente (Exemple de code)
- Fournit un délai optionnel en millisecondes, après lequel la lecture OCR sera annulée.
Vision par ordinateur
- Utilisez la vision par ordinateur pour trouver du texte en vous basant sur nos modèles avancés. IronOCR utilise OpenCV pour utiliser la vision par ordinateur afin de détecter les zones où se trouve du texte dans une image. Cette fonction est utile pour les images contenant beaucoup de bruit, les images dont le texte se trouve à plusieurs endroits différents et les images dont le texte est déformé. Use of computer vision in IronOCR will determine where text regions exists and then use Tesseract to attempt to read those regions.
Entrée OCR
Lire à partir de nombreux formats
- Images (jpg, png, gif, tiff, bmp) (Comment faire Exemple de code)
- Fichiers tiff et gif multi-pages et cadres (Comment faire Exemple de code)
- Objets de dessin du système (Comment faire Exemple de code)
- Cours d'eau (Comment faire Exemple de code)
- PDFs (Comment faire Exemple de code)
Filtres
- Assistant filtre (Exemple de code Référence API)
- Si vous ne savez pas quel filtre appliquer à l'image, Filter Wizard fournit la liste des filtres adaptés à OcrInput en utilisant une approche de force brute qui renvoie la combinaison avec le maximum de confiance.
Filtres d'images OCR (Comment faire Tutoriel Exemple de code)
Sharpen
(aiguiser) (Référence API)* Permet d'accentuer la netteté des documents OCR flous. Aplatit les canaux Alpha en blanc.
Amélioration de la résolution
(Référence API)* Améliore la résolution des images de faible qualité.
Denoise
(Référence API)* Supprime le bruit numérique. Ce filtre ne doit être utilisé que lorsque l'on s'attend à ce qu'il y ait du bruit. Aplatit les canaux Alpha en blanc.
Dilater
(Référence API)* Morphologie avancée. la dilatation ajoute des pixels aux limites des objets d'une image. En face de Erode
Erode
(Référence API)
- Morphologie avancée. l'érosion supprime les pixels sur les limites de l'objet. Opposé à Dilater
Fixer l'orientation de l'image (Comment faire Tutoriel Exemple de code)
Rotate
(Tutoriel Référence API)* Fait pivoter les images d'un certain nombre de degrés dans le sens des aiguilles d'une montre. Pour une rotation dans le sens inverse des aiguilles d'une montre, utilisez des nombres négatifs.
Deskew
(Tutoriel Référence API)* Fait pivoter une image de manière à ce qu'elle soit dans le bon sens et orthogonale. Ceci est très utile pour l'OCR car la tolérance de Tesseract pour les scans biaisés peut être aussi basse que 5 degrés
Scale
(Tutoriel Référence API)
- Met à l'échelle les pages OcrInput de manière proportionnelle.
Correction des couleurs de l'image (Comment faire Tutoriel Exemple de code)
Binariser
(Tutoriel Référence API)* Ce filtre d'image transforme chaque pixel en noir ou en blanc, sans solution intermédiaire. Peut améliorer les performances de l'OCR en cas de contraste très faible entre le texte et l'arrière-plan.
ToGrayscale
(Référence API)* Ce filtre d'image transforme chaque pixel en une nuance de gris. Il est peu probable qu'il améliore la précision de l'OCR, mais il peut en améliorer la vitesse.
Inverser
(Tutoriel Référence API)* Inverse toutes les couleurs. Par exemple, le blanc devient noir : le noir devient blanc.
ReplaceColor
(Référence API)* Remplace une couleur dans une image par une autre couleur avec un certain seuil.
SelectTextColor
(choisir la couleur du texte) (Référence API)* Remplace une couleur dans une image par une autre couleur avec un certain seuil.
Appliquer une région de culture
CropRectangle (Exemple de code Référence API)
- Dessiner un rectangle avec la coordonnée identifiée au-dessus d'un OcrInput.
Résultat du ROC
Sortie de données simple
- chaînes de texte .NET
- Code-barres et données QR
- Images
Sortie de données structurées
- Pages
- Blocs
- Paragraphes
- Lignes
- Mots
- Personnages
Exporter des documents
PDF consultables (Comment faire Tutoriel)
- PDF en PDF consultable(Exemple de code)
- TIFF en PDF consultable(Exemple de code)
- hOCR Export (Comment faire Tutoriel)
- Exportation HTML
- Image de n'importe quelle page ou élément de texte
- Code-barres ou code QR en tant qu'image
Surligner le texte d'une page pour le déboguer
- Dessiner des boîtes rouges autour des caractères/mots/lignes/paragraphes détectés pour les mettre en évidence, et les enregistrer au format .png pour le débogage.
Statut et analyse
- Suivi des progrès du RCO (Exemple de code)
- Résultat Confiance (Comment faire)