Caractéristiques de l'IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR for .NET est une bibliothèque permettant aux développeurs de scanner et de lire du texte ou des codes-barres à partir d'images.

Compatibilité

langues .NET

  • C# (Tutoriel Référence API)
  • Numériser et lire des textes ou des codes-barres à partir d'images(jpg, png, gif, tiff, bmp) en C#.
  • VB.NET
  • Numériser et lire des textes ou des codes-barres à partir d'images(jpg, png, gif, tiff, bmp) en VB.NET.
  • F#

    • Numériser et lire du texte ou des codes-barres à partir d'images(jpg, png, gif, tiff, bmp) en fa#.

Plates-formes

  • .NET 5, 6, 7 et 8 (Tutoriel)
  • IronOCR est disponible pour .NET 5, 6, 7 et 8.
  • .NET Core 2 et 3 (Tutoriel)

    • IronOCR est disponible pour .NET Core 2 et 3.

    • La version actuelle prend en charge .NET Core sur les systèmes d'exploitation clients Linux, Unix et macOS, ainsi que Mono.
  • Une prochaine version prendra en charge MAUI et Xamarin
  • .NET Standard 2+ (Référence API)
  • IronOCR est compatible avec le Standard .NET 2 et les versions ultérieures.
  • framework .NET 4.6.2+ (Exemple de code Référence API)

    • Scannez et lisez des textes ou des codes-barres à partir d'images avec le Framework .NET 4.6.2 et plus.

Types d'applications

  • Console, Web et bureau (Tutoriel Référence API)

    • Créer des applications pour le Web, le bureau et la console à l'aide d'IronOCR.

Systèmes d'exploitation

IDE

  • Microsoft Visual Studio (Tutoriel)
  • Jetbrains ReSharper et Rider

Certification

  • Authenticode de Microsoft

    • DigiCert Trusted G4 Code Signing RSA4096 SHA384 2021 CA1

Moteur OCR

Moteur d'OCR sous-jacent

  • Tesseract 5 (Tutoriel Exemple de code)
  • Tesseract est un logiciel libre de reconnaissance de texte(OCR) disponible sous la licence Apache 2.0. L'une des bibliothèques les plus précises et les plus rapides est disponible pour C#.NET. Actuellement, Tesseract 5 est la version la plus stable.
  • Configuration détaillée(Exemple de code)

    • L'objet IronTesseract.Configuration permet d'accéder à l'API Tesseract sous-jacente en C# / .NET afin de configurer l'installation pour les utilisateurs avancés.

    • La configuration peut aider à améliorer le résultat après l'exécution de l'OCR.

    • Pour améliorer la vitesse de l'OCR, veuillez vérifiercet exemple de code pour une configuration rapide de l'OCR.

Langues internationales

Tutoriel

Lecture de textes et de codes-barres

Documents spécialisés (Comment faire)

Cette méthode utilise l'apprentissage automatique pour améliorer la reconnaissance de texte.

  • Document
  • Optimisé pour la lecture de documents numérisés ou de photos de documents papier contenant beaucoup de texte.
  • Plaque d'immatriculation
  • Optimisé pour lire les plaques d'immatriculation à partir de photos.
  • Passeport
  • Optimisé pour la lecture et l'extraction des informations de passeport à partir de photos en scannant la zone lisible par machine(MRZ) contenu.
  • Photo
  • Optimisé pour lire les images contenant du texte difficile à lire.
  • Capture d'écran

    • Optimisé pour lire les captures d'écran contenant du texte difficile à lire.

Concurrence

  • Simple et multithreading (Comment faire Exemple de code)
  • Support asynchrone (Comment faire Référence API)
  • Jeton d'abandon (Exemple de code)
  • Permet aux utilisateurs de suspendre le thread en cours pendant une période spécifiée en millisecondes dans le cas de la lecture d'un fichier d'entrée volumineux et d'un blocage pendant l'exécution du programme ou de l'application.
  • Délai d'attente (Exemple de code)

    • Fournit un délai optionnel en millisecondes, après lequel la lecture OCR sera annulée.

Vision par ordinateur

Comment faire Référence API

  • Utilisez la vision par ordinateur pour trouver du texte en vous basant sur nos modèles avancés. IronOCR utilise OpenCV pour utiliser la vision par ordinateur afin de détecter les zones où se trouve du texte dans une image. Cette fonction est utile pour les images contenant beaucoup de bruit, les images dont le texte se trouve à plusieurs endroits différents et les images dont le texte est déformé. Use of computer vision in IronOCR will determine where text regions exists and then use Tesseract to attempt to read those regions.

Entrée OCR

Exemple de code

Lire à partir de nombreux formats

Filtres

  • Assistant filtre (Exemple de code Référence API)
  • Si vous ne savez pas quel filtre appliquer à l'image, Filter Wizard fournit la liste des filtres adaptés à OcrInput en utilisant une approche de force brute qui renvoie la combinaison avec le maximum de confiance.
  • Filtres d'images OCR (Comment faire Tutoriel Exemple de code)

    • Sharpen (aiguiser) (Référence API)

      * Permet d'accentuer la netteté des documents OCR flous. Aplatit les canaux Alpha en blanc.
    • Amélioration de la résolution (Référence API)

      * Améliore la résolution des images de faible qualité.
    • Denoise (Référence API)

      * Supprime le bruit numérique. Ce filtre ne doit être utilisé que lorsque l'on s'attend à ce qu'il y ait du bruit. Aplatit les canaux Alpha en blanc.
    • Dilater (Référence API)

      * Morphologie avancée. la dilatation ajoute des pixels aux limites des objets d'une image. En face de Erode
    • Erode (Référence API)
  • Morphologie avancée. l'érosion supprime les pixels sur les limites de l'objet. Opposé à Dilater
  • Fixer l'orientation de l'image (Comment faire Tutoriel Exemple de code)

    • Rotate (Tutoriel Référence API)

      * Fait pivoter les images d'un certain nombre de degrés dans le sens des aiguilles d'une montre. Pour une rotation dans le sens inverse des aiguilles d'une montre, utilisez des nombres négatifs.
    • Deskew (Tutoriel Référence API)

      * Fait pivoter une image de manière à ce qu'elle soit dans le bon sens et orthogonale. Ceci est très utile pour l'OCR car la tolérance de Tesseract pour les scans biaisés peut être aussi basse que 5 degrés
    • Scale (Tutoriel Référence API)
  • Met à l'échelle les pages OcrInput de manière proportionnelle.
  • Correction des couleurs de l'image (Comment faire Tutoriel Exemple de code)

    • Binariser (Tutoriel Référence API)

      * Ce filtre d'image transforme chaque pixel en noir ou en blanc, sans solution intermédiaire. Peut améliorer les performances de l'OCR en cas de contraste très faible entre le texte et l'arrière-plan.
    • ToGrayscale (Référence API)

      * Ce filtre d'image transforme chaque pixel en une nuance de gris. Il est peu probable qu'il améliore la précision de l'OCR, mais il peut en améliorer la vitesse.
    • Inverser (Tutoriel Référence API)

      * Inverse toutes les couleurs. Par exemple, le blanc devient noir : le noir devient blanc.
    • ReplaceColor (Référence API)

      * Remplace une couleur dans une image par une autre couleur avec un certain seuil.
    • SelectTextColor (choisir la couleur du texte) (Référence API)

      * Remplace une couleur dans une image par une autre couleur avec un certain seuil.

Appliquer une région de culture

Résultat du ROC

Sortie de données simple

Comment faire Exemple de code

  • chaînes de texte .NET
  • Code-barres et données QR
  • Images

Sortie de données structurées

Comment faire Exemple de code

  • Pages
  • Blocs
  • Paragraphes
  • Lignes
  • Mots
  • Personnages

Exporter des documents

Surligner le texte d'une page pour le déboguer

  • Dessiner des boîtes rouges autour des caractères/mots/lignes/paragraphes détectés pour les mettre en évidence, et les enregistrer au format .png pour le débogage.

Statut et analyse