Passer au contenu du pied de page
COMPARER à D'AUTRES COMPOSANTS

Comparaison entre IronOCR et AWS Textract OCR

Qu'est-ce que l'OCR ?

La procédure utilisée pour transformer une image de texte en un format de texte lisible par machine est connue sous le nom de Reconnaissance Optique de Caractères (OCR). Par exemple, si vous scannez un formulaire, des factures ou un reçu, votre ordinateur enregistre le scan sous forme de fichier image. Les données dans le fichier image ne peuvent pas être modifiées, recherchées ou comptées à l'aide d'un éditeur de texte. Cependant, vous pouvez utiliser des solutions OCR pour convertir le fichier image en un document texte avec son contenu stocké en tant que données texte.

À cette époque moderne, la plupart des flux de travail en entreprise impliquent la réception d'informations provenant de médias imprimés. Différents documents comme des formulaires papiers, des factures, des documents juridiques numérisés, l'extraction de tableaux et des textes imprimés ou des contrats font tous partie des processus commerciaux. De plus, la numérisation de tels contenus documentaires crée des images avec le texte caché à l'intérieur. Le texte dans les images ne peut pas être traité par les outils de traitement de texte de la même manière que les documents texte. La technologie OCR résout le problème en convertissant les images de texte en données texte pouvant être analysées par d'autres logiciels d'entreprise.

Comment fonctionne l'OCR ?

Le moteur OCR utilise les étapes suivantes :

Acquisition d'image

Dans ce processus, un scanner lit les documents et les convertit en données binaires. Le logiciel OCR identifie l'image numérisée et classe les zones claires comme arrière-plan et les zones sombres comme texte.

Prétraitement

Le logiciel OCR nettoie d'abord l'image et élimine les erreurs pour préparer ses données à la lecture.

Reconnaissance de texte

Les deux principaux types d'algorithmes OCR pour la reconnaissance de texte sont la correspondance de motifs et l'extraction de caractéristiques.

Correspondance de motifs

Une image de caractère, ou glyphe, est isolée tout au long du processus de correspondance de motifs et comparée à un glyphe enregistré précédemment.

Extraction de fonctionnalités

Grâce au processus d'extraction de caractéristiques, les glyphes sont divisés en caractéristiques telles que les lignes, les boucles fermées, la direction des lignes et les jonctions de lignes.

Post-traitement

La technologie transforme les données texte récupérées en un fichier numérique après analyse. Certains systèmes OCR peuvent créer des documents PDF annotés incluant à la fois les versions avant et après du document numérisé.

Cet article discutera de la comparaison entre deux des applications et bibliothèques de documents les plus répandues pour l'OCR :

  • IronOCR
  • AWS OCR Textract

Bibliothèque IronOCR

IronOCR est une bibliothèque C# .NET qui offre des services pour scanner, rechercher, lire des images et des PDF. Elle est livrée avec plus de 125 packs linguistiques mondiaux. La sortie est obtenue sous forme de texte, de données structurées ou de PDF consultables. Prend en charge les versions .NET comme 6, 5, Core, Standard et Framework.

IronOCR est unique par sa capacité à détecter et à extraire automatiquement des données à partir d'images et de documents imparfaitement numérisés. La classe 'IronTesseract' a l'API la plus simple. Elle fournit la version la plus avancée de Tesseract connue partout, sur n'importe quelle plateforme avec une vitesse, une précision accrues et une DLL native et une API.

IronOCR peut également scanner les codes-barres et QR codes à partir de tous les formats d'image, et elle lit le texte et effectue la numérisation PDF en utilisant le dernier moteur Tesseract 5.

Fonctionnalités

  • Elle est faite purement pour les applications .NET.
  • Elle peut prendre en charge 125 langues différentes. L'arabe, le chinois, l'anglais, le finnois, le français, l'allemand, le japonais, et bien d'autres langues sont prises en charge par IronOCR.
  • Elle peut corriger la position d'une image inclinée et supprimer le bruit d'une image pour un résultat précis.
  • Elle fonctionne exceptionnellement bien sur les images à basse résolution avec peu de DPI.
  • Elle peut lire plusieurs types de QR codes et codes-barres.
  • Elle prend également en charge les formats Gif et Tiff.
  • Elle permet l'exécution de nombreux threads simultanément. C'est une caractéristique exceptionnelle qui n'est pas présente dans d'autres bibliothèques OCR. Cela rend les processus plus fluides.
  • Elle peut facilement effectuer l'OCR sur les fichiers PDF et exporter des documents PDF consultables à l'aide de l'OCR.

Maintenant, jetons un œil à AWS OCR.

AWS OCR Textract

AWS Textract d'Amazon est un service d'apprentissage automatique (ML) qui extrait automatiquement le texte et les données des documents numérisés. Il va au-delà de la simple reconnaissance optique de caractères (OCR) pour identifier, comprendre et extraire des données des formulaires et des tables à l'aide de la technologie d'apprentissage profond.

AWS OCR Textract utilise l'apprentissage automatique pour lire et traiter tout type de document, extrayant avec précision le texte, les données tabulaires et autres données sans effort manuel. Au lieu de prendre des heures ou des jours pour extraire les données, Textract peut le faire rapidement. En outre, vous pouvez ajouter des examens humains avec intelligence artificielle augmentée d'Amazon pour superviser vos modèles et vérifier les données sensibles.

Fonctionnalités

  • Détectez le texte dans une variété de documents, y compris les rapports financiers, les dossiers médicaux, les tableaux et les formulaires fiscaux.
  • Extraire du texte, des formulaires et des données de tableau à partir de documents avec des données structurées, en utilisant l'API d'Analyse de Document.
  • Spécifiez et extrayez des informations à partir de documents en utilisant la fonctionnalité Queries dans l'API d'Analyse de Document.
  • Traitez les factures et reçus avec l'API d'analyse des dépenses.
  • Traitez les documents d'identité comme permis de conduire et passeports américains avec l'API d'analyse d'identité. - Analyse de documents évolutive pour accélérer la décision.
    1. Création d'un projet Visual Studio.

La suite de l'article se déroule comme suit :

  1. Installation d'IronOCR.
  2. Installation d'AWS OCR Textract.
  3. PDF vers Texte.
  4. Image vers Texte.
  5. Code-barres et QR vers Texte
  6. Licences
  7. Conclusion
  8. Conclusion

Ce tutoriel utilisera la version Visual Studio 2022 donc je suppose que vous l'avez installé.

Ce tutoriel utilisera la version Visual Studio 2022, donc je suppose que vous l'avez installé.

  • Ouvrez Visual Studio 2022.
  • Générez un nouveau projet .NET Core, puis sélectionnez Application Console.
Aws Ocr Alternatives 1 related to Fonctionnalités

Application Console

  • Donnez un nom au projet. Par exemple TextReader. .NET Framework

.NET Framework Ensuite, nous allons installer les bibliothèques pour notre utilisation une par une.

Ensuite, nous allons installer les bibliothèques pour notre utilisation une par une.

  1. Utilisation du gestionnaire de packages NuGet de Visual Studio.

La bibliothèque IronOCR peut être téléchargée et installée de quatre manières. Les voici :

  1. Téléchargement direct via le site NuGet.
  2. Téléchargement direct via la page web d'IronOCR.
  3. Téléchargement direct via la page IronOCR.

2.1. Utilisation du gestionnaire de packages NuGet de Visual Studio

2.1. Utilisation du gestionnaire NuGet de Visual Studio

  1. Développez Outils ou en cliquant avec le bouton droit sur l'explorateur de solutions.

  2. Développez le gestionnaire de packages NuGet.
  3. Cliquez sur Gérer les packages NuGet pour les solutions ou cliquez sur Gérer les packages NuGet dans l'explorateur de solutions.
    ![Gestion des packages NuGet](/static-assets/ocr/blog/aws-ocr-alternatives/aws-ocr-alternatives-3.webp)

    class="content__image-caption">Gestion des packages NuGet

Manage NuGet Package

Gérer les packages NuGet

Cochez la case du projet sur la droite et cliquez sur Installer. Cochez la case du projet sur le côté droit et cliquez sur Installer.

Parcourir IronOCR

Parcourir IronOCR

2.2. Téléchargement direct via le site NuGet

2.2. Téléchargement direct via le site web de NuGet

  1. Accédez au lien "https://www.nuget.org/packages/IronOcr/".

  2. Accédez au lien "https://www.nuget.org/packages/IronOcr/".
  3. Double-cliquez sur le package téléchargé.
  4. Double-cliquez sur le paquet de téléchargement. Il s'installera automatiquement.
  5. Ensuite, rechargez la solution et commencez à l'utiliser dans le projet.

2.3. Téléchargement direct via la page IronOCR

Les développeurs peuvent télécharger la bibliothèque IronOCR directement depuis le site web en utilisant ce lien.

  1. Cliquez avec le bouton droit sur le projet depuis la fenêtre de la solution.
  2. Ensuite, sélectionnez l'option Référence et parcourez l'emplacement de la référence téléchargée.
  3. Ensuite, cliquez sur OK pour ajouter la référence.

2.4. Utiliser la ligne de commande dans Visual Studio

  1. Dans Visual Studio, allez à Outils -> Gestionnaire de paquets NuGet -> Console du gestionnaire de paquets.
  2. Entrez la ligne suivante dans l'onglet de la console du gestionnaire de paquets :
Install-Package IronOcr

Le paquet sera maintenant téléchargé/installé dans le projet actuel et est prêt à être utilisé.

Package Manager Console

Application Console

Install IronOCR

Application Console

2.5. Ajout du Namespace IronOCR

2.5. Ajout de l'espace de noms IronOCR

Incluez cette ligne de code dans le programme pour utiliser IronOCR :

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

Maintenant, installons AWS Textract.

Avant d'utiliser Amazon Textract pour la première fois, complétez les tâches suivantes :

  1. Inscrivez-vous aux services AWS.

  2. Créez un utilisateur IAM.
  3. Créez un utilisateur IAM.

Une fois que vous vous êtes inscrit avec succès pour le compte et créé l'utilisateur IAM, vous pouvez maintenant définir les clés d'accès dans la console AWS pour accéder à l'API par programmation en utilisant C#. - SecretAccessKey

  • SecretAccessKey
  • RegionEndPoint (Votre zone d'accès) - Dans ce cas d'exemple : AFSouth1

3.1. Utilisation du Gestionnaire de packages NuGet

  • Vous pouvez télécharger et installer le SDK AWS Textract à partir du Gestionnaire de packages NuGet.
  • ![Gestionnaire de packages NuGet](/static-assets/ocr/blog/aws-ocr-alternatives/aws-ocr-alternatives-6.webp)

    class="content__image-caption">Gestionnaire de packages NuGet

    Gestionnaire de paquets NuGet

    Gestionnaire de paquets NuGet

    • Cliquez sur Parcourir et recherchez AWS Textract :
    AWS Textract

    AWS Textract

    3.2. Ajout des espaces de noms AWS OCR

    Incluez les espaces de noms suivants pour utiliser AWS Textract :

    using Amazon.Textract;
    using Amazon.Textract.Model;
    using Amazon.Textract;
    using Amazon.Textract.Model;
    Imports Amazon.Textract
    Imports Amazon.Textract.Model
    $vbLabelText   $csharpLabel

    Les deux bibliothèques peuvent extraire du texte des fichiers PDF.

    Voyons le code un par un. ### 4.1. Utilisation d'IronOCR

    4.1. Utiliser IronOCR

    IronOCR permet de reconnaître et de lire le texte à partir de formats de documents PDF en utilisant le Tesseract avancé. Le code est simple, propre et très facile à comprendre et à utiliser.

    var Ocr = new IronTesseract();
    using (var input = new OcrInput())
    {
        input.AddPdf("example.pdf", "password");
        // We can also select specific PDF page numbers to OCR
        var Result = Ocr.Read(input);
        Console.WriteLine(Result.Text);
        Console.WriteLine($"{Result.Pages.Count()} Pages");
        // Read every page of the PDF
    }
    var Ocr = new IronTesseract();
    using (var input = new OcrInput())
    {
        input.AddPdf("example.pdf", "password");
        // We can also select specific PDF page numbers to OCR
        var Result = Ocr.Read(input);
        Console.WriteLine(Result.Text);
        Console.WriteLine($"{Result.Pages.Count()} Pages");
        // Read every page of the PDF
    }
    Dim Ocr = New IronTesseract()
    Using input = New OcrInput()
    	input.AddPdf("example.pdf", "password")
    	' We can also select specific PDF page numbers to OCR
    	Dim Result = Ocr.Read(input)
    	Console.WriteLine(Result.Text)
    	Console.WriteLine($"{Result.Pages.Count()} Pages")
    	' Read every page of the PDF
    End Using
    $vbLabelText   $csharpLabel

    Fichier PDF d'entrée

    ![Exemple PDF](/static-assets/ocr/blog/aws-ocr-alternatives/aws-ocr-alternatives-8.webp)

    class="content__image-caption">Exemple PDF

    Exemple de PDF

    Exemple de PDF

    Sortie

    Sortie IronOCR

    Sortie IronOCR

    Amazon Textract facilite l'ajout de la détection et de l'analyse de texte de documents à vos applications.

    Le code suivant est utilisé pour lire un PDF et le même PDF est passé : Le code est un peu complexe, long et nécessite une attention particulière lors du passage et de la récupération des objets.

    public static async void ReturnResult()
    {
        AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1);
        var request = new StartDocumentTextDetectionRequest();
        request.DocumentLocation = new DocumentLocation
        {
            S3Object = new S3Object
            {
                Bucket = "your_bucket_name",
                Name = "your_bucket_key"
            }
        };
        var id = await client.StartDocumentTextDetectionAsync(request);
        var jobId = id.JobId;
        var response = client.GetDocumentTextDetectionAsync(new GetDocumentTextDetectionRequest{
            JobId = jobId
        });
        response.Wait();
        if (response.Result.JobStatus.Equals("SUCCEEDED"))
        {
            foreach (var block in response.Result.Blocks)
            {
                if (block.BlockType == "WORD" || block.BlockType == "PAGE" || block.BlockType == "LINE")
                {
                    Console.WriteLine(block.Text);
                }
            }
        }
    }
    
    static void Main(String[] args)
    {
        ReturnResult();
    }
    public static async void ReturnResult()
    {
        AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1);
        var request = new StartDocumentTextDetectionRequest();
        request.DocumentLocation = new DocumentLocation
        {
            S3Object = new S3Object
            {
                Bucket = "your_bucket_name",
                Name = "your_bucket_key"
            }
        };
        var id = await client.StartDocumentTextDetectionAsync(request);
        var jobId = id.JobId;
        var response = client.GetDocumentTextDetectionAsync(new GetDocumentTextDetectionRequest{
            JobId = jobId
        });
        response.Wait();
        if (response.Result.JobStatus.Equals("SUCCEEDED"))
        {
            foreach (var block in response.Result.Blocks)
            {
                if (block.BlockType == "WORD" || block.BlockType == "PAGE" || block.BlockType == "LINE")
                {
                    Console.WriteLine(block.Text);
                }
            }
        }
    }
    
    static void Main(String[] args)
    {
        ReturnResult();
    }
    Public Shared Async Sub ReturnResult()
    	Dim client As New AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1)
    	Dim request = New StartDocumentTextDetectionRequest()
    	request.DocumentLocation = New DocumentLocation With {
    		.S3Object = New S3Object With {
    			.Bucket = "your_bucket_name",
    			.Name = "your_bucket_key"
    		}
    	}
    	Dim id = Await client.StartDocumentTextDetectionAsync(request)
    	Dim jobId = id.JobId
    	Dim response = client.GetDocumentTextDetectionAsync(New GetDocumentTextDetectionRequest With {.JobId = jobId})
    	response.Wait()
    	If response.Result.JobStatus.Equals("SUCCEEDED") Then
    		For Each block In response.Result.Blocks
    			If block.BlockType = "WORD" OrElse block.BlockType = "PAGE" OrElse block.BlockType = "LINE" Then
    				Console.WriteLine(block.Text)
    			End If
    		Next block
    	End If
    End Sub
    
    Shared Sub Main(ByVal args() As String)
    	ReturnResult()
    End Sub
    $vbLabelText   $csharpLabel

    Le code est un peu délicat, long et nécessite de l'attention lors de la transmission et de la récupération des objets. Ensuite, nous devons initier une demande en utilisant la méthode StartDocumentTextDetectionRequest(). L'objet de demande définit alors DocumentLocation en utilisant le nom du bucket et la clé. Cette demande est ensuite transmise à la méthode StartDocumentTextDetectionAsync(). Comme il s'agit d'une méthode asynchrone, nous devons utiliser le mot-clé await et rendre la fonction ReturnResult asynchrone. Comme il s'agit d'une méthode asynchrone, nous devons utiliser le mot-clé await et rendre la fonction ReturnResult asynchrone. Le jobId est passé à la méthode GetDocumentTextDetectionAsync() et attend la réponse SUCCEEDED. foreach boucle est utilisée pour parcourir chaque bloc et vérifier s'il s'agit de "WORD", "PAGE" ou "LINE", puis imprimer la reconnaissance de texte. Enfin, appelez cette méthode dans la méthode Main pour le traitement des documents. Enfin, appelez cette méthode dans la méthode Main pour le traitement des documents.

    Sortie

    La sortie est assez similaire à IronOCR.

    Sortie AWS Textreat

    Sortie AWS Textreat

    Lire des données à partir d'images est délicat car la qualité de l'image joue un rôle essentiel lors de l'extraction d'informations.

    Les deux bibliothèques fournissent la possibilité d'extraire du texte. Ici, nous utiliserons des fichiers png. Ici, nous utiliserons des fichiers png.

    5.1. Utilisation d'IronOCR

    Le code est presque similaire à celui d'avant. Ici, la méthode AddPDF est remplacée par la méthode AddImage.

    var Ocr = new IronTesseract();
    using (var Input = new OcrInput())
    {
        Input.AddImage("test-files/redacted-employmentapp.png");
        //... you can add any number of images
        var Result = Ocr.Read(Input);
        Console.WriteLine(Result.Text);
    }
    var Ocr = new IronTesseract();
    using (var Input = new OcrInput())
    {
        Input.AddImage("test-files/redacted-employmentapp.png");
        //... you can add any number of images
        var Result = Ocr.Read(Input);
        Console.WriteLine(Result.Text);
    }
    Dim Ocr = New IronTesseract()
    Using Input = New OcrInput()
    	Input.AddImage("test-files/redacted-employmentapp.png")
    	'... you can add any number of images
    	Dim Result = Ocr.Read(Input)
    	Console.WriteLine(Result.Text)
    End Using
    $vbLabelText   $csharpLabel

    Image d'entrée

    Données expurgées des employés

    Données expurgées des employés

    Sortie

    La sortie est propre et correspond à l'image originale avec juste quelques lignes de code, sans aucune technicité et un résultat parfait.

    Sortie d'image

    Sortie d'image

    5.2. Utilisation d'AWS Textract

    Le code suivant aide à détecter le texte à partir d'images :

    public static async void ReturnResult()
    {
        AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1);
        var request = new DetectDocumentTextRequest();
        request.Document = new Document
        {
            Bytes = new MemoryStream(File.ReadAllBytes(@"test-files/redacted-employmentapp.png"))
        };    
        var result = await client.DetectDocumentTextAsync(request);
        foreach (var block in result.Blocks)
        {
            if (block.BlockType == "WORD")
            {
                Console.WriteLine(block.Text);
            }
        }
    }
    
    static void Main(String[] args)
    {
        ReturnResult();
    }
    public static async void ReturnResult()
    {
        AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1);
        var request = new DetectDocumentTextRequest();
        request.Document = new Document
        {
            Bytes = new MemoryStream(File.ReadAllBytes(@"test-files/redacted-employmentapp.png"))
        };    
        var result = await client.DetectDocumentTextAsync(request);
        foreach (var block in result.Blocks)
        {
            if (block.BlockType == "WORD")
            {
                Console.WriteLine(block.Text);
            }
        }
    }
    
    static void Main(String[] args)
    {
        ReturnResult();
    }
    Public Shared Async Sub ReturnResult()
    	Dim client As New AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1)
    	Dim request = New DetectDocumentTextRequest()
    	request.Document = New Document With {.Bytes = New MemoryStream(File.ReadAllBytes("test-files/redacted-employmentapp.png"))}
    	Dim result = Await client.DetectDocumentTextAsync(request)
    	For Each block In result.Blocks
    		If block.BlockType = "WORD" Then
    			Console.WriteLine(block.Text)
    		End If
    	Next block
    End Sub
    
    Shared Sub Main(ByVal args() As String)
    	ReturnResult()
    End Sub
    $vbLabelText   $csharpLabel

    Encore une fois, le code est presque similaire à celui d'avant. Ici, nous devons initier une demande en utilisant la méthode DetectDocumentTextRequest(). L'objet de demande définit ensuite le document en lisant tous les octets. Cette demande est ensuite passée à la méthode DetectDocumentTextAsync(). Comme il s'agit d'une méthode asynchrone, nous devons utiliser le mot-clé await et rendre la fonction ReturnResult asynchrone. En cas de succès, le résultat est renvoyé en blocs. La boucle foreach est utilisée pour parcourir chaque bloc et vérifier s'il s'agit d'un "MOT", puis imprimer la reconnaissance de texte. Enfin, appelez cette méthode dans la méthode Main pour le traitement des documents.

    La sortie est similaire à IronOCR mais cela nécessite que le fichier soit téléchargé sur le bucket AWS dans un premier temps.

    6. Code à barres et QR code en texte

    L'une des caractéristiques uniques d'IronOCR est sa capacité à lire les codes-barres et les codes QR des documents tout en effectuant une analyse de texte. Les instances de la classe OcrResult.OcrBarcode fournissent au développeur des informations détaillées sur chaque code-barres scanné. AWS Textract ne fournit pas cette fonctionnalité.

    Le code pour IronOCR est donné ci-dessous :

    var Ocr = new IronTesseract();
    Ocr.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput())
    {
        input.AddImage("test-files/Barcode.png");
        var Result = Ocr.Read(input);
        foreach (var Barcode in Result.Barcodes)
        {
            Console.WriteLine(Barcode.Value);
            // type and location properties also exposed
        }
    }
    var Ocr = new IronTesseract();
    Ocr.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput())
    {
        input.AddImage("test-files/Barcode.png");
        var Result = Ocr.Read(input);
        foreach (var Barcode in Result.Barcodes)
        {
            Console.WriteLine(Barcode.Value);
            // type and location properties also exposed
        }
    }
    Dim Ocr = New IronTesseract()
    Ocr.Configuration.ReadBarCodes = True
    Using input = New OcrInput()
    	input.AddImage("test-files/Barcode.png")
    	Dim Result = Ocr.Read(input)
    	For Each Barcode In Result.Barcodes
    		Console.WriteLine(Barcode.Value)
    		' type and location properties also exposed
    	Next Barcode
    End Using
    $vbLabelText   $csharpLabel

    Le code est explicite et facile à comprendre.

    7. Licence

    IronOCR est une bibliothèque qui fournit une licence développeur gratuite. Elle a également une structure tarifaire distincte ; le forfait Lite commence à $799 sans frais cachés. La redistribution de produits SaaS et OEM est également possible. Toutes les licences bénéficient d'une garantie de remboursement de 30 jours, d'une année de support logiciel et de mises à jour, de la validité pour dev/mise en scène/production, et d'une licence perpétuelle (achat unique). Pour voir la structure de prix complète d'IronOCR et les détails de la licence, allez ici.

    Plan tarifaire d'IronOCR

    Plan tarifaire d'IronOCR

    Vous pouvez obtenir la redistribution de produits SaaS et OEM sans redevance pour juste un achat unique de $1,599.

    Service SaaS

    Service SaaS

    L'API AWS Textract fournit aux développeurs un service AWS Free Tier. Vous pouvez commencer avec Amazon Textract gratuitement. Liste des tarifs

    Liste des prix

    Liste de prix

    Liste de prix

    You can have a look at the pricing details from this link. De plus, vous pouvez également ajuster les prix selon vos besoins à l'aide du calculateur de prix.

    8. Conclusion

    IronOCR peut être déployé sur Windows, Linux, Mac, Azure, AWS, Lambda et prend en charge les projets .NET Framework ainsi que .NET Standard et .NET Core. IronOCR peut être déployé sur Windows, Linux, Mac, Azure, AWS, Lambda et prend en charge les projets .NET Framework ainsi que .NET Standard et .NET Core. Nous pouvons également lire les codes-barres dans les scans OCR, et même exporter notre OCR au format HTML et PDF consultable.

    Le code suivant est utilisé pour lire un PDF et le même PDF est passé : Vous n'avez besoin d'aucune expertise en apprentissage automatique pour l'utiliser. Amazon Textract inclut des API simples et faciles à utiliser qui peuvent analyser des fichiers image et des fichiers PDF. Amazon Textract apprend toujours de nouvelles données, et Amazon ajoute continuellement de nouvelles fonctionnalités au service. Les licences IronOCR sont basées sur les développeurs, ce qui signifie que vous devez toujours acheter une licence en fonction du nombre de développeurs qui utiliseront le produit.

    Les licences AWS Textract sont basées sur le nombre de pages du document pour extraire des informations et analyser les données. Les licences AWS Textract sont basées sur le nombre de pages du document pour extraire des informations et analyser les données. De plus, la licence IronOCR est un achat unique et peut être utilisée à vie et prend en charge la distribution OME et SaaS. Dans la comparaison générale, IronOCR et AWS OCR ont tous deux des capacités d'apprentissage automatique pour détecter le texte d'un document ou d'une image.

    IronOCR a un léger avantage sur AWS OCR car il est rapide et économise du temps. Le code est simple et facile à comprendre lors de la détection de texte à partir de documents. La tâche est accomplie en quelques méthodes. D'autre part, AWS Textract utilise de nombreuses méthodes pour accomplir la même tâche. Cela augmente la réponse du serveur et est parfois chronophage. Cela augmente la réponse du serveur et parfois cela prend du temps. La vitesse est époustouflante : IronOCR.2020+ est jusqu'à 10 fois plus rapide et fait plus de 250 % d'erreurs en moins que les builds précédents. Veuillez visiter ce lien pour explorer l'Iron Suite.

    De plus, Iron Software propose actuellement un forfait de cinq outils pour le prix de seulement deux. Les outils inclus dans la suite Iron sont :

    • IronBarcode
    • IronXL
    • IronOCR
    • IronPDF
    • IronWebScraper

    Veuillez cliquer sur ce lien pour découvrir IRONSUITE .

    Questions Fréquemment Posées

    Qu'est-ce que la reconnaissance optique de caractères (OCR) ?

    La reconnaissance optique de caractères (OCR) est une technologie qui convertit différents types de documents, tels que des documents papier numérisés, des fichiers PDF ou des images capturées par un appareil photo numérique, en données éditables et consultables. IronOCR est une puissante bibliothèque C# .NET qui améliore ce processus à l'aide d'algorithmes avancés.

    Comment puis-je convertir des images de texte en texte lisible par machine en utilisant C# ?

    Vous pouvez utiliser IronOCR, une bibliothèque C# .NET, pour convertir des images de texte en texte lisible par machine. Elle traite les images grâce à des algorithmes OCR avancés et produit le texte reconnu dans des formats qui peuvent être facilement manipulés par programmation.

    Comment IronOCR gère-t-il les images scannées imparfaitement ?

    IronOCR est conçu pour gérer et traiter efficacement les images scannées imparfaitement. Il comprend des capacités de prétraitement qui corrigent l'inclinaison, améliorent le contraste du texte et affinent la qualité de l'image pour améliorer la précision de l'OCR.

    Puis-je utiliser IronOCR pour le traitement multi-thread ?

    Oui, IronOCR prend en charge le multi-threading, ce qui permet le traitement simultané de plusieurs documents, améliorant considérablement les performances et le débit dans les applications lourdes en documents.

    Quelles langues IronOCR prend-t-il en charge pour les tâches OCR ?

    IronOCR prend en charge plus de 125 langues, ce qui en fait un outil polyvalent pour les applications mondiales où des documents dans plusieurs langues doivent être traités et convertis en texte.

    Comment IronOCR est-il installé dans un projet Visual Studio ?

    IronOCR peut être installé dans un projet Visual Studio via le gestionnaire de packages NuGet. Vous pouvez rechercher 'IronOCR' dans la console NuGet et l'installer, ce qui vous permet d'intégrer la fonctionnalité OCR dans vos applications .NET.

    Quel est le modèle de tarification pour IronOCR ?

    IronOCR offre un modèle de licence à paiement unique. Cela inclut des licences perpétuelles qui viennent avec une garantie de remboursement de 30 jours, offrant flexibilité et tranquillité d'esprit pour les développeurs.

    En quoi AWS Textract diffère-t-il d'IronOCR en termes de technologie ?

    AWS Textract utilise des technologies d'apprentissage automatique et de deep learning pour extraire du texte et des données, fournissant une analyse détaillée du contenu des documents. En revanche, IronOCR se concentre sur la facilité d'utilisation et l'intégration dans les projets .NET, offrant une solution OCR robuste avec une prise en charge complète des langues.

    IronOCR peut-il lire et traiter les codes-barres et les codes QR ?

    Oui, IronOCR peut lire et traiter à la fois les codes-barres et les codes QR. Il extrait des informations détaillées sur chaque code tout en scannant simultanément le texte, ce qui en fait un outil complet pour le traitement des documents.

    Quelles plateformes et environnements prennent en charge IronOCR ?

    IronOCR est compatible avec une large gamme d'environnements, y compris Windows, Linux, Mac, Azure, AWS et Lambda. Il prend en charge les projets .NET Framework, .NET Standard et .NET Core, garantissant une flexibilité à travers différents écosystèmes de développement.

    Kannaopat Udonpant
    Ingénieur logiciel
    Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Pendant qu'il poursuivait son diplôme, Kannapat est également devenu membre du laboratoire de robotique de véhicules, qui fait partie du département de bioproduction. En 2022, il a utilisé ses compé...
    Lire la suite