COMPARAISON AVEC D'AUTRES COMPOSANTS

Comparaison entre IronOCR et Aspose.OCR

Publié janvier 26, 2023
Partager:

OCR est l'abréviation de Optical Character Recognition (reconnaissance optique de caractères). Il s'agit d'une technologie qui utilise une machine pour convertir des images de texte en texte numérique qui peut être recherché et édité.

Cette technologie existe depuis un certain temps, mais elle devient de plus en plus populaire grâce aux progrès de l'apprentissage automatique. Récemment, au cours des deux dernières années, des informaticiens ont mis au point un algorithme capable de lire l'écriture cursive, que de nombreuses personnes utilisent encore aujourd'hui, notamment les médecins et les avocats. Cet outil permet notamment de numériser un livre entier, d'extraire le texte d'une seule lettre, de convertir un fichier PDF entier en un format modifiable, de reconnaître des documents, d'assurer l'indépendance de la plate-forme TIFF, etc. Le moteur de reconnaissance optique de caractères peut être utilisé dans de nombreux secteurs tels que les médias et les sociétés d'édition, les cabinets d'avocats, les bibliothèques, les services d'archives publiques, etc. De nombreuses entreprises utilisent des logiciels OCR pour numériser les chèques et les relevés de compte papier, corriger automatiquement l'orthographe ou reconnaître la console de texte, ce qui leur permet d'économiser du temps et des efforts par rapport à la numérisation manuelle des documents.

Il arrive que le texte des images ne soit pas en anglais. Dans ce cas, il convient d'utiliser un outil de reconnaissance optique de caractères (OCR) qui effectuera une traduction sur l'image PNG avant d'extraire et de convertir le texte en caractères anglais.

Dans cet article, nous allons comparer deux des bibliothèques et applications les plus courantes pour l'OCR des formats raster et des images de documents PDF. Il s'agit de

  • Aspose.OCR
  • IronOCR

1.0 Introduction

1.1 Introduction et caractéristiques d'Aspose.OCR

Aspose.OCR for .NET est un logiciel puissant et robuste pour la reconnaissance optique de caractères. Il s'agit d'un excellent complément à toute application, qui permet d'automatiser le processus. L'API OCR autonome est extensible, conviviale et compacte. Il est livré avec un ensemble simple de classes qui fournissent toutes les fonctionnalités dont vous avez besoin pour commencer à reconnaître du texte sans aucune difficulté supplémentaire et pour maintenir un ordre de texte correct. Aspose.OCR peut lire plus de 100 formats différents et offre une myriade de fonctions utiles, allant de la lecture des polices de caractères à l'application d'effets de style(gras/italique)et même de supprimer le bruit de votre image. L'API peut utiliser le GPU pour effectuer la reconnaissance optique de caractères et économiser de l'énergie sur votre CPU.

Fonctionnalités d'Aspose.OCR

  • Détecter, identifier et lire par programme des caractères à partir d'images.
  • Numériser l'ensemble de l'image ou seulement une partie spécifique de l'image.
  • Correction de l'obliquité pour l'opération OCR. Numériser des images pivotées.
  • Prend en charge les formats JPEG, PNG, GIF, etc. Pour obtenir la liste complète des formats de fichiers pris en charge, veuillez consulter la page Formats de fichiers pris en charge et vous abonner au produit Aspose.
  • Prise en charge de nombreux caractères, y compris les chiffres et les alphabets. Pour obtenir la liste complète des caractères pris en charge, veuillez consulter la page Caractères pris en charge.
  • Actuellement, il prend en charge 20 langues européennes et le chinois.
  • Détecte et lit les polices les plus courantes telles que Arial, Times New Roman, Courier New, Tahoma, Calibri et Verdana.
  • Prend en charge les styles de police ordinaire, gras et italique.
  • Application de divers filtres de suppression du bruit pour faciliter la reconnaissance d'images.
  • Calculer les cadres de délimitation des lignes ou des paragraphes.
  • Obtenez les choix possibles pour chaque personnage reconnu.
  • Transmettre l'URI et reconnaître l'image à partir de celui-ci.
  • Reconnaître plusieurs images dans un dossier ou une archive zip.
  • Obtenir les résultats au format JSON.
  • Sauvegarde des résultats au format texte, DOCX ou PDF

    Pour l'intégration de la navigation à bascule, Aspose est une bonne option. La console de texte reconnu et la reconnaissance de texte de document ou d'image à texte ou l'API OCR d'image sont des exemples de fonctionnalités qui peuvent être utiles.

    Outre la vérification automatique de l'orthographe, le logiciel de détection d'images est également conçu pour prendre en charge une variété de formats de sortie(tels que PNG) et d'ignorer les blocs non textuels sans nécessiter d'API d'OCR supplémentaire. Les fonctions de l'API autonome sont accessibles dans l'environnement de développement pour capturer du texte à partir d'images.

1.2 IronOCR - Introduction et caractéristiques

IronOCR for .NET lit le contenu textuel des photos et des PDF dans les applications et sites web .NET. Le logiciel permet de numériser des photos pour en extraire du texte et des codes-barres. Il produit le contenu sous forme de texte simple ou de données structurées. IronOCR prend en charge de nombreuses langues internationales. La bibliothèque OCR peut être utilisée dans les applications .NET MVC, Web, Console et de bureau. Pour les déploiements commerciaux, les licences sont fournies avec l'assistance directe de l'équipe de développement.

  • Utilisant le dernier moteur Tesseract 5, IronOCR lit le texte, les codes-barres et les codes QR à partir de n'importe quelle image ou format PDF. Cette bibliothèque permet d'ajouter rapidement l'OCR aux applications de bureau, aux consoles et aux applications web.
  • IronOCR prend en charge 127 langues internationales. Il prend également en charge les langues et les listes de mots personnalisées.
  • Il peut lire plus de 20 formats de codes-barres et de codes QR.
  • IronOCR prend en charge les formats d'image GIF et TIFF multipages.
  • Il corrige les images numérisées de mauvaise qualité.
  • IronOCR prend en charge le multithreading. Il peut exécuter un ou plusieurs processus à la fois.
  • IronOCR peut fournir une sortie de données structurées en pages, paragraphes, lignes, mots, caractères, etc.
  • IronOCR prend en charge les systèmes d'exploitation tels que Windows, Linux, macOS, etc.

2. Création d'un nouveau projet dans Visual Studio

Ouvrez Visual Studio et allez dans le menu Fichier. Sélectionnez Nouveau projet, puis Application console.

Une comparaison entre IronOCR et Aspose.OCR - Figure 1 : Application Console

App console

Saisissez le nom du projet et sélectionnez le chemin d'accès au fichier dans la zone de texte appropriée. Cliquez ensuite sur le bouton Create et choisissez un Framework .NET :

Une comparaison entre IronOCR et Aspose.OCR - Figure 2 : Configuration du nouveau projet

Configuration d'un nouveau projet

Le projet va maintenant générer la structure de l'application sélectionnée.

Une comparaison entre IronOCR et Aspose.OCR - Figure 3 : Fichier Program.cs

Fichier Program.cs

3.0 Installer

3.1 Installer Aspose.OCR

Installation d'Aspose.OCR pour .NET via NuGet

Nous pouvons installer l'API Aspose.OCR dans notre application en utilisant NuGet. Il suffit d'aller dans le menu Outils de Visual Studio et de sélectionner le gestionnaire de paquets NuGet. Dans le menu latéral, sélectionnez Gestion des paquets NuGet pour une solution. Une fenêtre du gestionnaire de paquets NuGet s'ouvrira. Allez dans l'onglet Parcourir et recherchez Aspose.OCR. Sélectionnez ensuite l'API Aspose dans les résultats de la recherche et cliquez sur le bouton "Installer". L'API Aspose sera installée et prête à être utilisée dans le projet.

Comparaison entre IronOCR et Aspose.OCR - Figure 4

Installer ou mettre à jour Aspose.OCR à l'aide de la console du gestionnaire de paquets

De même, vous pouvez installer Aspose.OCR à l'aide de la console. Ouvrez la console NuGet, qui se trouve généralement au bas d'un projet Visual Studio, écrivez la commande suivante et appuyez sur Entrée.

“Install-Package Aspose.OCR -Version x.x.0”

3.2 Installer IronOCR

La bibliothèque IronOCR peut être téléchargée et installée de quatre façons.

Il s'agit de

  • Utilisation de Visual Studio.
  • Utilisation de la ligne de commande.
  • Télécharger directement depuis le site web de NuGet.
  • Télécharger à partir du site web d'IronPDF.

3.2.1 Utilisation de Visual Studio

La capture d'écran ci-dessous montre comment ouvrir le gestionnaire de paquets NuGet.

Une comparaison entre IronOCR et Aspose.OCR - Figure 5 : Gestionnaire de packages NuGet

Gestionnaire de paquets NuGet

Dans la fenêtre du gestionnaire de paquets, cliquez sur Browse et recherchez le mot-clé "IronOCR", comme dans la capture d'écran ci-dessous :

Une comparaison entre IronOCR et Aspose.OCR - Figure 6 : Installation de IronOCR

Installation de l'IronOCR

Dans l'image ci-dessus, nous pouvons voir la liste des recherches connexes. Nous devons sélectionner l'option requise pour installer le paquet dans la solution.

3.2.2 Utilisation de la ligne de commande

  • Dans Visual Studio : Allez dans Outils -> NuGet Package manager -> Console du gestionnaire de paquets
  • Saisissez la ligne suivante dans l'onglet de la console.
Install-Package IronOcr
  • Le paquet sera alors téléchargé/installé dans le projet en cours et prêt à être utilisé.

3.2.3 Téléchargement direct depuis le site NuGet

La troisième méthode consiste à télécharger le paquet NuGet directement à partir du site web.

  • Naviguez jusqu'à la pageprivilège.
  • Sélectionnez l'option de téléchargement dans le menu de droite.
  • Double-cliquez sur le paquet téléchargé. Il sera installé automatiquement.
  • Ensuite, rechargez la solution et commencez à l'utiliser dans le projet.

3.2.4 Téléchargement direct à partir du site web de l'IronOCR

Cliquez sur le boutonlien ici pour télécharger le dernier paquetage directement depuis le site web. Une fois téléchargé, suivez les étapes ci-dessous pour ajouter le paquet au projet.

  • Cliquez avec le bouton droit de la souris sur le projet dans la fenêtre Solution.
  • Ensuite, sélectionnez l'option Référence et recherchez l'emplacement de la référence téléchargée.
  • Cliquez ensuite sur OK pour ajouter la référence.

4.0 Image OCR

IronOCR et Aspose.OCR disposent tous deux d'une technologie OCR qui convertit les images en texte.

4.1 Utilisation de Aspose.OCR

L'extrait de code suivant illustre l'utilisation de la fonctionRecognizeImage (Reconnaître une image) pour effectuer une opération d'OCR sur l'image d'une page.

// For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();
// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();
// Recognize image
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");
// Display the recognized text
Console.WriteLine(result);
// For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();
// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();
// Recognize image
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");
// Display the recognized text
Console.WriteLine(result);
' For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
' The path to the documents directory.
Dim dataDir As String = RunExamples.GetDataDir_OCR()
' Initialize an instance of AsposeOcr
Dim api As New AsposeOcr()
' Recognize image
Dim result As String = api.RecognizeImage(dataDir & "Sampleocr.bmp")
' Display the recognized text
Console.WriteLine(result)
VB   C#

L'extrait de code suivant illustre l'utilisation de la fonctionRecognizeLine pour effectuer une opération d'OCR sur une image contenant une seule ligne.

// For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();

// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();

// Recognize image
string result = api.RecognizeLine(dataDir + "sample_line.png");

// Display the recognized text
Console.WriteLine(result);
// For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();

// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();

// Recognize image
string result = api.RecognizeLine(dataDir + "sample_line.png");

// Display the recognized text
Console.WriteLine(result);
' For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
' The path to the documents directory.
Dim dataDir As String = RunExamples.GetDataDir_OCR()

' Initialize an instance of AsposeOcr
Dim api As New AsposeOcr()

' Recognize image
Dim result As String = api.RecognizeLine(dataDir & "sample_line.png")

' Display the recognized text
Console.WriteLine(result)
VB   C#

4.2 Utilisation de l'IronOCR

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("3.png")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Console.ReadKey()
End Using
VB   C#

L'API Tesseract 5, qui nous permet de convertir des fichiers images en texte, est présentée ci-dessus. Nous créons un objet pour IronTesseract dans la ligne de code ci-dessus. Nous créons également un objet OcrInput qui nous permettra d'ajouter un ou plusieurs fichiers images. Il peut être nécessaire d'indiquer le chemin d'accès à l'image disponible dans le code lorsque l'on utilise la méthode d'ajout de l'objet OcrInput. Il est possible d'ajouter un nombre illimité d'images. La fonction "Read" de l'objet IronTesseract que nous avons construit précédemment peut être utilisée pour obtenir les images en analysant le fichier image et en extrayant le résultat dans le résultat OCR. Il est capable d'extraire du texte des photos et de le convertir en une chaîne de caractères.

Nous pouvons également utiliser Tesseract pour ajouter des images multiples. AddMultiFrameTiff est une méthode différente pour cette opération. La bibliothèque Tesseract lit chaque image dans l'image, et chaque image est traitée comme une page distincte. Le processus lit la première image de l'image, puis passe à l'image suivante, et ainsi de suite jusqu'à ce que toutes les images de l'image aient été numérisées. Seul le format d'image TIFF est pris en charge par cette méthode.

Une comparaison entre IronOCR et Aspose.OCR - Figure 74 : Installation d'IronOCR

Installation de l'IronOCR

L'image ci-dessus est le résultat de l'IronOCR qui a converti avec précision les données en texte éditable.

5.0 Fichiers PDF OCR

IronOCR et Aspose.OCR convertissent les fichiers PDF en texte éditable. Aspose.OCR propose à l'utilisateur une liste d'options telles que l'enregistrement de la page, l'édition de l'image, la reconnaissance de la page, etc. Il propose également des options d'enregistrement telles que le texte, le document, le format HTML, etc. IronOCR nous permet également de sauvegarder un fichier OCR converti en HTML, texte, PDF, etc.

5.1 Utilisation de Aspose.OCR

Aspose.OCR propose la méthode RecognizePdf qui permet de reconnaître du texte dans les images extraites de fichiers PDF numérisés. La méthode RecognizePdf prend le chemin PDF en paramètre et l'objet DocumentRecognitionSettings. L'extrait de code suivant illustre l'utilisation de la méthode RecognizePdf pour reconnaître des images à partir d'un fichier PDF multipage numérisé.

// The path to the PDF file
string dataDir = RunExamples.GetDataDir_OCR();
// Archive Path
string fullPath = dataDir + "OCR.pdf";
// Recognize images from PDF           
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
            set.DetectAreas = false;
    List<RecognitionResult> result = api.RecognizePdf(imgPath, set);
// Print result
int pageNumber = 0;
    foreach (var page in result)
    {                
        System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
    }
// The path to the PDF file
string dataDir = RunExamples.GetDataDir_OCR();
// Archive Path
string fullPath = dataDir + "OCR.pdf";
// Recognize images from PDF           
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
            set.DetectAreas = false;
    List<RecognitionResult> result = api.RecognizePdf(imgPath, set);
// Print result
int pageNumber = 0;
    foreach (var page in result)
    {                
        System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
    }
' The path to the PDF file
Dim dataDir As String = RunExamples.GetDataDir_OCR()
' Archive Path
Dim fullPath As String = dataDir & "OCR.pdf"
' Recognize images from PDF           
Dim [set] As New DocumentRecognitionSettings()
			[set].DetectAreas = False
	Dim result As List(Of RecognitionResult) = api.RecognizePdf(imgPath, [set])
' Print result
Dim pageNumber As Integer = 0
	For Each page In result
'INSTANT VB WARNING: An assignment within expression was extracted from the following statement:
'ORIGINAL LINE: System.Console.WriteLine(string.Format("Page: {0} text: {1}", pageNumber++, page.RecognitionText));
		System.Console.WriteLine($"Page: {pageNumber} text: {page.RecognitionText}")
		pageNumber += 1
	Next page
VB   C#

5.2 Utilisation de l'IronOCR

Nous pouvons également utiliser OCRInput pour gérer les fichiers PDF. Chaque page d'un document sera lue par la classe IronTesseract. Le texte sera ensuite extrait des pages. Nous pouvons également ouvrir des documents protégés à l'aide d'une deuxième fonction appelée "AddPDF", qui nous permet d'ajouter des PDF à notre liste de documents(mot de passe s'il est protégé). Le code suivant montre comment ouvrir un document PDF protégé par un mot de passe :

var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract() ' nothing to configure
Using Input = New OcrInput()
	Input.AddPdf("example.pdf", "password")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

Nous pouvons lire et extraire le contenu d'une seule page d'un document PDF en utilisant AddPdfPage. Seul le numéro de la page dont nous voulons extraire le texte doit être spécifié. AddPdfPage nous permet d'extraire du texte à partir de nombreuses pages que nous spécifions. Dans IEnumerable&lt;int&gt;, nous pouvons facilement spécifier plusieurs pages. Nous devons également inclure l'emplacement du fichier ainsi que son extension. Ceci est démontré dans l'exemple de code suivant :

IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
Dim numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
 Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	'single page
	Input.AddPdfPage("example.pdf",10)
	'Multiple page
	Input.AddPdfPages("example.pdf", numbers)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Result.SaveAsTextFile("ocrtext.txt")
End Using
VB   C#

En utilisant la fonction SaveAsTextFile, nous pouvons stocker le résultat sous forme de fichier texte, ce qui nous permet de télécharger le fichier dans le chemin du répertoire de sortie. Nous pouvons également enregistrer le fichier dans un fichier HTML à l'aide de SaveAsHocrFile.

6.0 Autres caractéristiques

6.1 Utilisation de Aspose.OCR

Aspose.OCR propose des options supplémentaires telles que Dessiner une zone de texte, Dessiner une zone d'image, Dessiner une zone de tableau, Dessiner une zone de reconnaissance, etc. Ces options permettent à l'utilisateur d'améliorer les performances de l'OCR. L'application ne se contente pas d'effectuer l'OCR, elle permet également d'effectuer des opérations telles que combiner des PDF, diviser des PDF, éditer des PDF, etc.

6.2 Utilisation de l'IronOCR

IronOCR possède des fonctionnalités uniques qui nous permettent de lire les codes-barres et les codes QR des documents scannés. Les codes ci-dessous montrent comment lire un code-barres à partir d'une image ou d'un document donné.

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("barcode.gif")
	Dim Result = Ocr.Read(Input)

	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
VB   C#

Le code ci-dessus permet de lire un code-barres à partir d'une image ou d'un document PDF donné. Il peut lire plus d'un code-barres sur la page/l'image. Pour lire le code-barres, IronOCR dispose d'un paramètre unique, Ocr.Configuration.ReadBarCodes. La valeur par défaut est fixée à false.

Après la lecture de l'entrée, les données sont enregistrées dans l'objet appelé OCResult. Cette propriété s'appelle Barcodes, et elle contient toutes les données disponibles sur les codes-barres dans une liste. En utilisant la boucle foreach, nous pouvons obtenir tous les détails du code-barres un par un. En outre, il scanne le code-barres et lit la valeur du code-barres - deux opérations réalisées en un seul processus.

Il prendra également en charge les options d'enfilage. Nous pouvons effectuer plusieurs processus d'OCR en même temps. IronOCR est également capable de reconnaître une zone spécifique à partir d'une région donnée.

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
} 
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
} 
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	Input.Add("document.png", ContentArea)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

L'exemple de code ci-dessus permet d'effectuer l'OCR sur une région spécifique. Il suffit de spécifier la région rectangulaire dans l'image ou le PDF. Le moteur Tesseract d'IronOCR nous aide à reconnaître le texte.

Modèles de licence et tarification d'IronOCR et d'Aspose.OCR

Modèles de licence et prix de l'IronOCR

Une garantie de remboursement de 30 jours: IronOCR a une politique de remboursement de 30 jours. Ainsi, si vous changez d'avis après avoir acheté le logiciel, vous pouvez demander le remboursement de votre argent dans les 30 jours.

Intégration facile: L'intégration d'IronOCR à un projet et à un environnement est si facile qu'il suffit d'écrire une seule ligne de code et de l'ajouter à partir d'un paquet NuGet. Nous pouvons également le télécharger sur le web et l'intégrer à notre environnement de cette manière.

Licence perpétuelle: Chaque licence est achetée une fois et ne nécessite pas de renouvellement.

Assistance gratuite et mises à jour du produit : Chaque licence est accompagnée d'un an de mises à jour gratuites du produit et d'une assistance de la part de l'équipe à l'origine du produit. Il est possible d'acheter des extensions à tout moment. Les extensions peuvent être visualisées.

Licences immédiates: Les clés de licence enregistrées sont envoyées dès réception du paiement.

Toutes les licences sont perpétuelles et s'appliquent au développement, à la mise en place et à la production.

Le paquet "Lite

  • 1 développeur
  • 1 emplacement
  • 1 projet
  • Licence perpétuelle

    Ce paquet permet à un seul développeur de logiciels au sein d'une organisation d'utiliser ce Iron Software en un seul endroit. Il peut être utilisé dans une seule application web, une application intranet ou un logiciel de bureau. Les licences ne sont pas transférables et ne peuvent être partagées en dehors d'une organisation ou d'une relation agence/client. Ce type de licence, comme tous les autres types de licence, exclut expressément tous les droits qui ne sont pas expressément accordés dans le cadre de l'accord, sans redistribution OEM et en utilisant Iron Software en tant que SaaS sans acheter de couverture supplémentaire.

    Tarification: À partir de 499 $ par an.

La licence professionnelle

  • 10 développeurs
  • 10 emplacements
  • 10 projets
  • Licence perpétuelle

    Cela permet à un nombre prédéterminé de développeurs de logiciels au sein d'une organisation d'utiliser ce Iron Software sur un seul site, jusqu'à un maximum de dix. IronOCR peut être utilisé dans autant de sites web, d'applications intranet ou de logiciels de bureau que vous le souhaitez. Ce type de licence, comme tous les autres types de licence, exclut expressément tous les droits qui ne sont pas expressément accordés dans le cadre de l'accord, y compris la redistribution OEM et l'utilisation du Iron Software en tant que SaaS sans achat d'une couverture supplémentaire. Cette licence peut être intégrée à un seul projet jusqu'à un maximum de 10.

    Tarification: À partir de 999 $ par an.

La License Unlimited

  • Nombre illimité de développeurs
  • Nombre illimité de lieux
  • Projets illimités
  • Licence perpétuelle

    Cela permet à un nombre illimité de développeurs de logiciels dans une organisation d'utiliser ce Iron Software dans un nombre illimité de lieux. Il peut être utilisé dans autant de sites web, d'applications intranet ou de logiciels de bureau que vous le souhaitez. Les licences ne sont pas transférables et ne peuvent être partagées en dehors d'une organisation ou d'une relation agence/client. Ce type de licence, comme tous les autres types de licence, exclut expressément tous les droits qui ne sont pas expressément accordés dans le cadre de l'accord, y compris la redistribution OEM et l'utilisation du Iron Software en tant que SaaS sans achat d'une couverture supplémentaire.

    Tarification: À partir de 2999 $ par an.

    Royalty-Free Redistribution - Cela vous permet de distribuer ce Iron Software dans le cadre d'un certain nombre de produits commerciaux conditionnés différemment(sans avoir à payer de redevances) en fonction du nombre de projets couverts par la licence de base. Elle permet de déployer le Iron Software dans le cadre de services logiciels SaaS, en fonction du nombre de projets couverts par la licence de base.

    Tarification: A partir de 1599 $ par an.

    Une comparaison entre IronOCR et Aspose.OCR - Figure 8 : Tarification

    Tarification

Modèles de licence et prix d'Aspose

Le développeur Licence pour petites entreprises

Une licence de développeur pour petites entreprises permet à un développeur de créer un nombre illimité de logiciels pour utilisateurs finaux à l'aide du produit, et de l'installer sur un seul site physique au sein de son organisation. Lorsque vous déployez un logiciel pour utilisateur final, vous devez acheter une licence pour chaque développeur de votre équipe de développement ou pour chaque site physique où le logiciel sera utilisé. La licence de développeur pour petites entreprises ne vous permet pas de distribuer votre logiciel d'utilisateur final à des tiers, à des sites web publics, à des applications, à des extranets, à des intranets multisites ou à des logiciels en tant que service(SaaS) scénarios d'utilisation du projet. Vous ne pouvez déployer les applications que vous développez à l'aide d'une licence OEM qu'auprès d'un seul client. Si vous souhaitez créer des bibliothèques destinées à être utilisées par d'autres entreprises ou distribuer vos créations en tant que logiciels libres, vous aurez besoin d'un autre type de licence.

Tarification: A partir de 799 $ par an.

La licence OEM du développeur

La licence OEM développeur permet à un développeur d'utiliser le produit sur un nombre illimité d'ordinateurs, quel que soit l'endroit où il se trouve. Ainsi, si vous travaillez dans un bureau mais que vous avez besoin de travailler dans un autre bureau pendant une heure, c'est possible avec ce type de licence. Une licence de développeur OEM couvre un producteur de produits logiciels, c'est-à-dire une personne qui n'est pas un revendeur agréé du produit mais qui crée un logiciel utilisant ses fonctions. Pour distribuer un logiciel à un utilisateur final, vous avez besoin de ce type de licence. Pour permettre la distribution du logiciel de l'utilisateur final à des tiers, à des sites web/applications publics, à des extranets, à des intranets multisites ou à des scénarios d'utilisation de projets SaaS, une licence de développeur doit être achetée pour chaque développeur de l'équipe de développement. Cette licence ne permet pas de créer des logiciels tels qu'une API ou un SDK pour les utilisateurs finaux.

Tarification: A partir de 2397 $ par an.

Le site Licence pour petites entreprises

Une licence Site Small Business License permet à un maximum de dix développeurs de créer un nombre illimité de logiciels pour utilisateurs finaux à l'aide du produit, qui peuvent être utilisés dans n'importe lequel de vos dix sites physiques(par exemple, des immeubles de bureaux séparés ou, si vous n'êtes pas une entreprise disposant de plusieurs bureaux, n'importe quel emplacement physique). Si vous avez plus de dix développeurs ou si vous souhaitez utiliser Aspose sur plus de dix sites, vous pouvez acheter une licence multisite pour petites entreprises. Cette licence ne permet pas la distribution du logiciel créé avec cette licence à d'autres organisations.

Tarification: A partir de 3995 $ par an.

Licence OEM avec compteur

Une License OEM avec compteur prend en charge un nombre illimité de développeurs, de sites et de logiciels d'utilisateurs finaux. Il permet aux utilisateurs de distribuer le logiciel de l'utilisateur final à un tiers. La licence OEM mesurée est destinée aux sites web/applications publics et peut être utilisée pour soutenir des extranets ou des projets SaaS. Il crée des logiciels pour l'utilisateur final qui sont utilisés dans une bibliothèque de développement dotée d'une API ou d'un SDK.

Tarification: À partir de 1 999 $ par an.

Une comparaison entre IronOCR et Aspose.OCR - Figure 9 : Tarification d'Aspose

Prix d'Aspose

La licence Lite d'IronOCR comprenant un pack développeur avec un an d'assistance coûte environ 499 dollars, tandis qu'Aspose.OCR avec un pack développeur coûte 799 dollars avec une assistance technique gratuite, et 1 198 dollars avec une assistance payante. La licence Professionnelle d'IronOCR comprenant 10 packages pour développeurs et un an d'assistance coûte 999 dollars, tandis que la licence Aspose Site OEM comprenant 10 packages pour développeurs coûte 11 186 dollars par an avec une assistance technique gratuite, tandis que les versions techniques et les mises à jour payantes font passer ce chiffre à 23 171 dollars.

Les offres IronOCR Lite et Professional proposent un service SaaS ou OEM et une option d'assistance de 5 ans. L'offre Lite, qui comprend un package pour un développeur avec un support de 5 ans et des services SaaS et OEM, coûte 2 897 dollars, tandis qu'Aspose propose des services SaaS ou OEM et des options de support personnalisées. La licence Professionnelle d'IronOCR comprend un package de 10 développeurs avec un an de support payant, ainsi que des services SaaS et OEM, le tout pour le prix de 23 171 $, tandis qu'Aspose propose un package de 10 développeurs sans support mais avec des services SaaS et OEM pour le prix de 11 186 $.

7.0 Conclusion

IronOCR for .NET framework fournit un Tesseract simple et facile à utiliser. Il prend en charge les photos et les documents PDF de différentes manières. Il fournit également un certain nombre de paramètres permettant d'améliorer les performances de la bibliothèque OCR de Tesseract. Plusieurs langues sont prises en charge en une seule opération. Pour en savoir plus sur le Tesseract OCR, visitez leur site web.

Aspose OCR est une application logicielle qui utilise un moteur d'intelligence artificielle pour reconnaître les images et les documents PDF. Il propose également divers paramètres permettant d'améliorer les performances du processus d'OCR. En outre, il offre la possibilité de sélectionner plusieurs langues et d'effectuer ensuite l'OCR. Aspose impose certaines limites à l'utilisation des conversions de pages. Le prix varie également en fonction du système d'exploitation.

Les packages IronOCR offrent de meilleures licences et assistance par rapport à Aspose. Aspose est également plus cher. IronOCR est proposé à partir de 499 dollars, tandis qu'Aspose est proposé à partir de 999 dollars par an. En outre, IronOCR offre plus de fonctionnalités qu'Aspose et prend en charge plusieurs plates-formes à un prix unique.

Alors, qu'attendez-vous ? L'essai gratuit est ouvert à tous. Vous pouvez obtenir lelicence ici et commencer immédiatement.

< PRÉCÉDENT
Comparaison entre IronOCR et Nanonets OCR
SUIVANT >
Comparaison entre IronOCR et Syncfusion OCR