COMPARAISON AVEC D'AUTRES COMPOSANTS

Comparaison entre IronOCR et Asprise OCR

Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

Kannapat Udonpant

juin 8, 2022

Lorsque nous parlons d'OCR, il s'agit de la reconnaissance optique de caractères. Le terme est souvent utilisé dans le monde des affaires pour désigner le processus de conversion d'une image ou d'une représentation graphique de tout document basé sur du texte (par exemple, une page scannée ou faxée) en un format de document modifiable ou en un format de document consultable par texte grâce à un logiciel informatique.

L'acronyme OCR signifie Optical Character Recognition (reconnaissance optique de caractères), une tâche effectuée par un logiciel informatique spécialement conçu à cet effet. Ce type de logiciel numérise la page et reconnaît toute information textuelle qui s'y trouve, la convertissant sous forme numérique afin qu'elle puisse être éditée et reproduite numériquement sans perte de qualité.

Il existe de nombreuses applications pour l'OCR, mais le cas d'utilisation le plus courant est la conversion de documents numérisés en fichiers numériques qui peuvent être formatés et indexés dans des bases de données et analysés.

Dans cet article, nous allons comparer deux des bibliothèques et applications les plus courantes pour l'OCR et les images de documents PDF. Il s'agit de

Asprise OCR
IronOCR

1.0 Introduction

1.1 Introduction et caractéristiques de l'OCR Asprise

Le SDK Asprise C# .NET OCR (reconnaissance optique de caractères) et reconnaissance de codes-barres offre une bibliothèque d'API haute performance pour équiper vos applications C# .NET (applications Windows, applications Silverlight, applications de service web ASP.NET, contrôles ActiveX, etc.) avec la fonctionnalité d'extraction de texte et d'information de codes-barres à partir de documents numérisés.

Vous pouvez convertir des images (dans divers formats tels que JPEG, PNG, TIFF, PDF, etc.) en formats de documents modifiables (Word, XML, PDF consultable, etc.). Aux côtés d'autres offres telles que le SDK de numérisation d'images Asprise (qui capture les documents à partir de scanners), vous pouvez facilement mettre en œuvre des solutions complètes de gestion de documents.

Les caractéristiques d'Asprise OCR

Reconnaissance de texte précise

Grâce à des algorithmes améliorés de traitement d'image et de détection de texte, Asprise OCR peut facilement reconnaître des documents difficiles avec une mauvaise qualité d'image. Les paramètres peuvent être utilisés pour favoriser légèrement la précision par rapport à la vitesse.

Moteur OCR haute vitesse

Asprise OCR utilise un moteur OCR optimisé pour effectuer une excellente reconnaissance dans un délai court. La vitesse peut être encore améliorée grâce au multithreading et à l'accélération GPU optionnelle.

Plus de 20 langues prises en charge

Asprise OCR reconnaît plus de 20 langues telles que l'anglais, l'espagnol, le français, l'allemand, l'italien, le hongrois, le finnois, le suédois, le roumain, le polonais, le malais, l'arabe, l'indonésien et le russe.

Tous les formats de code-barres populaires

Tous les formats de codes-barres courants sont pris en charge : EAN-8, EAN-13, UPC-A, UPC-E, ISBN-10, ISBN-13, Interleaved 2 of 5, Code 39, Code 128, PDF417 et QR Code.

Images en PDF Recherchable

En quelques lignes de code, vous pouvez convertir différents formats d'images tels que JPEG, PNG, TIFF et PDF en fichiers PDF interrogeables.

Déploiement facile

Aucun dongle de protection du logiciel, aucun serveur de licence n'est nécessaire. Le déploiement d'Asprise OCR SDK est aussi simple que son développement.

Économique, Sans Frais de Licence

Libre de droits signifie que vous payez lorsque vous commandez une licence de développement, mais que vous n'avez pas à payer à nouveau lorsque vous déployez votre logiciel sur des milliers de serveurs ou auprès de milliers d'utilisateurs finaux.

Support primé

Leur équipe est non seulement sympathique, mais aussi capable de vous fournir une assistance technique de premier ordre.

1.2 IronOCR - Introduction et caractéristiques

IronOCR fournit des logiciels aux ingénieurs qui utilisent IronOCR for .NET pour lire le contenu textuel des photos et des PDF dans les applications et les sites Web .NET. Il scanne les photos pour en extraire le texte et les codes-barres, et prend en charge de nombreuses langues internationales ; il peut ensuite fournir des résultats sous forme de texte brut ou de données structurées. La bibliothèque OCR d'Iron Software peut être utilisée dans les applications .NET MVC, Web, console et de bureau. Pour les déploiements commerciaux, les licences sont fournies avec l'assistance directe de l'équipe de développement.

Utilisant le dernier moteur Tesseract 5, IronOCR lit le texte, les codes-barres et les codes QR à partir de n'importe quelle image ou format PDF. Cette bibliothèque permet d'ajouter rapidement l'OCR aux applications de bureau, aux consoles et aux applications web.
IronOCR prend en charge 127 langues internationales. Il prend également en charge des listes personnalisées de langues et de mots.
IronOCR est capable de lire plus de 20 formats de codes-barres et de codes QR.
IronOCR prend en charge les formats d'image gifs et tiff multipages.
IronOCR permet de corriger les images numérisées de mauvaise qualité.
IronOCR prend en charge le multithreading - il exécute un ou plusieurs processus à la fois.
IronOCR peut fournir des données structurées pour les pages, les paragraphes, les lignes, les mots, les caractères, etc.
IronOCR prend en charge une variété de systèmes d'exploitation tels que Windows, Linux, macOS, etc.

2.0 Créer un nouveau projet dans Visual Studio

Ouvrez le logiciel Visual Studio et allez dans le "menu fichier". Sélectionnez "nouveau projet", puis "application console".

Saisissez le nom du projet et sélectionnez le chemin d'accès au fichier dans la zone de texte appropriée. Ensuite, cliquez sur le bouton de création et sélectionnez le Framework .NET requis, comme dans la capture d'écran ci-dessous.

Le projet Visual Studio va maintenant générer la structure de l'application sélectionnée et, si vous avez choisi l'application console, Windows et web, il va maintenant ouvrir le fichier program.cs dans lequel vous pouvez saisir le code et construire/exécuter l'application.

Ensuite, nous pouvons ajouter la bibliothèque pour tester le code.

3.0 Installer

3.1 Installation Installer Asprise OCR

Nous pouvons télécharger Asprise OCR [ici](https://asprise.com/royalty-free-library/c%23-sharp.net-ocr-for-windows-mac-linux-download.html" target="_blank" rel="nofollow noopener noreferrer).

Il y a deux options : installer en utilisant NuGet ou télécharger manuellement le SDK depuis [asprise.com](http://asprise.com/" target="_blank" rel="nofollow noopener noreferrer).

Option 1 : NuGet PM> Install-Package asprise-ocr-api

Tout d'abord, créez une nouvelle application Windows Form Visual C#/Visual Basic ou utilisez un projet existant. Avec cette solution ouverte, ouvrez la [Console du Gestionnaire de Paquets NuGet](https://docs.nuget.org/consume/package-manager-console" target="_blank" rel="nofollow noopener noreferrer), et tapez la commande suivante :

:InstallCmd Install-Package asprise-ocr-api

:InstallCmd Install-Package asprise-ocr-api

SHELL

Une fois terminé, vous pouvez appeler le formulaire de démonstration OCR en copiant le code suivant dans Program.cs (pour C#) :

static class Program 
{ 
    [STAThread]
    static void Main() {
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}

static class Program 
{ 
    [STAThread]
    static void Main() {
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}

Friend Module Program
	<STAThread>
	Sub Main()
		Application.EnableVisualStyles()
		Application.SetCompatibleTextRenderingDefault(False)
		Application.Run(New asprise_ocr_api.OcrSampleForm())
	End Sub
End Module

$vbLabelText $csharpLabel

Option 2 : Télécharger le SDK OCR sur Asprise.com

Téléchargez une copie du SDK Asprise OCR depuis [www.asprise.com/product/ocr](http://www.asprise.com/product/ocr" target="_blank" rel="nofollow noopener noreferrer). Il suffit de le décompresser dans un dossier vide.

L'organisation des fichiers de la distribution d'Asprise OCR SDK est la suivante : ``

SDK OCR

--- aocr.dll, aocr_x64.dll [DLL requise]

--- projets d'exemple [.NET API et projet d'exemple]

+--- images [Exemples d'images] ``

Naviguez jusqu'au dossier sample-projects et ouvrez la solution : ocr-samples-vs.sln. Il y a deux projets :

asprise-ocr-api : l'API OCR .NET
asprise-ocr-api-sample : programme de démonstration
Faites un clic droit sur le projet asprise-ocr-api-sample et "Set as StartUp Project", puis cliquez sur le bouton "Start" ou appuyez sur F5 et vous verrez la même interface utilisateur que celle illustrée.

3.2 Installer IronOCR

La bibliothèque IronOCR peut être téléchargée et installée de quatre façons.

Il s'agit de

Utilisation de Visual Studio
Utilisation de la ligne de commande de Visual Studio.
Téléchargement direct depuis le site NuGet.
Téléchargement direct depuis le site web d'IronPDF.

3.2.1 Utilisation de Visual Studio

Le logiciel Visual Studio propose l'option NuGet Package Manager pour installer le paquet directement dans la solution. La capture d'écran ci-dessous montre comment ouvrir le gestionnaire de paquets NuGet.

Il offre une boîte de recherche pour afficher la liste des packages depuis le site NuGet. Dans le gestionnaire de packages, nous devons rechercher le mot-clé IronOCR, comme dans la capture d'écran ci-dessous :

Dans l'image ci-dessus, nous obtiendrons la liste des éléments de recherche connexes. Nous devons sélectionner l'option requise pour installer le paquet dans la solution.

3.2.2 Utilisation de la ligne de commande de Visual Studio

Dans Visual Studio, allez dans Outils-> Gestionnaire de paquets NuGet -> Console du gestionnaire de paquets

Saisissez la ligne suivante dans l'onglet Console du gestionnaire de paquets :

Install-Package IronOcr

Ensuite, le paquet sera téléchargé/installé dans le projet en cours et sera prêt à être utilisé.

3.2.3 Téléchargement direct depuis le site web de NuGet

La troisième méthode consiste à télécharger le paquet NuGet directement à partir du site web.

Naviguez vers le [lien](https://www.nuget.org/packages/Ironocr" target="_blank" rel="nofollow).
Sélectionnez l'option de téléchargement dans le menu de droite.
Double-cliquez sur le paquet téléchargé. Il sera installé automatiquement.
Ensuite, rechargez la solution et commencez à l'utiliser dans le projet.

3.2.4 Téléchargement direct à partir du site web de l'IronOCR

Cliquez sur le [lien](/csharp/ocr/" target="_blank) ici pour télécharger le dernier package directement depuis le site web. Une fois téléchargé, suivez les étapes ci-dessous pour ajouter le package au projet.

Cliquez avec le bouton droit de la souris sur le projet dans la fenêtre de la solution.
Ensuite, sélectionnez l'option référence et recherchez l'emplacement de la référence téléchargée.
Cliquez ensuite sur OK pour ajouter la référence.

4.0 Image OCR

IronOCR et Asprise OCR disposent tous deux d'une technologie OCR qui convertit les images en texte de recherche.

4.1 Utilisation d'Asprise

Le code suivant démontre l'utilisation de base d'Asprise OCR.

using asprise_ocr_api;
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
Console.WriteLine("OCR Result: " + s);
// process more images here ...
ocr.StopEngine();

using asprise_ocr_api;
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
Console.WriteLine("OCR Result: " + s);
// process more images here ...
ocr.StopEngine();

Imports asprise_ocr_api
AspriseOCR.SetUp()
Dim ocr As New AspriseOCR()
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST)
Dim s As String = ocr.Recognize("C:\path\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT)
Console.WriteLine("OCR Result: " & s)
' process more images here ...
ocr.StopEngine()

$vbLabelText $csharpLabel

Asprise OCR prend en charge les formats d'image suivants : GIF, PNG, JPEG, TIFF et PDF. Pour l'exemple de code OCR présenté dans la section ci-dessus, l'entrée ressemble à ce qui suit :

Le résultat de l'OCR sera au format texte brut : ``

Asprise OCR et reconnaissance de codes-barres

Reconnaissance de codes-barres et OCR performante et libre de droits sous Windows,

...

ISBN-l3, Interleaved 2 of 5, Code 39, Code 128, PDF417, et QR Code.

[[QR-Code: www.asprise.com]]

[[CODE-128: Asprise]]. ``

Les deux dernières lignes représentent l'extrait des informations du code-barres. Remarque : le format et le contenu du code-barres sont tous deux encadrés par des paires de ‘[[ ]]’.

4.2 Utilisation de l'IronOCR

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}

Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("3.png")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Console.ReadKey()
End Using

$vbLabelText $csharpLabel

L'API Tesseract 5, qui nous permet de convertir des fichiers images en texte, est présentée ci-dessus. Dans la ligne de code ci-dessus, nous créons un objet pour le Tesseract d'Iron. Nous créons également un objet OcrInput qui nous permettra d'ajouter un ou plusieurs fichiers d'images. Il peut être nécessaire d'indiquer le chemin d'accès à l'image disponible dans le code lors de l'utilisation de la méthode d'ajout de l'objet OcrInput. Il est possible d'ajouter un nombre illimité d'images. La fonction "Read" de l'objet Irontesseract que nous avons construit précédemment peut être utilisée pour obtenir les images en analysant le fichier image et en extrayant le résultat dans le résultat de l'OCR. Il est capable d'extraire du texte des photos et de le convertir en une chaîne de caractères.

Nous pouvons également utiliser Tesseract pour ajouter des images multiples. "AddMultiFrameTiff" est une méthode différente pour cette opération. La bibliothèque Tesseract lit chaque image dans l'image, et chaque image est traitée comme une page distincte. Le processus lit la première image de l'image, puis passe à l'image suivante, et ainsi de suite jusqu'à ce que toutes les images de l'image aient été numérisées. Seul le format d'image Tiff est pris en charge par cette méthode.

L'image ci-dessus est le résultat de l'IronOCR, qui a converti avec précision les données en texte éditable.

5.0 Fichiers PDF OCR

IronOCR et Asprise OCR convertissent les fichiers PDF en texte éditable. Asprise OCR fournit une liste d'options à l'utilisateur telles que l'enregistrement de la page, l'édition de l'image, la reconnaissance de la page, etc. Il fournit également des options d'enregistrement telles que le texte, le document, le format HTML, etc. IronOCR nous permet également de sauvegarder le fichier OCR converti en HTML, texte, PDF, etc.

5.1 Utilisation d'Asprise OCR

Si vous définissez le format de sortie comme OUTPUT_FORMAT_PDF, vous devez spécifier le fichier de sortie PDF cible comme :

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf
PROP_PDF_OUTPUT_TEXT_VISIBLE=true");

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf
PROP_PDF_OUTPUT_TEXT_VISIBLE=true");

ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, "PROP_PDF_OUTPUT_FILE=ocr-result.pdf PROP_PDF_OUTPUT_TEXT_VISIBLE=true")

$vbLabelText $csharpLabel

Dans le code ci-dessus, les propriétés sont spécifiées dans une seule chaîne de caractères séparée par des caractères (avec la clé et la valeur séparées par =). Vous pouvez également spécifier des propriétés séparément, par paires :

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);

ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf", AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, True)

$vbLabelText $csharpLabel

Pour rendre le texte invisible ou transparent, il suffit de définir PROP_PDF_OUTPUT_TEXT_VISIBLE sur "false". Les PDF normaux et les PDF/A sont pris en charge. Veuillez vous référer au résumé des propriétés de l'Asprise OCR. Définir le format de sortie comme OUTPUT_FORMAT_RTF. Vous pouvez ensuite générer des fichiers .rtf qui peuvent être édités dans la plupart des traitements de texte (Microsoft Word, Libre Office, TextEdit, etc.).

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");

ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF, "PROP_RTF_OUTPUT_FILE=ocr-result.rtf")

$vbLabelText $csharpLabel

Une fois l'OCR effectuée, vous pouvez visualiser ou modifier le fichier RTF à l'aide d'un traitement de texte :

La méthode suivante permet d'effectuer l'OCR sur un fichier d'entrée PDF :

5.2 Utilisation de l'IronOCR

Nous pouvons également utiliser OCRInput pour gérer les fichiers PDF. Chaque page des documents sera lue par la classe du Tesseract d'Iron. Le texte sera ensuite extrait des pages. Nous pouvons également ouvrir des documents protégés en utilisant une deuxième fonction appelée "AddPDF", qui nous permet d'ajouter des PDFs à notre liste de documents (mot de passe si celui-ci est protégé). Le code suivant montre comment ouvrir un document PDF protégé par un mot de passe :

var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

Dim Ocr = New IronTesseract() ' nothing to configure
Using Input = New OcrInput()
	Input.AddPdf("example.pdf", "password")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using

$vbLabelText $csharpLabel

Nous pouvons lire et extraire le contenu d'une seule page d'un document PDF à l'aide de "Addpdfpage" Seul le numéro de la page dont nous voulons extraire le texte doit être spécifié. "AddPdfPage" permet d'extraire du texte de nombreuses pages que nous spécifions. Dans IEnumerable, nous pouvons facilement spécifier plusieurs pages. Nous devons également inclure l'emplacement du fichier ainsi que son extension. Ceci est démontré dans l'exemple de code suivant :

IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}

IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}

Dim numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
 Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	'single page
	Input.AddPdfPage("example.pdf",10)
	'Multiple page
	Input.AddPdfPages("example.pdf", numbers)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Result.SaveAsTextFile("ocrtext.txt")
End Using

$vbLabelText $csharpLabel

La fonction SaveAsTextFile permet de stocker le résultat dans un fichier texte, ce qui permet de télécharger le fichier dans le répertoire de sortie. Nous pouvons également enregistrer le fichier dans un fichier HTML à l'aide de SaveAsHocrFile.

6.0 Autres caractéristiques

6.1 Utilisation d'Asprise OCR

Asprise OCR dispose de quelques options supplémentaires telles que Dessiner la zone de texte, Dessiner la zone d'image, Dessiner la zone de tableau, Dessiner la zone de reconnaissance, etc. Ces options permettent à l'utilisateur d'améliorer les performances de l'OCR. Non seulement l'application effectue l'OCR, mais nous sommes également en mesure d'effectuer des opérations telles que combiner des PDF, diviser des PDF, éditer des PDF, etc.

6.2 Utilisation de l'IronOCR

IronOCR possède des fonctionnalités uniques qui nous permettent de lire les codes-barres et les codes QR des documents scannés. Les codes ci-dessous montrent comment lire un code-barres à partir d'une image ou d'un document donné.

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}

Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("barcode.gif")
	Dim Result = Ocr.Read(Input)

	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using

$vbLabelText $csharpLabel

Le code ci-dessus permet de lire un code-barres à partir d'une image ou d'un document PDF donné. Il peut lire plus d'un code-barres sur une page/image. Pour lire un code-barres, IronOCR dispose d'un paramètre unique, Ocr.Configuration.ReadBarCodes, qui aide à lire un code-barres. La valeur par défaut est fixée à false.

Après la lecture de l'entrée, les données sont enregistrées dans l'objet appelé OCRResult. Cette propriété s'appelle Barcodes et contient toutes les données disponibles sur les codes-barres dans une liste. En utilisant la boucle for-each, nous pouvons obtenir tous les détails du code-barres un par un. En outre, il scanne le code-barres et lit la valeur du code-barres - deux opérations réalisées en un seul processus.

Il prendra également en charge les options d'enfilage. Nous pouvons effectuer plusieurs processus d'OCR en même temps. IronOCR est également capable de reconnaître une zone spécifique à partir d'une région donnée.

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	Input.Add("document.png", ContentArea)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using

$vbLabelText $csharpLabel

L'exemple de code ci-dessus permet d'effectuer l'OCR sur une région spécifique. Il suffit de spécifier la région du rectangle dans l'image ou le PDF. Le moteur Tesseract d'IronOCR nous aide à reconnaître le texte.

7.0 Modèles de licence et prix d'IronOCR et d'Asprise OCR

Modèles et prix des licences IronOCR

Garantie de remboursement de 30 jours : lorsque la licence est achetée, vous bénéficiez de 30 jours pour obtenir un remboursement si la licence ne fonctionne pas.

Intégration facile : l'intégration de IronOCR dans un projet et un environnement est si simple que nous pouvons le faire en écrivant simplement une ligne de code et en l'ajoutant à partir de NuGet Package. Nous pouvons également le télécharger sur le web et l'intégrer à notre environnement de cette manière.

Licence perpétuelle : chaque licence est achetée une fois et ne nécessite pas de renouvellement.

Assistance gratuite et mises à jour du produit : chaque licence est accompagnée d'un an de mises à jour gratuites du produit et d'assistance de la part de l'équipe à l'origine du produit. Il est possible d'acheter des extensions à tout moment. Les extensions peuvent être visualisées.

Licences immédiates : les clés de licence enregistrées sont envoyées dès réception du paiement.

Toutes les licences sont perpétuelles et s'appliquent au développement, à la mise en place et à la production.

La Licence Lite :

1 développeur
1 emplacement
1 projet
Licence perpétuelle
Cette formule permet à un seul développeur de logiciels au sein d'une organisation d'utiliser Iron Software en un seul endroit. Iron Software peut être utilisé dans une seule application web, une application intranet ou un logiciel de bureau. Les licences ne sont pas transférables et ne peuvent être partagées en dehors d'une organisation ou d'une relation agence/client. Ce type de licence, comme tous les autres types de licence, exclut expressément tous les droits qui ne sont pas expressément accordés dans le cadre de l'accord, sans redistribution OEM et en utilisant le Iron Software en tant que SaaS sans acheter de couverture supplémentaire.
Tarification : À partir de $749 par an.
La Licence Professionnelle :
10 développeurs
10 emplacements
10 projets
Licence perpétuelle
Cette formule permet à un nombre prédéterminé de développeurs de logiciels d'une organisation d'utiliser Iron Software sur un seul site, jusqu'à un maximum de dix. Le Iron Software peut être utilisé dans autant de sites web, d'applications intranet ou de logiciels de bureau que vous le souhaitez. Les licences ne sont pas transférables et ne peuvent être partagées en dehors d'une organisation ou d'une relation agence/client. Ce type de licence, comme tous les autres types de licence, exclut expressément tous les droits qui ne sont pas expressément accordés dans le cadre de l'accord, y compris la redistribution OEM et l'utilisation du logiciel Iron Software en tant que SaaS sans achat d'une couverture supplémentaire. Cette licence peut être intégrée à un seul projet jusqu'à un maximum de 10.
Tarification : À partir de 999 $ par an.
La Licence Illimitée :
Nombre illimité de développeurs
Nombre illimité de lieux
Projets illimités
Licence perpétuelle
Cela permet à un nombre illimité de développeurs de logiciels d'une organisation d'utiliser Iron Software dans un nombre illimité de sites. Le Iron Software peut être utilisé dans autant de sites web, d'applications intranet ou de logiciels de bureau que vous le souhaitez. Les licences ne sont pas transférables et ne peuvent être partagées en dehors d'une organisation ou d'une relation agence/client. Ce type de licence, comme tous les autres types de licence, exclut expressément tous les droits qui ne sont pas expressément accordés dans le cadre de l'accord, y compris la redistribution OEM et l'utilisation du logiciel Iron Software en tant que SaaS sans achat d'une couverture supplémentaire.
Tarification : À partir de 2999 $ par an.
Redistribution sans redevance : Cela vous permet de distribuer l'Iron Software dans le cadre de plusieurs produits commerciaux emballés différemment (sans avoir à payer de redevances) en fonction du nombre de projets couverts par la licence de base. Elle permet de déployer Iron Software dans le cadre de services logiciels SaaS, en fonction du nombre de projets couverts par la licence de base.
Tarification : À partir de 1599 $ par an.

Modèles de licence et prix d'Asprise OCR

La Licence Lite :

Nombre illimité d'utilisateurs finaux
Reconnaître un texte
Lecture des codes-barres 1D : UPC, EAN, Code39, Code128
Texte, XML et PDF
Déploiement facile
Prise en charge de 2 systèmes d'exploitation seulement
Sièges 1
Soutien : Non
Tarification : Commence à partir de $7498 par an.
La Licence Standard :
Nombre illimité d'utilisateurs finaux
Entrée BMP, GIF, PNG, JPEG, TIFF et PDF.
Reconnaître un texte
Lecture des codes-barres 1D : UPC, EAN, Code39, Code128
Lire certains 2D : QR et Data Matrix uniquement
Sortie texte, XML et PDF
Déploiement facile
Soutien : Non
Tarification : À partir de 7998 $ par an.
La licence Enterprise :
Nombre illimité d'utilisateurs finaux
Entrée BMP, GIF, PNG, JPEG, TIFF et PDF.
Reconnaître un texte
Lecture des codes-barres 1D : UPC, EAN, Code39, Code128
2D : QR, PDF 417, Data Matrix et Aztec
Sortie texte, XML et PDF
Déploiement facile
Multi-threading, multi-processing
Tarification : À partir de 12 998 $.
L'IronOCR Lite comprenant un package pour un développeur avec un an de support coûte environ $749, tandis que Asprise Lite comprenant un package pour un développeur coûte $7498 sans support technique, et 6296 $ avec support technique payant. La licence Professional d'IronOCR incluant un forfait pour 10 développeurs avec un an de support technique coûte 999 $, tandis que la licence équivalente d'Asprise incluant un forfait pour 10 développeurs coûte 37 998 $ par an sans support technique, mais avec des versions et mises à jour techniques payantes, plus un an de support, coûte 46 999,00 $.

Les packages IronOCR Lite et Professional proposent un service SaaS ou OEM et une option de support de 5 ans. La version Lite, comprenant un package développeur avec un support de 5 ans et un service SaaS et OEM, coûte 2897 USD, tandis qu'Asprise propose un service SaaS ou OEM et une option de support personnalisé. La version Professional d'IronOCR comprend un package pour 10 développeurs avec un an de support payant et le service Saas et OEM coûte 3397 $, tandis que la version Asprise avec un package pour 10 développeurs sans support d'un an et avec le service SaaS et OEM coûte 59 996,00 $.

8.0 Conclusion

IronOCR for .NET Framework fournit un Tesseract simple et facile à utiliser. Il prend en charge les photos et les documents PDF de différentes manières. Il fournit également un certain nombre de paramètres permettant d'améliorer les performances de la bibliothèque OCR de Tesseract. Plusieurs langues sont prises en charge, ainsi que de nombreuses langues en une seule opération. Pour en savoir plus sur le Tesseract OCR, visitez leur site web.

Asprise est un logiciel qui utilise un moteur d'intelligence artificielle pour reconnaître des images et des documents PDF. Il propose également divers paramètres permettant d'améliorer les performances du processus d'OCR. En outre, il offre la possibilité de sélectionner plusieurs langues. Asprise a quelques limitations sur l'utilisation des conversions de pages. Le prix varie également en fonction du système d'exploitation.

Les packages IronOCR offrent une meilleure licence et support par rapport à Asprise. Asprise OCR propose des packages personnalisés et fixes qui sont plus coûteux. IronOCR commence à partir de $749, tandis que Asprise OCR commence à partir de $7494 par an, donc notre produit est plus rentable tout en offrant plus de fonctionnalités qu'Aspire. Il prend également en charge plusieurs plateformes à un prix unique.

Alors, qu'attendez-vous ? L'essai gratuit est ouvert à tous. Vous pouvez obtenir la [licence](/csharp/ocr/licensing/" target="_blank) ici et commencer immédiatement.

Kannapat Udonpant

Discutez avec l'équipe d'ingénierie maintenant

Ingénieur logiciel

Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Tout en poursuivant ses études, Kannapat est également devenu membre du Vehicle Robotics Laboratory, qui fait partie du Department of Bioproduction Engineering (département d'ingénierie de la bioproduction). En 2022, il a mis à profit ses compétences en C# pour rejoindre l'équipe d'ingénieurs d'Iron Software, où il se concentre sur IronPDF. Kannapat apprécie son travail car il apprend directement auprès du développeur qui écrit la majeure partie du code utilisé dans IronPDF. Outre l'apprentissage par les pairs, Kannapat apprécie l'aspect social du travail chez Iron Software. Lorsqu'il n'écrit pas de code ou de documentation, Kannapat peut généralement être trouvé en train de jouer sur sa PS5 ou de revoir The Last of Us.

< PRÉCÉDENT
Comparaison entre IronOCR et Leadtools OCR