Passer au contenu du pied de page
COMPARER à D'AUTRES COMPOSANTS

Une comparaison entre IronOCR et Abbyy Finereader

Dans cet article, nous allons comparer deux des bibliothèques et applications courantes pour utiliser OCR pour les documents PDF et les images. Ceux-ci sont :

  • ABBYY FineReader PDF Software
  • IronOCR

1. Introduction

1.1 ABBYY FineReader PDF — Introduction et Fonctionnalités

ABBYY FineReader PDF est une application de reconnaissance optique de caractères (OCR) créée par ABBYY. Il nous permet de convertir des documents image (photos, scans, fichiers PDF), et des captures d'écran en formats de fichier éditables tels que Microsoft Word, Microsoft Excel, Microsoft PowerPoint, Rich Text Format, HTML, PDF/A, PDF consultable, CSV, et texte (texte brut).

ABBYY FineReader est une application de bureau disponible pour Windows, Linux et macOS. Il permet également la création de formats éditables pour les fichiers pdf. Nous pouvons également lire les PDF tout comme nous pouvons le faire avec Adobe Acrobat. ABBYY FineReader intègre des documents scannés dans des flux de travail numériques.

Gérez et complétez des documents de manière simple et efficace pour gagner du temps et des efforts. Travailler avec n'importe quel document de la même manière méthodique, qu'il ait été créé numériquement ou converti à partir de papier. Vous pouvez modifier le texte, les tableaux et la mise en page complète de votre PDF sans avoir besoin de le convertir d'abord.

ABBYY FineReader PDF peut créer des PDF à partir de plus de 25 formats de fichiers différents, directement à partir de documents papier ou en imprimant sur une imprimante PDF depuis pratiquement n'importe quelle application. PDF/A-1 à PDF/A-3 sont pris en charge pour l'archivage à long terme, et PDF/UA garantit que le contenu est accessible lors de l'utilisation de logiciels d'assistance tels que les lecteurs d'écran. Il permet également aux professionnels de maximiser l'efficacité sur le lieu de travail numérique.

Créer et mettre à jour vos propres formulaires PDF interactifs en utilisant ABBYY FineReader pour recueillir des informations avec succès et standardiser les documents. Créer des formulaires en combinant des champs interactifs de divers types, en définissant des actions, en modifiant des formulaires PDF existants, ou en ajoutant des éléments de formulaire à un PDF conventionnel.

ABBYY FineReader peut convertir instantanément des documents papier, des scans, et des PDF scannés en PDF consultables, vous permettant de récupérer des documents des archives numériques et d'accéder aux informations qu'ils contiennent. FineReader PDF prend en charge tous les niveaux de conformité et variantes du format PDF/A, la norme de l'industrie pour l'archivage à long terme, de PDF/A-1 à PDF/A-3.

La dernière technologie OCR basée sur l'IA d'ABBYY, FineReader PDF, facilite la numérisation, la récupération, l'édition, la protection, le partage et la collaboration sur toutes sortes de documents dans le même flux de travail. FineReader inclut également la comparaison de documents, ce qui nous aide à comparer les documents originaux, ainsi que les PDF convertis et les fichiers image.

1.2 IronOCR — Introduction et Fonctionnalités

IronOCR fournit un logiciel pour les ingénieurs qui utilisent IronOCR pour .NET pour lire le contenu textuel des photos et PDF dans les applications .NET et les sites Web. Il scanne les photos pour du texte et des codes-barres, et prend en charge de nombreuses langues dans le monde entier ; il peut ensuite fournir une sortie soit en texte brut, soit en données structurées. La bibliothèque OCR d'Iron Software peut être utilisée dans des applications .NET MVC, Web, console et de bureau. Pour les déploiements commerciaux, une licence est fournie avec l'assistance directe de l'équipe de développement.

  • Utilisant le dernier moteur Tesseract 5, IronOCR lit le texte, les codes-barres, et les QR codes à partir de n'importe quelle image ou format PDF. Cette bibliothèque ajoute rapidement de l'OCR aux applications de bureau, console, et web.
  • IronOCR prend en charge 125 langues internationales. Il prend également en charge des listes de langues et de mots personnalisés.
  • IronOCR est capable de lire plus de 20 formats de codes-barres et QR codes.
  • IronOCR prend en charge les formats d'image GIF et TIFF multipages.
  • IronOCR fournit une correction pour les images scannées de faible qualité.
  • IronOCR prend en charge le multithreading — il exécute un ou plusieurs processus à la fois.
  • IronOCR peut fournir une sortie de données structurées pour les pages, paragraphes, lignes, mots, caractères, etc.
  • IronOCR prend en charge une variété de systèmes d'exploitation tels que Windows, Linux, macOS, etc.

2. Créer un nouveau projet dans Visual Studio

Ouvrez le logiciel Visual Studio et allez dans le 'menu fichier'. Sélectionnez 'nouveau projet', puis sélectionnez 'Application console'.

Abbyy Finereader Ocr Alternatives 1 related to 2. Créer un nouveau projet dans Visual Studio

Entrez le nom du projet et sélectionnez le chemin du fichier dans la zone de texte appropriée. Ensuite, cliquez sur le bouton créer et sélectionnez le .NET Framework requis, comme dans la capture d'écran ci-dessous.

Abbyy Finereader Ocr Alternatives 2 related to 2. Créer un nouveau projet dans Visual Studio

Le projet Visual Studio générera maintenant la structure pour l'application sélectionnée. Si vous avez sélectionné l'application console, Windows et web, il ouvrira maintenant le fichier Program.cs où vous pourrez entrer le code et construire/exécuter l'application.

Abbyy Finereader Ocr Alternatives 3 related to 2. Créer un nouveau projet dans Visual Studio

Ensuite, nous pouvons ajouter la bibliothèque pour tester le code.

3. Installer

3.1 Installer ABBYY FineReader PDF

Nous pouvons télécharger ABBYY FineReader ici.

Abbyy Finereader Ocr Alternatives 4 related to 3.1 Installer ABBYY FineReader PDF

L'image ci-dessus montre qu'il existe deux versions, Individuelle et Professionnelle, que vous pouvez télécharger selon vos besoins. Sélectionnez l'option "télécharger l'essai gratuit". Cela vous redirigera vers un formulaire comme dans l'image ci-dessous :

Abbyy Finereader Ocr Alternatives 5 related to 3.1 Installer ABBYY FineReader PDF

Nous devrons remplir le formulaire pour obtenir l'emplacement du fichier EXE. Cliquez sur l'option de téléchargement pour télécharger le fichier.

Une fois le téléchargement du fichier terminé, nous pouvons double-cliquer sur le fichier EXE pour démarrer l'installation. Une fois terminé, un message popup s'affichera, et il est maintenant prêt à être utilisé.

3.2 Installer IronOCR

La bibliothèque IronOCR peut être téléchargée et installée de quatre manières.

Ceux-ci sont :

  • Utilisation de Visual Studio
  • Utilisation de la ligne de commande Visual Studio
  • Téléchargement direct depuis le site NuGet
  • Téléchargement direct depuis le site IronPDF

3.2.1 Utilisation de Visual Studio

Le logiciel Visual Studio offre l'option Gestionnaire de packages NuGet pour installer le package directement dans la solution. La capture d'écran ci-dessous montre comment ouvrir le Gestionnaire de Paquets NuGet.

Abbyy Finereader Ocr Alternatives 6 related to 3.2.1 Utilisation de Visual Studio

Il fournit une boîte de recherche pour afficher la liste des packages du site NuGet. Dans le gestionnaire de packages, nous devons rechercher le mot-clé IronOCR, comme dans la capture d'écran ci-dessous :

Abbyy Finereader Ocr Alternatives 7 related to 3.2.1 Utilisation de Visual Studio

À partir de l'image ci-dessus, nous obtiendrons la liste des éléments de recherche relatifs. Nous devons sélectionner l'option requise pour installer le paquet dans la solution.

3.2.2 Utilisation de la ligne de commande de Visual Studio

Dans Visual Studio, allez dans Outils -> Gestionnaire de packages NuGet -> Console du gestionnaire de paquets

Entrez la ligne suivante dans l'onglet Console du gestionnaire de packages :

Install-Package IronOcr

Cette commande téléchargera et installera le package dans le projet actuel, et il sera prêt à être utilisé.

3.2.3 Téléchargement direct depuis le site NuGet

La troisième façon est de télécharger directement le package NuGet depuis le site Web.

  • Navigate to the Link.
  • Sélectionnez l'option de téléchargement de paquet dans le menu à droite.
  • Double-cliquez sur le paquet téléchargé. Il s'installera automatiquement.
  • Ensuite, rechargez la solution et commencez à l'utiliser dans le projet.

3.2.4 Téléchargement direct depuis le site IronOCR

Click the link here to download the latest package direct from the website. Once downloaded, follow the steps below to add the package to the project.

  • Clic-droit sur le projet dans la fenêtre de solution.
  • Ensuite, sélectionnez l'option 'Ajouter une référence' et parcourez l'emplacement de la référence téléchargée.
  • Ensuite, cliquez sur OK pour ajouter la référence.

4. Image OCR

IronOCR et ABBYY FineReader ont la technologie OCR qui convertira l'image en texte.

4.1 Utilisation de ABBYY FineReader PDF

Ensuite, ouvrez l'application ABBYY FineReader PDF qui s'ouvrira avec plusieurs options, comme dans l'image ci-dessous.

Abbyy Finereader Ocr Alternatives 8 related to 4.1 Utilisation de ABBYY FineReader PDF

Ensuite, sélectionnez l'option 'Ouvrir' parmi les options de l'éditeur OCR. Cela propose une option pour sélectionner des fichiers image :

Abbyy Finereader Ocr Alternatives 9 related to 4.1 Utilisation de ABBYY FineReader PDF

Après avoir sélectionné un fichier, il commencera automatiquement à scanner l'image en texte éditable, puis affichera le résultat dans la fenêtre comme dans la capture d'écran ci-dessous :

Abbyy Finereader Ocr Alternatives 10 related to 4.1 Utilisation de ABBYY FineReader PDF

L'image ci-dessus montre l'image source convertie en texte éditable. Cependant, le résultat n'est pas très précis. Certains des nombres ne sont pas reconnus par l'application ABBYY FineReader PDF. Cela est clairement montré dans les fenêtres de comparaison — sur le côté gauche se trouve l'image source, et sur le côté droit se trouve le texte OCR converti.

4.2 Utilisation de IronOCR

// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();

// Configure OCR language and Tesseract version
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

// Create a new OcrInput object to manage input images
using (var Input = new OcrInput())
{
    // Add an image to the input for processing
    Input.AddImage(@"3.png");

    // Perform OCR to read text from the image
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();

// Configure OCR language and Tesseract version
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

// Create a new OcrInput object to manage input images
using (var Input = new OcrInput())
{
    // Add an image to the input for processing
    Input.AddImage(@"3.png");

    // Perform OCR to read text from the image
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
' Create an instance of IronTesseract for OCR operations
Dim Ocr = New IronTesseract()

' Configure OCR language and Tesseract version
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5

' Create a new OcrInput object to manage input images
Using Input = New OcrInput()
	' Add an image to the input for processing
	Input.AddImage("3.png")

	' Perform OCR to read text from the image
	Dim Result = Ocr.Read(Input)

	' Output the extracted text to the console
	Console.WriteLine(Result.Text)
	Console.ReadKey()
End Using
$vbLabelText   $csharpLabel

L'API Tesseract 5, qui nous permet de convertir des fichiers image en texte, est démontrée ci-dessus. Nous créons une instance de IronTesseract dans l'extrait de code ci-dessus. Nous utilisons également un objet OcrInput qui nous permettra d'ajouter un ou plusieurs fichiers image. Nous devons fournir le chemin de l'image disponible dans le code lors de l'utilisation de la méthode de l'objet OcrInput AddImage. N'importe quel nombre d'images peut être ajouté. La fonction Read dans l'objet IronTesseract que nous avons construit précédemment peut être utilisée pour exécuter l'OCR en analysant le fichier image et en extrayant le résultat dans le résultat OCR. Il est capable d'extraire du texte des images et de le convertir en chaîne de caractères.

Nous pouvons également utiliser Tesseract pour ajouter des images mutli-frame. AddMultiFrameTiff est une méthode différente pour cette opération. La bibliothèque Tesseract lit chaque frame dans l'image, et chaque frame est traitée comme une page distincte. Le processus lira la première frame de l'image puis passera à la frame suivante, et ainsi de suite, jusqu'à ce que toutes les frames de l'image aient été scannées. Seul le format d'image TIFF est pris en charge par cette méthode.

Abbyy Finereader Ocr Alternatives 11 related to 4.2 Utilisation de IronOCR

L'image ci-dessus est le résultat de IronOCR, qui est précis et montre les données correctement converties en texte éditable.

5. Fichier PDF OCR

IronOCR et ABBYY FineReader PDF aident à convertir un fichier PDF en texte éditable. ABBYY FineReader PDF fournit une liste d'options à l'utilisateur telles que sauvegarder la page, éditer l'image, reconnaître la page, etc. Il fournit également des options de sauvegarde telles que txt, document, format HTML, etc. IronOCR nous permet également de sauvegarder les fichiers OCR convertis en HTML, txt, pdf, etc.

Ouvrez ABBYY FineReader PDF.

Ouvrez le logiciel ABBYY FineReader PDF. Cela ouvrira une page comme dans l'image ci-dessous, offrant de multiples options.

Abbyy Finereader Ocr Alternatives 12 related to 5. Fichier PDF OCR

Ensuite, sélectionnez l'option 'Ouvrir' parmi les options de l'éditeur OCR. Cela propose une option pour sélectionner l'image/PDF. Nous pouvons sélectionner soit un PDF, soit une image, soit les deux fichiers.

Abbyy Finereader Ocr Alternatives 13 related to 5. Fichier PDF OCR

Après avoir sélectionné le fichier, cliquez sur le bouton OK. Il commencera automatiquement à scanner l'image en texte éditable et montrera le résultat dans une fenêtre comme la capture d'écran ci-dessous.

Abbyy Finereader Ocr Alternatives 14 related to 5. Fichier PDF OCR

L'image ci-dessus montre le PDF source converti en texte éditable. Cependant, le résultat n'est pas complètement précis. Certains des chiffres ne sont pas reconnus par l'application ABBYY FineReader PDF. Cela est clairement montré dans les fenêtres de comparaison — sur le côté gauche se trouve le PDF source, et sur le côté droit se trouve le texte OCR converti.

5.2 Utilisation de IronOCR

Nous pouvons également utiliser OCRInput pour gérer les fichiers PDF. Chaque page des documents sera lue par la classe Iron Tesseract. Le texte sera ensuite extrait des pages. Nous pouvons également ouvrir des documents protégés en utilisant une deuxième fonction appelée AddPdf, qui nous permet d'ajouter des PDF à notre liste de documents (mot de passe si protégé). Le code suivant montre comment ouvrir un document PDF protégé par mot de passe :

// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();

// Create OcrInput to manage input PDFs
using (var Input = new OcrInput())
{
    // Add a password-protected PDF to the input
    Input.AddPdf("example.pdf", "password");

    // Perform OCR to read text from the PDF
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();

// Create OcrInput to manage input PDFs
using (var Input = new OcrInput())
{
    // Add a password-protected PDF to the input
    Input.AddPdf("example.pdf", "password");

    // Perform OCR to read text from the PDF
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
' Create an instance of IronTesseract for OCR operations
Dim Ocr = New IronTesseract()

' Create OcrInput to manage input PDFs
Using Input = New OcrInput()
	' Add a password-protected PDF to the input
	Input.AddPdf("example.pdf", "password")

	' Perform OCR to read text from the PDF
	Dim Result = Ocr.Read(Input)

	' Output the extracted text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

Les méthodes suivantes sont également fournies par Iron Tesseract :

  • AddPdfPage
  • AddPdfPages

Nous pouvons lire et extraire du contenu d'une seule page dans un document PDF en utilisant AddPdfPage. Seul le numéro de page à partir de laquelle nous souhaitons extraire le texte doit être spécifié. AddPdfPages nous permet d'extraire du texte à partir de plusieurs pages que nous spécifions. Dans IEnumerable<int>, nous devons simplement spécifier le nombre de pages. Nous devons également inclure l'emplacement du fichier ainsi que l'extension du fichier. Cela est démontré dans l'exemple de code suivant :

// Define numbers representing pages to extract from the PDF
IEnumerable<int> numbers = new List<int> { 2, 8, 10 };

// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();

// Create OcrInput to manage input PDFs
using (var Input = new OcrInput())
{
    // Add a specific page from PDF for OCR
    // Input.AddPdfPage("example.pdf", 10);

    // Add multiple specific pages from PDF for OCR
    // Input.AddPdfPages("example.pdf", numbers);

    // Perform OCR to read text from the specified pages
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);

    // Save the extracted text to a file
    Result.SaveAsTextFile("ocrtext.txt");
}
// Define numbers representing pages to extract from the PDF
IEnumerable<int> numbers = new List<int> { 2, 8, 10 };

// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();

// Create OcrInput to manage input PDFs
using (var Input = new OcrInput())
{
    // Add a specific page from PDF for OCR
    // Input.AddPdfPage("example.pdf", 10);

    // Add multiple specific pages from PDF for OCR
    // Input.AddPdfPages("example.pdf", numbers);

    // Perform OCR to read text from the specified pages
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);

    // Save the extracted text to a file
    Result.SaveAsTextFile("ocrtext.txt");
}
' Define numbers representing pages to extract from the PDF
Dim numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}

' Create an instance of IronTesseract for OCR operations
Dim Ocr = New IronTesseract()

' Create OcrInput to manage input PDFs
Using Input = New OcrInput()
	' Add a specific page from PDF for OCR
	' Input.AddPdfPage("example.pdf", 10);

	' Add multiple specific pages from PDF for OCR
	' Input.AddPdfPages("example.pdf", numbers);

	' Perform OCR to read text from the specified pages
	Dim Result = Ocr.Read(Input)

	' Output the extracted text to the console
	Console.WriteLine(Result.Text)

	' Save the extracted text to a file
	Result.SaveAsTextFile("ocrtext.txt")
End Using
$vbLabelText   $csharpLabel

En utilisant la fonction SaveAsTextFile, nous pouvons stocker le résultat comme fichier texte, nous permettant de télécharger le fichier dans le chemin du répertoire de sortie. Aussi, nous pouvons sauvegarder le fichier comme un fichier HTML en utilisant SaveAsHocrFile.

6. Autres Fonctionnalités

6.1 Utilisation d'ABBYY FineReader PDF

FineReader a des options supplémentaires telles que : Zone de texte, Zone d'image, Zone de table, Zone de reconnaissance, etc. Ceux-ci aident l'utilisateur à améliorer les performances de l'OCR. De plus, en plus de réaliser de l'OCR, l'application permet également aux utilisateurs d'effectuer des opérations telles que combiner des PDF, diviser des PDF, éditer des PDF, etc.

6.2 Utilisation de IronOCR

IronOCR a des fonctionnalités uniques qui nous permettent de lire les codes-barres et QR codes à partir de documents scannés. Le code ci-dessous montre comment nous pouvons lire des codes-barres à partir d'une image ou document donné.

// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();

// Configure OCR language and barcode reading
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

// Create OcrInput to manage input images
using (var Input = new OcrInput())
{
    // Add an image containing barcodes
    Input.AddImage("barcode.gif");

    // Perform OCR to read text and barcodes from the image
    var Result = Ocr.Read(Input);

    // Iterate through detected barcodes and output their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();

// Configure OCR language and barcode reading
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

// Create OcrInput to manage input images
using (var Input = new OcrInput())
{
    // Add an image containing barcodes
    Input.AddImage("barcode.gif");

    // Perform OCR to read text and barcodes from the image
    var Result = Ocr.Read(Input);

    // Iterate through detected barcodes and output their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
' Create an instance of IronTesseract for OCR operations
Dim Ocr = New IronTesseract()

' Configure OCR language and barcode reading
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5

' Create OcrInput to manage input images
Using Input = New OcrInput()
	' Add an image containing barcodes
	Input.AddImage("barcode.gif")

	' Perform OCR to read text and barcodes from the image
	Dim Result = Ocr.Read(Input)

	' Iterate through detected barcodes and output their values
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
$vbLabelText   $csharpLabel

Le code ci-dessus aide à lire des codes-barres à partir d'une image ou d'un document PDF donné. Il est capable de lire plus d'un code-barres d'une page/image. Pour lire le code-barres, IronOCR a un paramètre unique Ocr.Configuration.ReadBarCodes qui aide à lire le code-barres ; la valeur par défaut est false.

Après avoir lu l'entrée, les données seront enregistrées dans l'objet appelé OCRResult ; cela a une propriété appelée Barcodes qui regroupe toutes les données de code-barres disponibles dans une liste. En utilisant la boucle foreach, nous pouvons obtenir tous les détails des codes-barres un par un. De plus, il scannera le code-barres et lira la valeur du code-barres — deux opérations réalisées en un seul processus !

Par ailleurs, les options de threading sont également prises en charge, ce qui signifie que nous pouvons effectuer plusieurs processus OCR en même temps. IronOCR est également capable de reconnaître une zone spécifique d'une région spécifiée.

// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();

// Create OcrInput to manage input images
using (var Input = new OcrInput())
{
    // Define a specific rectangular area on the image for OCR
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };

    // Add an image specifying the area to be processed
    Input.Add("document.png", ContentArea);

    // Perform OCR to read text from the specified area
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract();

// Create OcrInput to manage input images
using (var Input = new OcrInput())
{
    // Define a specific rectangular area on the image for OCR
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };

    // Add an image specifying the area to be processed
    Input.Add("document.png", ContentArea);

    // Perform OCR to read text from the specified area
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
' Create an instance of IronTesseract for OCR operations
Dim Ocr = New IronTesseract()

' Create OcrInput to manage input images
Using Input = New OcrInput()
	' Define a specific rectangular area on the image for OCR
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}

	' Add an image specifying the area to be processed
	Input.Add("document.png", ContentArea)

	' Perform OCR to read text from the specified area
	Dim Result = Ocr.Read(Input)

	' Output the extracted text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

Ce qui précède est un code d'exemple pour effectuer l'OCR sur une région spécifique. Nous avons seulement besoin de spécifier la région rectangulaire sur l'image ou le PDF — le moteur Tesseract dans IronOCR permet la reconnaissance du texte.

7. Conclusion

Lors de l'utilisation de IronOCR dans le contexte .NET Framework, Tesseract est simple et facile à utiliser. Il prend en charge des photos et des documents PDF de différentes manières. Il fournit également un certain nombre de paramètres pour améliorer les performances de la bibliothèque Tesseract OCR. Différentes langues sont prises en charge, ainsi que de nombreuses langues dans une seule opération. Pour en savoir plus sur Tesseract OCR, visitez leur site Web.

ABBYY FineReader PDF est une application logicielle qui utilise un moteur d'intelligence artificielle pour reconnaître un document image/PDF. Il fournit également divers paramètres pour améliorer les performances du processus OCR. De plus, il offre la possibilité de sélectionner plusieurs langues. ABBYY FineReader PDF a certaines limitations sur l'utilisation des conversions de page. Il existe différents prix pour différents systèmes d'exploitation. To know more about the ABBYY FineReader PDF price details, click here.

Lors de nos tests, IronOCR a démontré une performance plus forte par rapport à ABBYY FineReader PDF. Dans les tests spécifiques présentés dans cette comparaison, certains caractères et chiffres dans des images de faible qualité n'ont pas été reconnus aussi précisément par FineReader, tandis qu'IronOCR a fourni des résultats plus précis pour ces scénarios particuliers. IronOCR offre également la capacité supplémentaire de reconnaître les données de code-barres et de lire les valeurs des codes-barres à partir des images. Le package IronOCR offre une licence à vie, et il n'y a pas de coûts supplémentaires. The IronOCR package supports multiple platforms at a single price. To know more about IronOCR price details, click here.

Veuillez noterABBYY FineReader PDF Software est une marque déposée de son propriétaire respectif. Ce site n'est pas affilié à, approuvé par, ou sponsorisé par ABBYY FineReader PDF Software. Tous les noms de produits, logos et marques sont la propriété de leurs propriétaires respectifs. Les comparaisons sont faites à titre d'information uniquement et reflètent les informations publiquement disponibles au moment de la rédaction.

Questions Fréquemment Posées

Qu'est-ce qui rend IronOCR une alternative supérieure à ABBYY FineReader?

IronOCR est considéré supérieur grâce à sa performance OCR précise, sa capacité à traiter des images de mauvaise qualité, et ses fonctionnalités complètes telles que la lecture de codes-barres et de codes QR. Il offre également une licence à vie sans coûts récurrents, le rendant rentable.

Comment IronOCR gère-t-il les images de mauvaise qualité?

IronOCR offre des fonctionnalités avancées de correction d'image qui améliorent la qualité des images scannées de basse résolution ou de mauvaise qualité, améliorant ainsi la précision des résultats OCR.

Quelles plateformes sont supportées par IronOCR?

IronOCR supporte plusieurs plateformes, y compris Windows, Linux et macOS, avec une licence à vie unique.

IronOCR peut-il effectuer l'OCR sur des codes-barres?

Oui, IronOCR peut lire les codes-barres à partir des images en configurant la bibliothèque pour détecter et extraire les valeurs de code-barres en utilisant ses capacités d'OCR.

Quels sont les avantages d'utiliser la fonctionnalité multithreading d'IronOCR?

La fonctionnalité multithreading dans IronOCR permet à plusieurs processus OCR de s'exécuter simultanément, améliorant considérablement la performance et la vitesse de traitement.

Quelles langues sont supportées par IronOCR?

IronOCR supporte l'OCR dans 125 langues différentes, en faisant un outil polyvalent pour des applications mondiales.

Comment la licence d'IronOCR se compare-t-elle à celle d'ABBYY FineReader?

IronOCR offre une licence à vie sans coûts récurrents, tandis que le prix d'ABBYY FineReader peut varier selon le système d'exploitation et peut impliquer des frais récurrents.

Comment puis-je intégrer IronOCR dans mon projet C#?

Vous pouvez intégrer IronOCR dans votre projet C# en utilisant Visual Studio, la ligne de commande de Visual Studio, ou en le téléchargeant depuis le site NuGet.

Quels formats de fichiers peuvent être convertis avec IronOCR?

IronOCR peut convertir des images et des PDF en différents formats éditables, y compris Microsoft Word, Excel, et des PDF recherchables.

Pourquoi IronOCR est-il préféré pour lire les codes QR?

IronOCR est préféré pour lire les codes QR en raison de sa haute précision et de son ensemble de fonctionnalités robustes, qui inclut la capacité à traiter une large gamme de formats et de niveaux de qualité d'images.

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Pendant qu'il poursuivait son diplôme, Kannapat est également devenu membre du laboratoire de robotique de véhicules, qui fait partie du département de bioproduction. En 2022, il a utilisé ses compé...
Lire la suite