Si vous cherchez des informations sur l'OCR, vous êtes au bon endroit. Ce blog traite de l'OCR et des logiciels associés, et examine comment ils fonctionnent lorsqu'ils sont appliqués à des tâches liées à l'OCR. Commençons par la question : qu'est-ce que l'OCR ?
Reconnaissance optique des caractères(OCR) utilise un scanner optique et un logiciel spécialisé pour identifier et coder numériquement un texte écrit ou imprimé. Un ordinateur peut lire des photographies statiques de texte et les transformer en données modifiables et consultables à l'aide d'un logiciel OCR.
L'OCR se compose généralement de trois étapes : l'ouverture et la numérisation d'un document dans un logiciel d'OCR, la reconnaissance du document dans le logiciel d'OCR et le stockage du document produit par l'OCR dans le format de votre choix.
Aujourd'hui, nous abordons deux logiciels d'OCR et comparons leurs avantages et inconvénients, ainsi que la manière d'intégrer et d'exporter leur SDK en C#. Les logiciels en question sont les suivants :
LeadTools OCR
IronOCR
1. LeadTools OCR
LEADTOOLS OCR fait partie de la gamme primée de boîtes à outils de développement développées et publiées par LEAD Technologies Inc. LEADTOOLS est une collection de boîtes à outils complètes permettant d'intégrer des images matricielles, documentaires, médicales, multimédias et vectorielles dans des applications pour ordinateurs de bureau, serveurs, tablettes et téléphones portables. Formats de fichiers(150+)lEADTOOLS prend en charge la compression d'images, le traitement d'images, la conversion des couleurs, le traitement des couleurs, l'affichage d'images, les effets spéciaux, la numérisation/capture, les dialogues communs, l'impression, DICOM, PACS, OCR, les codes-barres, la reconnaissance de formulaires, PDF, le nettoyage de documents, les annotations et bien d'autres choses encore. Des millions de lignes de code sont pratiquement au bout des doigts des développeurs d'applications utilisant une boîte à outils LEADTOOLS. LEADTOOLS est un ensemble d'outils conçus pour vous fournir la technologie d'image la plus puissante disponible, quels que soient vos besoins de programmation.
LEADTOOLS est un ensemble complet d'outils permettant d'intégrer des technologies de reconnaissance, de documentation, médicales, d'imagerie et multimédias dans les ordinateurs de bureau, les serveurs, les tablettes et les systèmes mobiles, grâce à des algorithmes uniques d'intelligence artificielle et d'apprentissage automatique. Pour améliorer vos applications, pourquoi ne pas tirer parti de plus de 30 ans de connaissances en matière de développement d'images et de la prise en charge de plus de 150 types de fichiers.
La bibliothèque de classes OCR de LEADTOOLS fournit un logiciel de programmation pour l'incorporation rapide et efficace de la reconnaissance optique de caractères de documents(OCR) dans des programmes logiciels. Les programmeurs peuvent effectuer la reconnaissance de caractères sur des images de documents, et produire le texte reconnu dans plus de 20 formats de fichiers en utilisant la bibliothèque de classes OCR de LEADTOOLS.
1.1. Caractéristiques de LeadTools OCR
La boîte à outils Lead offre une gamme primée de technologies multimédias pour les utilisateurs finaux et les développeurs, et est capable d'exécuter tous les types de fonctions OCR pour satisfaire son large éventail de clients.
1.1.1. Multi-thread
Le moteur technologique Lead permet à l'utilisateur final de prendre en charge les opérations d'OCR multithread et basées sur le serveur.
1.1.2. Documents OCR multiples
Le SDK LeadTools Document permet aux utilisateurs de créer plusieurs documents OCR dans leur application. Chaque document contient sa propre liste de pages.
1.1.3. Les langues.
La gamme de technologies primées LeadTools offre des services dans plus de 40 langues différentes et vous permet de choisir la langue que vous souhaitez utiliser lors de la reconnaissance des pages OCR.
1.1.4. Dictionnaires
LeadTools OCR est une application de scanner de documents géniale qui permet à l'utilisateur final d'accéder aux dictionnaires pour toutes les langues prises en charge. En outre, les utilisateurs peuvent accéder à plusieurs dictionnaires dans un même document.
1.1.5. Système de gestion des documents
Reconnaître une variété de documents, y compris des fac-similés, des photocopies et des documents à la mise en page complexe.
1.1.6. Reconnaissance des caractères
Avec une précision et une rapidité accrues, l'application LEADTOOLS OCR peut effectuer la reconnaissance optique de caractères(OCR) sur des images, extraire du texte de photos et convertir des images en plusieurs formats de documents. Pour modifier et partager du texte à partir d'une image, utilisez l'OCR pour l'extraire, puis copiez-le.
1.1.7. Intelligence artificielle
Lead Technologies utilise l'IA pour améliorer la reconnaissance des documents de même type - une excellente nouvelle pour l'utilisateur final.
1.1.8. Reconnaissance des zones
Le SDK Leadtools Document, issu de la gamme primée de kits d'outils OCR, utilise un puissant logiciel de reconnaissance de zones qui permet d'atteindre un tout nouveau niveau de reconnaissance de zones.
Les pages du document peuvent être affichées avec ou sans leurs zones.
Les zones peuvent être importées à partir de fichiers et exportées vers ceux-ci.
Reconnaître une page comme une zone unique.
Dans chaque page, spécifiez et identifiez manuellement plusieurs zones.
Lors de la construction de zones multicouches et de l'identification de régions telles que des tableaux, des règles, des photos et du texte, utilisez la segmentation automatique des zones.
Pour chaque zone, proposez plusieurs choix spécialisés, tels que les zones OMR, MRZ et MICR.
1.1.9. Services en nuage
Il s'agit d'une API Web évolutive et de grande capacité. Son interface conviviale vous permet d'incorporer facilement de puissantes fonctions d'OCR, de codes-barres, de MICR et de conversion de documents dans n'importe quel programme.
Remarque :
Le site officiel de NuGet montre à quel point les développeurs .NET préfèrent IronOCR à LeadTools. LeadTools compte 77,8 milliers de téléchargements, tandis qu'IronOCR en compte plus de 320 milliers.
2. IronOCR
IronOCR est une bibliothèque logicielle C# qui permet aux programmeurs de la plate-forme .NET de détecter et de lire du texte à partir d'images et de documents PDF. Il s'agit d'un progiciel d'OCR .NET pur qui utilise le moteur Tesseract le plus puissant au monde. IronOCR est très performant lorsqu'il s'agit de travailler avec des graphiques du monde réel et des documents défectueux tels que des photos ou des traitements à faible résolution avec du bruit numérique ou des défauts. Avec peu ou pas d'installation, Tesseract 5(ainsi que 4 et 3) fonctionne d'emblée sur Windows, macOS, Linux, Azure, AWS, Lambda, Mono et Xamarin Mac. Il n'y a pas de binaires natifs à gérer. Framework et Core sont compatibles.
IronOCR prend en charge plus de langues que n'importe quel autre moteur d'OCR, ce qui aide les programmeurs à réaliser des créations d'images significatives et permet d'en extraire des données multimédias. IronOCR prend en charge 125 langues internationales, mais seul l'anglais est installé en standard dans IronOCR .
Le service fourni par la boîte à outils IronOCR est facile à intégrer, facile à traiter et plus interactif que n'importe quel autre moteur OCR. Il offre des solutions aux développeurs .NET et leur permet de contrôler leurs documents et de s'y connecter numériquement, ainsi que de les manipuler comme ils l'entendent.
2.1. Caractéristiques de l'IronOCR
IronOCR offre un ensemble unique de caractéristiques et de fonctions permettant d'intégrer, de signer, d'exporter, de lire des graphiques et d'extraire des détails d'images, quel que soit le bagage technique des utilisateurs ou le niveau de sophistication du matériel utilisé.
2.1.1. Précision
Le SDK IronOCR porte la précision du travail à un tout autre niveau pour les bibliothèques d'OCR, grâce à son taux de précision de 99,8 % qui surpasse largement les autres bibliothèques d'OCR.
2.1.2. Correction des scans et des images de mauvaise qualité
La classe IronOCR offre aux développeurs C# un contrôle granulaire. Ils fournissent des services d'OCR(images et PDF en texte) à leurs développeurs et une performance finement ajustée dans chaque cas unique.
En travaillant avec des cas réels, un équilibre parfait entre la vitesse et la précision peut être atteint en établissant des variables. Nettoyer le bruit de fond, améliorer le contraste, améliorer la résolution, la langue, la stratégie, faire pivoter et redresser, l'espace couleur, détecter le texte blanc sur fond sombre et saisir le type d'image ne sont que quelques-unes des options disponibles.
Vous trouverez ci-dessous des exemples d'images avant et après la correction de scans de mauvaise qualité :
Avant
Après
2.1.3. Les langues
IronOCR propose des solutions dans plus de 125 langues internationales pour aider les développeurs du monde entier.
2.1.4. Extraction de texte par OCR
Iron Tesseract peut lire divers types d'images et de fichiers PDF. Avec les moteurs Tesseract traditionnels gratuits, cette fonctionnalité n'est pas possible. Si les scans sont de mauvaise qualité, l'entrée OCR vous permet de réparer automatiquement les propriétés pertinentes.
2.1.5. Filtres d'optimisation d'image
La classe OCRInput permet aux programmeurs C# d'exercer un contrôle granulaire sur les entrées. Les développeurs procèdent ensuite à un prétraitement des images afin d'en améliorer la rapidité et la précision. Cela élimine la méthode standard de préparation des photos pour l'OCR à l'aide des scripts par lots de Photoshop ou d'ImageMagick.
2.1.6. Région OCR d'une image
IronOCR permet d'effectuer une reconnaissance optique de caractères (OCR) sur une image avec rapidité et précision. IronOCR permet à ses utilisateurs finaux de sélectionner une zone ou une région spécifique de l'image et d'effectuer l'OCR sur cette région. La région est connue sous le nom de ContentAreas ou CropAreas.
2.1.7. Classe OCRResult
IronOCR renvoie un objet de résultat avancé pour chaque page qu'il scanne à l'aide de Tesseract 3,4 ou 5. Cet objet contient des données de localisation, des images, du texte, une confiance statistique, des choix de symboles alternatifs, des noms de polices, des décorations de tailles de polices, des graisses de polices et une position pour chacun des éléments suivants :
Pages
Paragraphes
Lignes de texte
Mots
Personnages individuels
Codes à barres
2.1.8. Plusieurs langues pour 1 document
IronOCR permet aux développeurs d'utiliser plusieurs langues pour un seul document. Cette fonction est d'une grande utilité pour les fournisseurs de services .NET.
Remarque :
IronOCR fait partie d'une gamme de produits primés. En remportant ce prix, Iron Software démontre qu'il fournit effectivement une application de scanner de documents géniale qui offre une reconnaissance superbe, ainsi qu'une conversion et une manipulation de documents excellentes.
3. Démarrer un nouveau projet dans Visual Studio
Ouvrez le logiciel Visual Studio, allez dans le menu fichier et sélectionnez nouveau projet. Sélectionnez ensuite l'application console.
Saisissez le nom du projet et sélectionnez le chemin d'accès dans la zone de texte appropriée. Cliquez ensuite sur le bouton de création, puis sélectionnez le Framework .NET requis, comme dans la capture d'écran ci-dessous :
Le projet Visual Studio va maintenant générer la structure de l'application sélectionnée et, si vous avez sélectionné l'application console, Windows et web, il va maintenant ouvrir le fichier program.cs dans lequel vous pouvez entrer le code et construire/exécuter l'application.
Ensuite, nous pouvons ajouter la bibliothèque pour tester le programme.
4. Installer la bibliothèque IronOCR
La bibliothèque IronOCR peut être téléchargée et installée de quatre façons. Il s'agit de
Utilisation du gestionnaire de paquets NuGet de Visual Studio
Téléchargement direct depuis la page web de NuGet.
Téléchargement direct depuis la page web de l'IronOCR.
Utilisation de la ligne de commande de Visual Studio.
4.1. Utilisation du gestionnaire NuGet de Visual Studio
Vous pouvez intégrer IronOCR dans un projet C# à l'aide du gestionnaire de paquets NuGet de Visual Studio.
Développer les outils.
Étendre le gestionnaire de paquets NuGet.
Cliquez sur Manage NuGet Packages for Solutions.
Une nouvelle fenêtre apparaît alors dans la barre de recherche : tapez IronOCR.
En utilisant cette méthode, les développeurs peuvent installer la bibliothèque IronOCR et n'importe quel pack linguistique de leur choix.
4.2. Téléchargement direct depuis la page web de NuGet
IronOCR peut être téléchargé directement depuis le site web de NuGet en suivant ces instructions :
Sélectionnez l'option de téléchargement dans le menu de droite.
Double-cliquez sur le paquet téléchargé. Il sera installé automatiquement.
Ensuite, rechargez la solution et commencez à l'utiliser dans le projet.
5.3. Télécharger à partir du site Web de LeadTools
Les développeurs peuvent télécharger directement le SDK Leadtools Document sur leur site web sans aucune difficulté. Il suffit de se rendre sur leur site web et de télécharger l'un des packs contenant la bibliothèque OCR.
6. OCR multithread
Les deux ensembles de logiciels en question fournissent des services pour les moteurs OCR multithread. Sous cette rubrique, nous examinerons leurs performances et leur rapidité.
6.1. L'OCR multithread LeadTools
LeadTools permet d'exécuter plus d'une instance d'OCR à la fois, en fonction des cœurs physiques de chaque système. Cette fonctionnalité de Lead Technologies permet aux développeurs .NET de gagner beaucoup de temps.
// Create an instance of an OCR document from the engine
IOcrDocument ocrDocument= ocrEngineInstance.DocumentManager.CreateDocument();
// Add page, zone them, recognize them and save them
// to the final document:
ocrDocument.Pages.AddPages(imageFileName, null);
ocrDocument.Recognize(null);
ocrDocument.Save(documentFileName, DocumentFormat.Pdf, null);
// Create an instance of an OCR document from the engine
IOcrDocument ocrDocument= ocrEngineInstance.DocumentManager.CreateDocument();
// Add page, zone them, recognize them and save them
// to the final document:
ocrDocument.Pages.AddPages(imageFileName, null);
ocrDocument.Recognize(null);
ocrDocument.Save(documentFileName, DocumentFormat.Pdf, null);
' Create an instance of an OCR document from the engine
Dim ocrDocument As IOcrDocument= ocrEngineInstance.DocumentManager.CreateDocument()
' Add page, zone them, recognize them and save them
' to the final document:
ocrDocument.Pages.AddPages(imageFileName, Nothing)
ocrDocument.Recognize(Nothing)
ocrDocument.Save(documentFileName, DocumentFormat.Pdf, Nothing)
$vbLabelText $csharpLabel
6.2. L'OCR multithread IronOCR
L'utilisation de la fonction multithread d'IronOCR est très simple et permet aux développeurs de gagner du temps. Iron Tesseract tentera automatiquement d'utiliser tous les threads disponibles sur tous les cœurs, et tiendra compte avec tact de la réactivité du thread principal/de l'interface utilisateur.
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.AddPdf("scan.pdf")
// Image processing is automatically multithreaded
Input.Deskew();
// OCR reading is automatically multi threaded too
var Result = Ocr.Read(Input);
}
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.AddPdf("scan.pdf")
// Image processing is automatically multithreaded
Input.Deskew();
// OCR reading is automatically multi threaded too
var Result = Ocr.Read(Input);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.AddPdf("scan.pdf") Input.Deskew()
' OCR reading is automatically multi threaded too
Dim Result = Ocr.Read(Input)
End Using
$vbLabelText $csharpLabel
7. Créer des PDF consultables
Créer facilement des PDF consultables est le rêve de tout développeur C#. Dans cette section, nous aborderons ce processus en utilisant à la fois le SDK IronOCR et le SDK OCR des technologies de pointe.
7.1. Créer des PDF avec recherche avec IronOCR
L'impressionnante application de scanner de documents d'IronOCR permet aux développeurs de franchir une nouvelle étape dans la création de PDF consultables en offrant une assistance pour la détection des caractères de texte dans les images et en les transformant en texte PDF significatif. L'exemple de code pour les utilisateurs se trouve ci-dessous :
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.Add(@"images\page1.png")
Input.Add(@"images\page2.bmp")
Input.Add(@"images\page3.tiff")
Input.Deskew();
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.Add(@"images\page1.png")
Input.Add(@"images\page2.bmp")
Input.Add(@"images\page3.tiff")
Input.Deskew();
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.Add("images\page1.png") Input.Add("images\page2.bmp") Input.Add("images\page3.tiff") Input.Deskew()
Dim Result = Ocr.Read(Input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText $csharpLabel
7.2. Créer des PDF consultables avec LeadTools OCR
Lead Technologies propose une application de scanner de documents impressionnante, issue de sa gamme de logiciels primés. Cependant, pour l'utilisateur final, le code est un peu plus compliqué que celui utilisé pour IronOCR.
private void saveAsSearchablePDFToolStripMenuItem_Click(object sender, EventArgs e)
{
try
{
// Create a document
using (IOcrDocument ocrDocument = _ocrEngine.DocumentManager.CreateDocument(null, OcrCreateDocumentOptions.AutoDeleteFile))
{
// Create IOcrPage from loaded image
_ocrPage = _ocrEngine.CreatePage(_viewer.Image, OcrImageSharingMode.AutoDispose);
// Recognize Text
_ocrPage.Recognize(null);
// Add the page
ocrDocument.Pages.Add(_ocrPage);
// Save page as documentation
SaveFileDialog saveDlg = new SaveFileDialog();
saveDlg.InitialDirectory = @"C:\LEADTOOLS22\Resources\Images";
saveDlg.Filter = "Adobe Portable Document Format
*.pdf";
if (saveDlg.ShowDialog(this) != DialogResult.OK)
return;
ocrDocument.Save(saveDlg.FileName, DocumentFormat.Pdf, null);
MessageBox.Show($"OCR output saved to {saveDlg.FileName}");
}
}
catch (Exception ex)
{
MessageBox.Show(ex.ToString());
}
}
private void saveAsSearchablePDFToolStripMenuItem_Click(object sender, EventArgs e)
{
try
{
// Create a document
using (IOcrDocument ocrDocument = _ocrEngine.DocumentManager.CreateDocument(null, OcrCreateDocumentOptions.AutoDeleteFile))
{
// Create IOcrPage from loaded image
_ocrPage = _ocrEngine.CreatePage(_viewer.Image, OcrImageSharingMode.AutoDispose);
// Recognize Text
_ocrPage.Recognize(null);
// Add the page
ocrDocument.Pages.Add(_ocrPage);
// Save page as documentation
SaveFileDialog saveDlg = new SaveFileDialog();
saveDlg.InitialDirectory = @"C:\LEADTOOLS22\Resources\Images";
saveDlg.Filter = "Adobe Portable Document Format
*.pdf";
if (saveDlg.ShowDialog(this) != DialogResult.OK)
return;
ocrDocument.Save(saveDlg.FileName, DocumentFormat.Pdf, null);
MessageBox.Show($"OCR output saved to {saveDlg.FileName}");
}
}
catch (Exception ex)
{
MessageBox.Show(ex.ToString());
}
}
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText $csharpLabel
8. Compatibilité
Cette section traite des services fournis par ces logiciels pour prendre en charge les différentes plateformes. Ces deux logiciels sont compatibles avec de nombreuses plates-formes et systèmes d'exploitation.
8.1 Compatibilité avec l'IronOCR
Le SDK IronOCR for NET est le meilleur SDK OCR compatible avec la quasi-totalité des plates-formes .NET et des systèmes d'exploitation compatibles avec le langage de programmation C#. IronOCR prend également en charge différents formats d'image tels que JPEG, JPG, tiff et bien d'autres.
Lead Technologies fournit également une assistance pour l'intégration de ses divers produits et applications sur différentes plateformes. Lead Technologies fournit également une excellente assistance SDK à ses utilisateurs et développeurs.
Systèmes d'exploitation pour le déploiement
Fenêtres
Mac-OS 10.10
iOS 8.0
Android 4.0 +
Type de composant
.NET
C#, VB, C++/CLI, XAML
WinForms, WPF, Web Forms
Services Web
iOS et mac-OS
Android
Linux
Récipients compatibles
Microsoft Visual Studio
framework .NET 4.5
framework .NET 4.0
framework .NET 3.5
framework .NET 3.0
framework .NET 2.0
9. Licences
Des licences sont nécessaires pour l'utilisation des logiciels mentionnés ci-dessus. Les deux logiciels exigent la détention de licences avant de se connecter à l'environnement. Une fois que vous êtes connecté, c'est seulement à ce moment-là que vous pouvez commencer à accéder à leur tout nouveau niveau de technologies logicielles.
9.1. Licence LeadTools
LeadTools fournit deux(2) les éléments clés de la licence du SDK :
Une "licence de développement" permet à un programmeur d'utiliser le SDK à des fins de développement.
Une "licence de déploiement" permettant au client de déployer ou de distribuer l'application de l'utilisateur final créée à l'aide des fichiers redistribuables du SDK qui contiennent la propriété intellectuelle de LeadTool.
Licence de développement
Pour développer avec LEADTOOLS, vous avez besoin d'une licence de développement. La licence de développement peut être achetée directement auprès de LEAD ou par l'intermédiaire d'un revendeur ou d'un distributeur agréé par LEAD.
La licence de développement permet à un client d'installer le SDK sur une machine de développement et de l'utiliser pour créer une application destinée à l'utilisateur final en incluant des bibliothèques et des fichiers redistribuables spécifiques dans l'application à l'aide du code d'exemple et de la documentation du SDK.
Licence de déploiement
L'utilisation par le client de l'application utilisateur final développée par le SDK("Logiciel de l'utilisateur final) est régi par la licence de déploiement.
Contrairement à un accord de licence d'application standard pour l'utilisateur final, qui interdit toute copie de l'application, une licence SDK permet à l'utilisateur de copier et de redistribuer une partie du SDK. Afin de reproduire la propriété intellectuelle de LEAD et de la déployer avec le logiciel de l'utilisateur final produit à l'aide du SDK de LEAD, les clients de LEAD doivent obtenir la licence de déploiement nécessaire.
9.1.2. Tarification
LeadTools ne fournit pas de licences gratuites à ses développeurs. Au lieu de cela, il fournit des licences complètes basées sur les développeurs. Pour voir la structure de prix du SDK OCR de Lead Technologies, cliquez ici.
9.2. Licence IronOCR
IronOCR est une bibliothèque qui fournit gratuitement une licence de développeur. IronPDF a également une structure de prix distincte ; l'offre Lite commence à $749 sans frais cachés. La redistribution des produits SaaS et OEM est également possible. Toutes les licences sont assorties d'une garantie de remboursement de 30 jours, d'un an d'assistance et de mises à jour du logiciel, d'une validité de développement/staging/production et d'une licence perpétuelle(achat unique). Pour connaître la structure tarifaire complète d'IronOCR et les détails de la licence, cliquez ici.
Vous pouvez obtenir le service de redistribution des produits SaaS et OEM sans droits d'auteur pour un achat unique de 1599 $ seulement.
10. Résumé et conclusion
10.1. Résumé
IronOCR est une bibliothèque SDK .NET qui utilise le moteur Tesseract le plus puissant au monde, appelé Iron Tesseract. Il prend en charge plus de 125 langues internationales. IronOCR est une application de scanner de documents géniale avec de nombreuses fonctionnalités d'imagerie telles que OCR d'une région d'une image, extraction de texte à partir d'images, fixation d'une image de faible résolution et exécution de l'OCR sur une région spécifique d'une image, et beaucoup d'autres fonctionnalités connexes. IronOCR se concentre sur la rapidité et la précision, et son taux de précision de 99,8 % est supérieur à celui de tous les autres OCR Tesseract existants. IronOCR fonctionne dès le départ sans qu'il soit nécessaire de régler les performances ou de modifier lourdement les images d'entrée. De plus, vous pouvez toujours obtenir les cinq produits d'Iron Software pour le prix de deux seulement. Cliquez ici pour voir la page web.
IronPDF
IronOCR
IronXL
Code-barres Iron
IronWebscraper
LeadTools OCR est une boîte à outils de LeadTools qui offre la plupart des fonctions de reconnaissance rapidement et efficacement. Les programmeurs peuvent effectuer la reconnaissance de caractères sur des images de documents, et produire le texte reconnu dans plus de 20 formats de fichiers en utilisant la bibliothèque de classes OCR de LEADTOOLS. Sa bibliothèque peut être intégrée à la plupart des langages de programmation et à la quasi-totalité des plates-formes disponibles sur le marché. Ses caractéristiques sont les suivantes
OCR rapide et précise avec prise en charge multithreads
Prise en charge d'un grand nombre de jeux de caractères pour l'OCR, y compris le latin, le cyrillique, l'Asie de l'Est et l'arabe
Enregistrement des résultats de l'OCR dans plus de 40 formats de sortie, y compris PDF avec recherche, PDF/A, Word et XML
OCR pleine page et par zone
Dictionnaires orthographiques intégrés et personnalisés pour améliorer les résultats de l'OCR
Fonctions puissantes de nettoyage et de prétraitement des images de documents pour améliorer les résultats de l'OCR à partir d'images numérisées
10.2. Conclusion
IronOCR et LeadTools OCR sont tous deux des outils haut de gamme et offrent toutes les fonctionnalités qu'un développeur C# ou .NET pourrait souhaiter. IronOCR est plus facile à utiliser et à coder que son concurrent. Les deux logiciels n'entraînent pas de coûts permanents, mais IronOCR est beaucoup plus rentable que la bibliothèque OCR de LeadTools. IronOCR est plus précis que n'importe lequel de ses concurrents. IronOCR offre une prise en charge internationale de plus de 125 langues. En revanche, LeadTools ne prend en charge que plus de 40 langues. Si l'on tient compte de tous les aspects de la performance, la seule conclusion que l'on puisse tirer est qu'IronOCR présente des avantages significatifs par rapport à LeadTools OCR.
Jordi maîtrise parfaitement Python, C# et C++. Lorsqu'il ne met pas à profit ses compétences chez Iron Software, il se consacre à la programmation de jeux. Partageant des responsabilités en matière de tests de produits, de développement de produits et de recherche, Jordi apporte une valeur ajoutée considérable à l'amélioration continue des produits. Cette expérience variée le stimule et l'engage, et il dit que c'est l'un des aspects qu'il préfère dans son travail chez Iron Software. Jordi a grandi à Miami, en Floride, et a étudié l'informatique et les statistiques à l'université de Floride.
< PRÉCÉDENT Comparaison entre IronOCR et Abbyy Finereader
SUIVANT > Comparaison entre IronOCR et Asprise OCR
Des millions d'ingénieurs dans le monde entier lui font confiance
Réservez une démo en direct gratuite
Réservez une démonstration personnelle de 30 minutes.
Pas de contrat, pas de détails de carte, pas d'engagements.
Voici ce à quoi vous pouvez vous attendre :
Une démonstration en direct de notre produit et de ses principales fonctionnalités
Obtenez des recommandations de fonctionnalités spécifiques au projet
Toutes vos questions trouvent réponse pour vous assurer de disposer de toutes les informations dont vous avez besoin. (Aucune obligation de votre part.)
CHOISIR L'HEURE
VOS INFORMATIONS
Réservez votre gratuit Démonstration en direct
Fiable par plus de 2 millions d'ingénieurs dans le monde entier