Test dans un environnement réel
Test en production sans filigrane.
Fonctionne partout où vous en avez besoin.
Dans le paysage numérique d'aujourd'hui, la reconnaissance optique des caractères(OCR) est devenue indispensable pour les entreprises qui cherchent à extraire efficacement du texte à partir d'images, de PDF et d'autres documents. Parmi la pléthore de solutions d'OCR disponibles, Microsoft Azure OCR vs Google OCR, etIronOCR se distinguent comme des concurrents de premier plan, chacun offrant des caractéristiques et des capacités uniques. Dans cet article, nous examinons ces services d'OCR, leurs caractéristiques et le choix de l'un d'entre eux.
Les services d'OCR sont des plateformes basées sur le cloud qui exploitent des algorithmes avancés d'apprentissage automatique pour extraire le texte d'images et de documents. Ils offrent toute une série de fonctionnalités, notamment la prise en charge du multilinguisme, la détection de la mise en page et la reconnaissance de l'écriture manuscrite. Azure OCR, Google OCR et IronOCR sont des services d'OCR largement utilisés, chacun ayant ses points forts et ses applications.
LesAzure OCR qui fait partie de la suite Microsoft Azure Cognitive Services, offre une solution fiable et évolutive pour les tâches de reconnaissance de texte. Il prend en charge un large éventail de langues et de formats de documents, ce qui le rend adapté à divers cas d'utilisation. Microsoft Azure OCR s'appuie sur des modèles d'apprentissage profond pour obtenir une grande précision dans l'extraction de texte, ce qui permet aux entreprises de rationaliser efficacement les flux de traitement des documents. Azure s'apparente davantage à un service de vision par ordinateur.
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision;
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models;
using System;
class Program
{
static async Task Main(string [] args)
{
// Create an instance of the ComputerVisionClient
ComputerVisionClient client = new ComputerVisionClient(new ApiKeyServiceClientCredentials("YOUR_API_KEY"))
{
Endpoint = "https://YOUR_REGION.api.cognitive.microsoft.com/"
};
// Specify the image URL
string imageUrl = "https://example.com/image.jpg";
// Perform OCR on the image
OcrResult result = await client.RecognizePrintedTextAsync(true, imageUrl);
// Display the extracted text
foreach (var region in result.Regions)
{
foreach (var line in region.Lines)
{
foreach (var word in line.Words)
{
Console.Write(word.Text + " ");
}
Console.WriteLine();
}
}
}
}
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision;
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models;
using System;
class Program
{
static async Task Main(string [] args)
{
// Create an instance of the ComputerVisionClient
ComputerVisionClient client = new ComputerVisionClient(new ApiKeyServiceClientCredentials("YOUR_API_KEY"))
{
Endpoint = "https://YOUR_REGION.api.cognitive.microsoft.com/"
};
// Specify the image URL
string imageUrl = "https://example.com/image.jpg";
// Perform OCR on the image
OcrResult result = await client.RecognizePrintedTextAsync(true, imageUrl);
// Display the extracted text
foreach (var region in result.Regions)
{
foreach (var line in region.Lines)
{
foreach (var word in line.Words)
{
Console.Write(word.Text + " ");
}
Console.WriteLine();
}
}
}
}
Imports Microsoft.Azure.CognitiveServices.Vision.ComputerVision
Imports Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models
Imports System
Friend Class Program
Shared Async Function Main(ByVal args() As String) As Task
' Create an instance of the ComputerVisionClient
Dim client As New ComputerVisionClient(New ApiKeyServiceClientCredentials("YOUR_API_KEY")) With {.Endpoint = "https://YOUR_REGION.api.cognitive.microsoft.com/"}
' Specify the image URL
Dim imageUrl As String = "https://example.com/image.jpg"
' Perform OCR on the image
Dim result As OcrResult = Await client.RecognizePrintedTextAsync(True, imageUrl)
' Display the extracted text
For Each region In result.Regions
For Each line In region.Lines
For Each word In line.Words
Console.Write(word.Text & " ")
Next word
Console.WriteLine()
Next line
Next region
End Function
End Class
Google OCR, qui fait partie du fournisseur de services Google Cloud, offre une plateforme puissante pour la reconnaissance de texte et l'analyse de documents. S'appuyant sur les algorithmes avancés d'apprentissage automatique de Google, il fournit des capacités d'extraction de texte précises, avec des fonctionnalités supplémentaires telles que l'étiquetage d'images et la détection d'objets par le biais de l'informatique en nuage. L'OCR de la plateforme Google Cloud est largement utilisé dans divers secteurs pour des tâches telles que le traitement des factures, la reconnaissance de formulaires et la numérisation de contenu.
using Google.Cloud.Vision.V1;
using Google.Protobuf;
using System.IO;
using Google.Apis.Auth.OAuth2;
var clientBuilder = new ImageAnnotatorClientBuilder { CredentialsPath = "path-to-credentials.json" };
var client = clientBuilder.Build();
var image = Image.FromFile("path-to-your-image.jpg");
var response = client.DetectText(image);
foreach (var annotation in response)
{
Console.WriteLine(annotation.Description);
}
using Google.Cloud.Vision.V1;
using Google.Protobuf;
using System.IO;
using Google.Apis.Auth.OAuth2;
var clientBuilder = new ImageAnnotatorClientBuilder { CredentialsPath = "path-to-credentials.json" };
var client = clientBuilder.Build();
var image = Image.FromFile("path-to-your-image.jpg");
var response = client.DetectText(image);
foreach (var annotation in response)
{
Console.WriteLine(annotation.Description);
}
Imports Google.Cloud.Vision.V1
Imports Google.Protobuf
Imports System.IO
Imports Google.Apis.Auth.OAuth2
Private clientBuilder = New ImageAnnotatorClientBuilder With {.CredentialsPath = "path-to-credentials.json"}
Private client = clientBuilder.Build()
Private image = System.Drawing.Image.FromFile("path-to-your-image.jpg")
Private response = client.DetectText(image)
For Each annotation In response
Console.WriteLine(annotation.Description)
Next annotation
IronOCRdéveloppée par Iron Software, est une bibliothèque d'OCR polyvalente pour les applications .NET qui offre une précision et des performances d'OCR à la pointe de l'industrie. Contrairement aux services d'OCR basés sur le cloud, IronOCR offre des capacités d'extraction de texte sur site, ce qui le rend adapté aux applications nécessitant la confidentialité et la sécurité des données. IronOCR excelle en termes de précision, en particulier dans les scénarios impliquant des mises en page complexes, du texte manuscrit et des images bruitées, ce qui en fait le choix privilégié des entreprises à la recherche d'une fonctionnalité d'OCR fiable.
IronOCR peut être installé à l'aide de NuGet Package Manager for Console Il suffit d'exécuter la commande suivante.
Ouvrez Visual Studio et créez un nouveau projet ou ouvrez un projet existant.
Sélectionnez maintenant la console du gestionnaire de paquets dans la liste qui vient d'apparaître.
Install-Package IronOcr
L'installation d'IronOCR prendra quelques instants, mais une fois qu'elle sera terminée, nous pourrons passer à l'exemple de codage.
using IronOcr;
using System;
class Program
{
static void Main(string [] args)
{
// Specify the path to the image file
string imagePath = "path-to-your-image.jpg";
// Instantiate the IronTesseract OCR engine
var ocr = new IronTesseract();
// Set the language for text recognition
ocr.Language = OcrLanguage.English;
// Perform text recognition on the image
var result = ocr.Read(imagePath);
// Display the extracted text
Console.WriteLine("Extracted Text:");
Console.WriteLine(result.Text);
}
}
using IronOcr;
using System;
class Program
{
static void Main(string [] args)
{
// Specify the path to the image file
string imagePath = "path-to-your-image.jpg";
// Instantiate the IronTesseract OCR engine
var ocr = new IronTesseract();
// Set the language for text recognition
ocr.Language = OcrLanguage.English;
// Perform text recognition on the image
var result = ocr.Read(imagePath);
// Display the extracted text
Console.WriteLine("Extracted Text:");
Console.WriteLine(result.Text);
}
}
Imports IronOcr
Imports System
Friend Class Program
Shared Sub Main(ByVal args() As String)
' Specify the path to the image file
Dim imagePath As String = "path-to-your-image.jpg"
' Instantiate the IronTesseract OCR engine
Dim ocr = New IronTesseract()
' Set the language for text recognition
ocr.Language = OcrLanguage.English
' Perform text recognition on the image
Dim result = ocr.Read(imagePath)
' Display the extracted text
Console.WriteLine("Extracted Text:")
Console.WriteLine(result.Text)
End Sub
End Class
Parmi tous les outils d'OCR, Azure OCR, Google Vision API, etIronOCR sont connus comme des solutions d'OCR puissantes qui offrent une précision et des performances élevées pour les tâches d'extraction de texte. Alors qu'Azure OCR et Google OCR fournissent des services d'OCR basés sur le cloud avec une infrastructure évolutive et une prise en charge étendue des langues, IronOCR se distingue comme la solution la plus précise.
IronOCR se distingue, en particulier pour les applications nécessitant une extraction de texte sur site et une précision supérieure. En tirant parti d'IronOCR, les entreprises peuvent rationaliser les flux de traitement des documents, améliorer la précision de l'extraction des données et dégager des informations précieuses à partir des documents et images numérisés, ce qui en fait le choix privilégié.
Pour en savoir plus sur IronOCR et ses services, veuillez consulter le site Web de la Commission européennePage de documentation IronOCR pour vous aider à transformer la façon dont vous traitez les images.
9 produits de l'API .NET pour vos documents de bureau