Reconnaissance optique de caractères en sanskrit avec C# et .NET
IronOCR est un composant logiciel C# permettant aux codeurs .NET de lire du texte à partir d'images et de documents PDF dans 126 langues, y compris le sanskrit.
Il s'agit d'une version avancée de Tesseract, conçue exclusivement pour les développeurs .NET, qui surpasse régulièrement les autres moteurs Tesseract en termes de vitesse et de précision.
Contenu de IronOCR.Languages.Sanskrit
Ce paquet contient 49 langages OCR pour .NET :
- Sanskrit
- SanskritBest
- SanskritFast
Télécharger
Pack de langue sanskrit [संस्कृतम्]
Installation
La première chose que nous devons faire est d'installer notre package OCR Sanskrit dans votre projet .NET.
PM> Install-Package IronOCR.Languages.Sanskrit
Exemple de code
Cet exemple de code C# lit le texte sanskrit à partir d'une image ou d'un document PDF.
//PM> Install-Package IronOcr.Languages.Sanskrit
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sanskrit;
using (var Input = new OcrInput(@"images\Sanskrit.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
//PM> Install-Package IronOcr.Languages.Sanskrit
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sanskrit;
using (var Input = new OcrInput(@"images\Sanskrit.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
'PM> Install-Package IronOcr.Languages.Sanskrit
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sanskrit
Using Input = New OcrInput("images\Sanskrit.png")
Dim Result = Ocr.Read(Input)
Dim AllText = Result.Text
End Using