Tamil OCR in C# and .NET
Autres versions de ce document :
IronOCR est un composant logiciel C# permettant aux développeurs .NET de lire du texte à partir d'images et de documents PDF dans 126 langues, y compris le tamoul.
Il s'agit d'une version avancée de Tesseract, conçue exclusivement pour les développeurs .NET et qui surpasse régulièrement les autres moteurs Tesseract en termes de vitesse et de précision.
Contenu de IronOcr.Languages.Tamil
Ce package contient 102 langues OCR for .NET :
- tamoul
- tamoulBest
- tamoulFast
- Alphabets tamouls
- Meilleur alphabet tamoul
- Alphabétique tamoul rapide
Télécharger
Pack de langue tamoul [தமிழ்]
Installation
La première chose à faire est d'installer notre package OCR tamoul dans votre projet .NET.
Install-Package IronOcr.Languages.Tamil
Exemple de code
Cet exemple de code C# lit du texte tamoul à partir d'une image ou d'un document PDF.
// Ensure IronOcr.Languages.Tamil package is installed
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"images\Tamil.png"))
{
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Get the recognized text
var AllText = Result.Text;
// Display the recognized text (for example purpose)
Console.WriteLine(AllText);
}
// Ensure IronOcr.Languages.Tamil package is installed
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"images\Tamil.png"))
{
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Get the recognized text
var AllText = Result.Text;
// Display the recognized text (for example purpose)
Console.WriteLine(AllText);
}
Imports IronOcr
' Ensure IronOcr.Languages.Tamil package is installed
Dim Ocr As New IronTesseract()
' Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil
Using Input As New OcrInput("images\Tamil.png")
' Perform OCR on the input image
Dim Result = Ocr.Read(Input)
' Get the recognized text
Dim AllText = Result.Text
' Display the recognized text (for example purpose)
Console.WriteLine(AllText)
End Using
- La classe
IronTesseractest utilisée pour initialiser et configurer le moteur OCR. - La propriété
Ocr.Languagespécifie le pack de langue à utiliser pour la reconnaissance optique de caractères (OCR). - La classe
OcrInputest utilisée avec le chemin d'accès au fichier image contenant le texte tamoul. - La méthode
Ocr.Read()traite l'image et extrait le texte. - Enfin, le texte reconnu est stocké dans
AllTextet peut être utilisé selon les besoins.

