OCR tamoul en C# et .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR est un composant logiciel C# permettant aux développeurs .NET de lire du texte à partir d'images et de documents PDF dans 126 langues, y compris le tamoul.

Il s'agit d'une version avancée de Tesseract, conçue exclusivement pour les développeurs .NET et qui surpasse régulièrement les autres moteurs Tesseract en termes de vitesse et de précision.

Contenu de IronOcr.Languages.Tamil

Ce package contient 102 langues OCR pour .NET :

  • tamoul
  • tamoulBest
  • tamoulFast
  • Alphabets tamouls
  • Meilleur alphabet tamoul
  • Alphabétique tamoul rapide

Télécharger

Pack de langue tamoul [தமிழ்]

  • Télécharger au format Zip
  • Installer avec NuGet

Installation

La première chose à faire est d'installer notre package OCR tamoul dans votre projet .NET.

Install-Package IronOCR.Languages.Tamil

Exemple de code

Cet exemple de code C# lit du texte tamoul à partir d'une image ou d'un document PDF.

// Ensure IronOCR.Languages.Tamil package is installed
using IronOcr;

var Ocr = new IronTesseract();

// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;

using (var Input = new OcrInput(@"images\Tamil.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Get the recognized text
    var AllText = Result.Text;

    // Display the recognized text (for example purpose)
    Console.WriteLine(AllText);
}
// Ensure IronOCR.Languages.Tamil package is installed
using IronOcr;

var Ocr = new IronTesseract();

// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;

using (var Input = new OcrInput(@"images\Tamil.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Get the recognized text
    var AllText = Result.Text;

    // Display the recognized text (for example purpose)
    Console.WriteLine(AllText);
}
' Ensure IronOCR.Languages.Tamil package is installed
Imports IronOcr

Private Ocr = New IronTesseract()

' Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil

Using Input = New OcrInput("images\Tamil.png")
	' Perform OCR on the input image
	Dim Result = Ocr.Read(Input)

	' Get the recognized text
	Dim AllText = Result.Text

	' Display the recognized text (for example purpose)
	Console.WriteLine(AllText)
End Using
$vbLabelText   $csharpLabel
  • La classe IronTesseract est utilisée pour initialiser et configurer le moteur OCR.
  • La propriété Ocr.Language spécifie le module linguistique à utiliser pour la reconnaissance optique de caractères (OCR).
  • La classe OcrInput est utilisée avec le chemin d'accès au fichier image contenant le texte tamoul.
  • La méthode Ocr.Read() traite l'image et en extrait le texte. Enfin, le texte reconnu est stocké dans AllText et peut être utilisé selon les besoins.