OCR télougou en C# et .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR est un composant logiciel C# permettant aux développeurs .NET de lire du texte à partir d'images et de documents PDF dans 126 langues, dont le télougou.

Il s'agit d'une version avancée de Tesseract, conçue exclusivement pour les développeurs .NET et qui surpasse régulièrement les autres moteurs Tesseract en termes de vitesse et de précision.

Contenu de IronOcr.Languages.Telugu

Ce package contient plusieurs modèles de langage OCR pour .NET liés au télougou :

  • Telugu
  • TeluguBest
  • TeluguFast
  • Alphabet télougou
  • TeluguAlphabetBest
  • TeluguAlphabetFast

Télécharger

Pack de langue télougou [Talugu]

  • Télécharger au format ZIP
  • Installer avec NuGet

Installation

La première étape consiste à installer le package OCR télougou dans votre projet .NET.

Install-Package IronOCR.Languages.Telugu

Exemple de code

Voici un exemple de code C# qui lit du texte télougou à partir d'une image ou d'un document PDF.

// Ensure that you have installed the IronOCR.Languages.Telugu package before running this code.

using IronOcr;

public class TeluguOcrExample
{
    public static void Main()
    {
        // Create a new IronTesseract instance
        var Ocr = new IronTesseract();

        // Specify the OCR language as Telugu
        Ocr.Language = OcrLanguage.Telugu;

        // Create a new OcrInput and specify the path to the image or PDF
        using (var Input = new OcrInput(@"images\Telugu.png"))
        {
            // Perform OCR on the input file
            var Result = Ocr.Read(Input);

            // Extract and store the recognized text
            var AllText = Result.Text;

            // Output the recognized text to the console (optional)
            Console.WriteLine(AllText);
        }
    }
}
// Ensure that you have installed the IronOCR.Languages.Telugu package before running this code.

using IronOcr;

public class TeluguOcrExample
{
    public static void Main()
    {
        // Create a new IronTesseract instance
        var Ocr = new IronTesseract();

        // Specify the OCR language as Telugu
        Ocr.Language = OcrLanguage.Telugu;

        // Create a new OcrInput and specify the path to the image or PDF
        using (var Input = new OcrInput(@"images\Telugu.png"))
        {
            // Perform OCR on the input file
            var Result = Ocr.Read(Input);

            // Extract and store the recognized text
            var AllText = Result.Text;

            // Output the recognized text to the console (optional)
            Console.WriteLine(AllText);
        }
    }
}
' Ensure that you have installed the IronOCR.Languages.Telugu package before running this code.

Imports IronOcr

Public Class TeluguOcrExample
	Public Shared Sub Main()
		' Create a new IronTesseract instance
		Dim Ocr = New IronTesseract()

		' Specify the OCR language as Telugu
		Ocr.Language = OcrLanguage.Telugu

		' Create a new OcrInput and specify the path to the image or PDF
		Using Input = New OcrInput("images\Telugu.png")
			' Perform OCR on the input file
			Dim Result = Ocr.Read(Input)

			' Extract and store the recognized text
			Dim AllText = Result.Text

			' Output the recognized text to the console (optional)
			Console.WriteLine(AllText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Cet extrait de code initialise un moteur OCR utilisant le package IronOCR, définit la langue télougou pour le traitement OCR et lit le texte à partir d'un fichier image d'entrée spécifié par l'utilisateur.