OCR de l'alphabet devanagari en C# et .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

126 autres langues

IronOCR est un composant logiciel C# permettant aux développeurs .NET de lire du texte à partir d'images et de documents PDF dans 126 langues, dont l'alphabet devanagari. Il s'agit d'une version avancée de Tesseract, conçue exclusivement pour les développeurs .NET et qui surpasse régulièrement les autres moteurs Tesseract en termes de vitesse et de précision.

Contenu de IronOcr.Languages.Devanagari

Ce package contient 79 langues OCR pour .NET :

  • Alphabet devanagari
  • Meilleur alphabet devanagari
  • Alphabet Devanagari Rapide

Télécharger

Pack de langue de l'alphabet devanagari [Nagair]

  • Télécharger au format Zip
  • Installer avec NuGet

Installation

La première chose à faire est d'installer notre package OCR d'alphabet devanagari sur votre projet .NET.

Install-Package IronOCR.Languages.Devanagari

Exemple de code

Cet exemple de code C# lit du texte en alphabet devanagari à partir d'une image ou d'un document PDF.

// Ensure the IronOcr package is installed 
// PM> Install-Package IronOcr.Languages.Devanagari

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Devanagari
Ocr.Language = OcrLanguage.Devanagari;

// Define the input file
using (var Input = new OcrInput(@"images\Devanagari.png"))
{
    // Process the input file
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Output the recognized text
    Console.WriteLine(AllText);
}
// Ensure the IronOcr package is installed 
// PM> Install-Package IronOcr.Languages.Devanagari

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Devanagari
Ocr.Language = OcrLanguage.Devanagari;

// Define the input file
using (var Input = new OcrInput(@"images\Devanagari.png"))
{
    // Process the input file
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Output the recognized text
    Console.WriteLine(AllText);
}
' Ensure the IronOcr package is installed 
' PM> Install-Package IronOcr.Languages.Devanagari

Imports IronOcr

Private Ocr = New IronTesseract()
' Set the OCR language to Devanagari
Ocr.Language = OcrLanguage.Devanagari

' Define the input file
Using Input = New OcrInput("images\Devanagari.png")
	' Process the input file
	Dim Result = Ocr.Read(Input)

	' Extract the recognized text
	Dim AllText = Result.Text

	' Output the recognized text
	Console.WriteLine(AllText)
End Using
$vbLabelText   $csharpLabel

L'extrait de code ci-dessus illustre :

  • Configuration du moteur OCR IronTesseract.
  • Configuration de la langue OCR sur Devanagari.
  • Lecture d'un fichier image contenant du texte en devanagari.
  • Extraction et affichage du texte reconnu sur la console.