OCR sindhi en C# et .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR est un composant logiciel C# qui permet aux développeurs .NET de lire du texte à partir d'images et de documents PDF dans 126 langues, dont le sindhi. Il s'agit d'une version avancée de Tesseract, conçue exclusivement pour les développeurs .NET et qui surpasse régulièrement les autres moteurs Tesseract en termes de vitesse et de précision.

Contenu de IronOcr.Languages.Sindhi

Ce package contient 43 langues OCR pour .NET :

  • Sindhi
  • SindhiBest
  • SindhiFast

Télécharger

Pack de langue sindhi [सिनधी]

  • Télécharger au format Zip
  • Installer avec NuGet

Installation

La première chose à faire est d'installer le package OCR Sindhi dans votre projet .NET.

Install-Package IronOCR.Languages.Sindhi

Exemple de code

Cet exemple de code C# lit du texte sindhi à partir d'une image ou d'un document PDF.

// Ensure the IronOCR package and Sindhi language pack are installed
using IronOcr;

var Ocr = new IronTesseract
{
    Language = OcrLanguage.Sindhi  // Set the OCR language to Sindhi
};

// Open an image or PDF document for OCR processing
using (var Input = new OcrInput(@"images\Sindhi.png"))
{
    // Perform OCR and get the results
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Optionally, you can do something with the extracted text,
    // such as displaying or saving it to a file.
}
// Ensure the IronOCR package and Sindhi language pack are installed
using IronOcr;

var Ocr = new IronTesseract
{
    Language = OcrLanguage.Sindhi  // Set the OCR language to Sindhi
};

// Open an image or PDF document for OCR processing
using (var Input = new OcrInput(@"images\Sindhi.png"))
{
    // Perform OCR and get the results
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Optionally, you can do something with the extracted text,
    // such as displaying or saving it to a file.
}
' Ensure the IronOCR package and Sindhi language pack are installed
Imports IronOcr

Private Ocr = New IronTesseract With {.Language = OcrLanguage.Sindhi}

' Open an image or PDF document for OCR processing
Using Input = New OcrInput("images\Sindhi.png")
	' Perform OCR and get the results
	Dim Result = Ocr.Read(Input)

	' Extract the recognized text
	Dim AllText = Result.Text

	' Optionally, you can do something with the extracted text,
	' such as displaying or saving it to a file.
End Using
$vbLabelText   $csharpLabel

Dans cet exemple de code :

  • Nous avons configuré une instance d' IronTesseract .
  • Définissez la langue de l'OCR sur sindhi.
  • Ouvrir un fichier image contenant du texte sindhi.
  • Effectuer une reconnaissance optique de caractères (OCR) sur l'image et extraire le texte à l'aide de la méthode Read .
  • Le texte extrait est stocké dans la variable AllText pour une utilisation ultérieure.