OCR sindhi en C# y .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR es un componente de software en C# que permite a los desarrolladores de .NET leer texto de imágenes y documentos PDF en 126 idiomas, incluyendo Sindhi. Es una rama avanzada de Tesseract, construida exclusivamente para desarrolladores de .NET y supera regularmente a otros motores de Tesseract tanto en velocidad como en precisión.

Contenido de IronOcr.Languages.Sindhi

Este paquete contiene 43 idiomas OCR para .NET:

  • Sindhi
  • SindhiBest
  • SindhiFast

Descargar

Paquete de Idioma Sindhi [सिनधी]

Instalación

Lo primero que hay que hacer es instalar el paquete de OCR Sindhi en tu proyecto .NET.

Install-Package IronOCR.Languages.Sindhi

Ejemplo de código

Este ejemplo de código en C# lee texto Sindhi de una imagen o documento PDF.

// Ensure the IronOCR package and Sindhi language pack are installed
using IronOcr;

var Ocr = new IronTesseract
{
    Language = OcrLanguage.Sindhi  // Set the OCR language to Sindhi
};

// Open an image or PDF document for OCR processing
using (var Input = new OcrInput(@"images\Sindhi.png"))
{
    // Perform OCR and get the results
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Optionally, you can do something with the extracted text,
    // such as displaying or saving it to a file.
}
// Ensure the IronOCR package and Sindhi language pack are installed
using IronOcr;

var Ocr = new IronTesseract
{
    Language = OcrLanguage.Sindhi  // Set the OCR language to Sindhi
};

// Open an image or PDF document for OCR processing
using (var Input = new OcrInput(@"images\Sindhi.png"))
{
    // Perform OCR and get the results
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Optionally, you can do something with the extracted text,
    // such as displaying or saving it to a file.
}
' Ensure the IronOCR package and Sindhi language pack are installed
Imports IronOcr

Private Ocr = New IronTesseract With {.Language = OcrLanguage.Sindhi}

' Open an image or PDF document for OCR processing
Using Input = New OcrInput("images\Sindhi.png")
	' Perform OCR and get the results
	Dim Result = Ocr.Read(Input)

	' Extract the recognized text
	Dim AllText = Result.Text

	' Optionally, you can do something with the extracted text,
	' such as displaying or saving it to a file.
End Using
$vbLabelText   $csharpLabel

En este ejemplo de código:

  • Configuramos una instancia de IronTesseract.
  • Establecer el idioma OCR a Sindhi.
  • Abrir un archivo de imagen que contenga texto Sindhi.
  • Realizar OCR en la imagen y extraer el texto usando el método Read.
  • El texto extraído se almacena en la variable AllText para su uso posterior.