Sindhi OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Inne wersje tego dokumentu:

IronOCR to komponent oprogramowania C#, który pozwala programistom .NET odczytywać tekst ze zdjęć i dokumentów PDF w 126 językach, w tym w języku Sindhi. Jest to zaawansowany fork Tesseracta, zbudowany wyłącznie dla deweloperów .NET i regularnie przewyższający inne silniki Tesseract pod względem szybkości i dokładności.

Zawartość IronOcr.Languages.Sindhi

Ten pakiet zawiera 43 języki OCR dla .NET:

  • Sindhi
  • SindhiBest
  • SindhiFast

Pobieranie

Sindhi Language Pack [सिनधी]

Instalacja

Pierwszą rzeczą do zrobienia jest zainstalowanie pakietu OCR Sindhi w swoim projekcie .NET.

Install-Package IronOcr.Languages.Sindhi

Przyklad kodu

Ten przykładowy kod C# odczytuje tekst w języku Sindhi z obrazu lub dokumentu PDF.

// Ensure the IronOCR package and Sindhi language pack are installed
using IronOcr;

var Ocr = new IronTesseract
{
    Language = OcrLanguage.Sindhi  // Set the OCR language to Sindhi
};

// Open an image or PDF document for OCR processing
using (var Input = new OcrInput(@"images\Sindhi.png"))
{
    // Perform OCR and get the results
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Optionally, you can do something with the extracted text,
    // such as displaying or saving it to a file.
}
// Ensure the IronOCR package and Sindhi language pack are installed
using IronOcr;

var Ocr = new IronTesseract
{
    Language = OcrLanguage.Sindhi  // Set the OCR language to Sindhi
};

// Open an image or PDF document for OCR processing
using (var Input = new OcrInput(@"images\Sindhi.png"))
{
    // Perform OCR and get the results
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Optionally, you can do something with the extracted text,
    // such as displaying or saving it to a file.
}
' Ensure the IronOCR package and Sindhi language pack are installed
Imports IronOcr

Private Ocr = New IronTesseract With {.Language = OcrLanguage.Sindhi}

' Open an image or PDF document for OCR processing
Using Input = New OcrInput("images\Sindhi.png")
	' Perform OCR and get the results
	Dim Result = Ocr.Read(Input)

	' Extract the recognized text
	Dim AllText = Result.Text

	' Optionally, you can do something with the extracted text,
	' such as displaying or saving it to a file.
End Using
$vbLabelText   $csharpLabel

W tym przykładzie kodu:

  • Konfigurujemy instancję IronTesseract.
  • Ustawiamy język OCR na Sindhi.
  • Otwieramy plik graficzny zawierający tekst w języku Sindhi.
  • Wykonujemy OCR na obrazie i wyodrębniamy tekst przy użyciu metody Read.
  • Wyodrębniony tekst jest przechowywany w zmiennej AllText do dalszego użytku.