Tajik OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Bu belgenin diğer versiyonları:

IronOCR, .NET kodlayıcılarının, Tacik dahil 126 dilde, resimler ve PDF belgelerinden metin okumasını sağlayan bir C# yazılım bileşenidir.

Tesseract'ın ileri düzey bir çatallamasıdır, yalnızca .NET geliştiricileri için oluşturulmuş olup hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakmaktadır.

IronOcr.Languages.Tajik İçeriği

Bu paket, .NET için 40 OCR dili içerir:

  • Tacik
  • TacikBest
  • TacikFast

İndirme

Tacik Dil Paketi [тоҷикӣ]

Kurulum

İlk yapmamız gereken şey, .NET projenize Tacik OCR paketimizi yüklemektir.

Install-Package IronOcr.Languages.Tajik

Kod Örneği

Bu C# kod örneği, bir resim veya PDF belgesinden Tacik metni okur.

// Import the IronOcr namespace to use its functionality
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an instance of IronTesseract engine
        var Ocr = new IronTesseract();

        // Specify the language to use for OCR as Tajik
        Ocr.Language = OcrLanguage.Tajik;

        // Load the image file where the OCR is to be performed
        using (var Input = new OcrInput(@"images\Tajik.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Extract the text from the OCR result
            var AllText = Result.Text;

            // Output the text to the console
            Console.WriteLine(AllText);
        }
    }
}
// Import the IronOcr namespace to use its functionality
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an instance of IronTesseract engine
        var Ocr = new IronTesseract();

        // Specify the language to use for OCR as Tajik
        Ocr.Language = OcrLanguage.Tajik;

        // Load the image file where the OCR is to be performed
        using (var Input = new OcrInput(@"images\Tajik.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Extract the text from the OCR result
            var AllText = Result.Text;

            // Output the text to the console
            Console.WriteLine(AllText);
        }
    }
}
' Import the IronOcr namespace to use its functionality
Imports IronOcr

Friend Class Program
	Shared Sub Main()
		' Create an instance of IronTesseract engine
		Dim Ocr = New IronTesseract()

		' Specify the language to use for OCR as Tajik
		Ocr.Language = OcrLanguage.Tajik

		' Load the image file where the OCR is to be performed
		Using Input = New OcrInput("images\Tajik.png")
			' Perform OCR on the input image
			Dim Result = Ocr.Read(Input)

			' Extract the text from the OCR result
			Dim AllText = Result.Text

			' Output the text to the console
			Console.WriteLine(AllText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel
  • OCR işlevlerini kullanmak için IronTesseract örneğini oluşturun.
  • OCR'nin Tacik dilinde işlem yapması gerektiğini belirtmek için dil özelliğini OcrLanguage.Tajik olarak ayarlayın.
  • Metnin çıkarılması gereken girdi resmini yükleyin.
  • Ocr.Read yöntemi görüntüyü işler ve çıkarılan metni içeren sonucu döndürür.
  • Görüntüde tespit edilen tüm metni almak için sonucun Text özelliğine erişin.