Bengali OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Bu belgenin diğer versiyonları:

IronOCR, 126 dilde, Bengalce de dahil olmak üzere, .NET kodlayıcılarının görüntülerden ve PDF belgelerinden metin okumasına olanak tanıyan bir C# yazılım bileşenidir. Tesseract'ın ileri düzey bir çatallamasıdır, yalnızca .NET geliştiricileri için oluşturulmuş olup hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakmaktadır.

IronOcr.Languages.Bengali içeriği

Bu paket, .NET için 114 OCR dilini içerir:

  • Bengalce
  • Bengalce En İyi
  • Bengalce Hızlı
  • Bengalce Alfabe
  • Bengalce Alfabe En İyi
  • Bengalce Alfabe Hızlı

İndirme

Bengalce Dil Paketi [Bangla]

Kurulum

İlk yapmamız gereken, .NET projenize Bengalce OCR paketimizi yüklemektir.

Install-Package IronOcr.Languages.Bengali

Kod Örneği

Bu C# kod örneği, bir görüntüden veya PDF belgesinden Bengalce metni okur.

// Import the IronOcr namespace
using IronOcr;

class BengaliOcrExample
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();

        // Specify the language for OCR
        Ocr.Language = OcrLanguage.Bengali;

        // Process the image and extract text
        using (var Input = new OcrInput(@"images\Bengali.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Get the extracted text
            var AllText = Result.Text;

            // Output the extracted text to the console
            System.Console.WriteLine(AllText);
        }
    }
}
// Import the IronOcr namespace
using IronOcr;

class BengaliOcrExample
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();

        // Specify the language for OCR
        Ocr.Language = OcrLanguage.Bengali;

        // Process the image and extract text
        using (var Input = new OcrInput(@"images\Bengali.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Get the extracted text
            var AllText = Result.Text;

            // Output the extracted text to the console
            System.Console.WriteLine(AllText);
        }
    }
}
' Import the IronOcr namespace
Imports IronOcr

Friend Class BengaliOcrExample
	Shared Sub Main()
		' Create an instance of IronTesseract
		Dim Ocr = New IronTesseract()

		' Specify the language for OCR
		Ocr.Language = OcrLanguage.Bengali

		' Process the image and extract text
		Using Input = New OcrInput("images\Bengali.png")
			' Perform OCR on the input image
			Dim Result = Ocr.Read(Input)

			' Get the extracted text
			Dim AllText = Result.Text

			' Output the extracted text to the console
			System.Console.WriteLine(AllText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Açıklama

  1. IronOcr'i Ithal Edin: OCR işlemlerini gerceklestirmek icin gerekli siniflar ve metodlari iceren IronOcr ad alanini ithal ederek basliyoruz.

  2. IronTesseract Ornegi Oluşturun: OCR işlemlerini gerceklestirmek icin ana sınıf olan IronTesseract'nin bir ornegini oluşturuyoruz.

  3. Dili Ayarlayin: OcrLanguage.Bengali kullanarak OCR dilini Bengalce olarak ayarliyoruz.

  4. OcrInput: Üzerinde metin çıkarmak istediğimiz görüntünün yolunu belirtiyoruz. OcrInput nesnesi giris dosyasini yuklemek ve on işleme tabi tutmak icin kullanilir.

  5. Metni Oku ve Cikar: Read metodunu kullanarak, metin icerigini okumak icin resmi isliyoruz. Metin Result.Text'da saklanir.

  6. Metni Çıktı Al: Son olarak, çıkarılan metni doğrulamak için konsola yazdırıyoruz.