Bengali OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Bu belgenin diğer versiyonları:

IronOCR, C# yazılım bileşeni olarak, .NET kodlayıcılarının Bengali de dahil olmak üzere 126 dilde görüntülerden ve PDF belgelerinden metin okumasını sağlar. Tesseract'ın, yalnızca .NET geliştiricileri için özel olarak oluşturulmuş gelişmiş bir dalıdır ve hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakır.

IronOcr.Languages.Bengali İçeriği

Bu paket, .NET için 114 OCR dili içerir:

  • Bengalce
  • BengalceBest
  • BengalceFast
  • Bengalce Alfabe
  • Bengalce AlfabeBest
  • Bengalce AlfabeFast

İndir

Bengali Dil Paketi [Bangla]

Kurulum

Yapmamız gereken ilk şey, Bengalce OCR paketimizi .NET projenize yüklemektir.

Install-Package IronOcr.Languages.Bengali

Kod Örneği

Bu C# kod özdeği bir görüntü veya PDF belgesinden Bengalce metni okur.

// Import the IronOcr namespace
using IronOcr;

class BengaliOcrExample
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();

        // Specify the language for OCR
        Ocr.Language = OcrLanguage.Bengali;

        // Process the image and extract text
        using (var Input = new OcrInput(@"images\Bengali.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Get the extracted text
            var AllText = Result.Text;

            // Output the extracted text to the console
            System.Console.WriteLine(AllText);
        }
    }
}
// Import the IronOcr namespace
using IronOcr;

class BengaliOcrExample
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();

        // Specify the language for OCR
        Ocr.Language = OcrLanguage.Bengali;

        // Process the image and extract text
        using (var Input = new OcrInput(@"images\Bengali.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Get the extracted text
            var AllText = Result.Text;

            // Output the extracted text to the console
            System.Console.WriteLine(AllText);
        }
    }
}
' Import the IronOcr namespace
Imports IronOcr

Friend Class BengaliOcrExample
	Shared Sub Main()
		' Create an instance of IronTesseract
		Dim Ocr = New IronTesseract()

		' Specify the language for OCR
		Ocr.Language = OcrLanguage.Bengali

		' Process the image and extract text
		Using Input = New OcrInput("images\Bengali.png")
			' Perform OCR on the input image
			Dim Result = Ocr.Read(Input)

			' Get the extracted text
			Dim AllText = Result.Text

			' Output the extracted text to the console
			System.Console.WriteLine(AllText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Açıklama

  1. IronOCR'yi içe aktarın: OCR işlemlerini gerçekleştirmek için gerekli sınıfları ve yöntemleri içeren IronOcr ad alanını içe aktararak başlıyoruz.

  2. IronTesseract Örneği Oluşturma: OCR işlemini gerçekleştirmek için ana sınıf olan IronTesseract'nin bir örneğini oluşturuyoruz.

  3. Dil Ayarı: OcrLanguage.Bengali kullanarak OCR dilini Bengalce olarak ayarladık.

  4. OcrInput: Metin çıkartmak istediğimiz görüntünün yolunu belirtiyoruz. Giriş dosyasını yüklemek ve ön işlemden geçirmek için bir OcrInput nesnesi kullanılır.

  5. Metni Okuma ve Çıkarma: Read yöntemini kullanarak, metin içeriğini okumak için görüntüyü işliyoruz. Metin Result.Text dosyasında saklanmaktadır.

  6. Metin Çıkışı: Son olarak, çıkartılan metni konsola yazdırarak çıktıyı doğruluyoruz.