Bengali OCR in C# and .NET
Bu belgenin diğer versiyonları:
IronOCR, 126 dilde, Bengalce de dahil olmak üzere, .NET kodlayıcılarının görüntülerden ve PDF belgelerinden metin okumasına olanak tanıyan bir C# yazılım bileşenidir. Tesseract'ın ileri düzey bir çatallamasıdır, yalnızca .NET geliştiricileri için oluşturulmuş olup hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakmaktadır.
IronOcr.Languages.Bengali içeriği
Bu paket, .NET için 114 OCR dilini içerir:
- Bengalce
- Bengalce En İyi
- Bengalce Hızlı
- Bengalce Alfabe
- Bengalce Alfabe En İyi
- Bengalce Alfabe Hızlı
İndirme
Bengalce Dil Paketi [Bangla]
Kurulum
İlk yapmamız gereken, .NET projenize Bengalce OCR paketimizi yüklemektir.
Install-Package IronOcr.Languages.Bengali
Kod Örneği
Bu C# kod örneği, bir görüntüden veya PDF belgesinden Bengalce metni okur.
// Import the IronOcr namespace
using IronOcr;
class BengaliOcrExample
{
static void Main()
{
// Create an instance of IronTesseract
var Ocr = new IronTesseract();
// Specify the language for OCR
Ocr.Language = OcrLanguage.Bengali;
// Process the image and extract text
using (var Input = new OcrInput(@"images\Bengali.png"))
{
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Get the extracted text
var AllText = Result.Text;
// Output the extracted text to the console
System.Console.WriteLine(AllText);
}
}
}
// Import the IronOcr namespace
using IronOcr;
class BengaliOcrExample
{
static void Main()
{
// Create an instance of IronTesseract
var Ocr = new IronTesseract();
// Specify the language for OCR
Ocr.Language = OcrLanguage.Bengali;
// Process the image and extract text
using (var Input = new OcrInput(@"images\Bengali.png"))
{
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Get the extracted text
var AllText = Result.Text;
// Output the extracted text to the console
System.Console.WriteLine(AllText);
}
}
}
' Import the IronOcr namespace
Imports IronOcr
Friend Class BengaliOcrExample
Shared Sub Main()
' Create an instance of IronTesseract
Dim Ocr = New IronTesseract()
' Specify the language for OCR
Ocr.Language = OcrLanguage.Bengali
' Process the image and extract text
Using Input = New OcrInput("images\Bengali.png")
' Perform OCR on the input image
Dim Result = Ocr.Read(Input)
' Get the extracted text
Dim AllText = Result.Text
' Output the extracted text to the console
System.Console.WriteLine(AllText)
End Using
End Sub
End Class
Açıklama
-
IronOcr'i Ithal Edin: OCR işlemlerini gerceklestirmek icin gerekli siniflar ve metodlari iceren
IronOcrad alanini ithal ederek basliyoruz. -
IronTesseract Ornegi Oluşturun: OCR işlemlerini gerceklestirmek icin ana sınıf olan
IronTesseract'nin bir ornegini oluşturuyoruz. -
Dili Ayarlayin:
OcrLanguage.Bengalikullanarak OCR dilini Bengalce olarak ayarliyoruz. -
OcrInput: Üzerinde metin çıkarmak istediğimiz görüntünün yolunu belirtiyoruz.
OcrInputnesnesi giris dosyasini yuklemek ve on işleme tabi tutmak icin kullanilir. -
Metni Oku ve Cikar:
Readmetodunu kullanarak, metin icerigini okumak icin resmi isliyoruz. MetinResult.Text'da saklanir. - Metni Çıktı Al: Son olarak, çıkarılan metni doğrulamak için konsola yazdırıyoruz.

