Bengali OCR in C# and .NET
Bu belgenin diğer versiyonları:
IronOCR, C# yazılım bileşeni olarak, .NET kodlayıcılarının Bengali de dahil olmak üzere 126 dilde görüntülerden ve PDF belgelerinden metin okumasını sağlar. Tesseract'ın, yalnızca .NET geliştiricileri için özel olarak oluşturulmuş gelişmiş bir dalıdır ve hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakır.
IronOcr.Languages.Bengali İçeriği
Bu paket, .NET için 114 OCR dili içerir:
- Bengalce
- BengalceBest
- BengalceFast
- Bengalce Alfabe
- Bengalce AlfabeBest
- Bengalce AlfabeFast
İndir
Bengali Dil Paketi [Bangla]
Kurulum
Yapmamız gereken ilk şey, Bengalce OCR paketimizi .NET projenize yüklemektir.
Install-Package IronOcr.Languages.Bengali
Kod Örneği
Bu C# kod özdeği bir görüntü veya PDF belgesinden Bengalce metni okur.
// Import the IronOcr namespace
using IronOcr;
class BengaliOcrExample
{
static void Main()
{
// Create an instance of IronTesseract
var Ocr = new IronTesseract();
// Specify the language for OCR
Ocr.Language = OcrLanguage.Bengali;
// Process the image and extract text
using (var Input = new OcrInput(@"images\Bengali.png"))
{
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Get the extracted text
var AllText = Result.Text;
// Output the extracted text to the console
System.Console.WriteLine(AllText);
}
}
}
// Import the IronOcr namespace
using IronOcr;
class BengaliOcrExample
{
static void Main()
{
// Create an instance of IronTesseract
var Ocr = new IronTesseract();
// Specify the language for OCR
Ocr.Language = OcrLanguage.Bengali;
// Process the image and extract text
using (var Input = new OcrInput(@"images\Bengali.png"))
{
// Perform OCR on the input image
var Result = Ocr.Read(Input);
// Get the extracted text
var AllText = Result.Text;
// Output the extracted text to the console
System.Console.WriteLine(AllText);
}
}
}
' Import the IronOcr namespace
Imports IronOcr
Friend Class BengaliOcrExample
Shared Sub Main()
' Create an instance of IronTesseract
Dim Ocr = New IronTesseract()
' Specify the language for OCR
Ocr.Language = OcrLanguage.Bengali
' Process the image and extract text
Using Input = New OcrInput("images\Bengali.png")
' Perform OCR on the input image
Dim Result = Ocr.Read(Input)
' Get the extracted text
Dim AllText = Result.Text
' Output the extracted text to the console
System.Console.WriteLine(AllText)
End Using
End Sub
End Class
Açıklama
-
IronOCR'yi içe aktarın: OCR işlemlerini gerçekleştirmek için gerekli sınıfları ve yöntemleri içeren
IronOcrad alanını içe aktararak başlıyoruz. -
IronTesseract Örneği Oluşturma: OCR işlemini gerçekleştirmek için ana sınıf olan
IronTesseract'nin bir örneğini oluşturuyoruz. -
Dil Ayarı:
OcrLanguage.Bengalikullanarak OCR dilini Bengalce olarak ayarladık. -
OcrInput: Metin çıkartmak istediğimiz görüntünün yolunu belirtiyoruz. Giriş dosyasını yüklemek ve ön işlemden geçirmek için bir
OcrInputnesnesi kullanılır. -
Metni Okuma ve Çıkarma:
Readyöntemini kullanarak, metin içeriğini okumak için görüntüyü işliyoruz. MetinResult.Textdosyasında saklanmaktadır. - Metin Çıkışı: Son olarak, çıkartılan metni konsola yazdırarak çıktıyı doğruluyoruz.

