সি # এবং .নেটে বাংলা ওসিআর
এই দস্তাবেজের অন্যান্য সংস্করণ:
আয়রনসিআর হ'ল সি # সফটওয়্যার উপাদান যা নেট। কোডারদের বাংলা সহ 126 ভাষায় চিত্র এবং পিডিএফ নথি থেকে পাঠ্য পড়তে দেয়।
এটি টেস্টেরাক্টের একটি উন্নত কাঁটাচামচ, এটি কেবলমাত্র নেট নেট বিকাশকারীদের জন্য নির্মিত এবং গতি এবং যথার্থতার জন্য নিয়মিতভাবে অন্যান্য টেস্ট্রাক ইঞ্জিনকে ছাপিয়ে যায়।
আয়রনঅক.আর.ল্যাঙ্গোয়েজস.বাঙ্গালি এর সামগ্রীসমূহ
এই প্যাকেজে .NET এর জন্য 114 টি ওসিআর ভাষা রয়েছে:
- বাংলা
- বেঙ্গলিস্টে
- বেঙ্গলিফাস্ট
- বেঙ্গলিআলফেট
- বাংলাআলাভবেট বেস্ট
- বেঙ্গলিআল্ফবেটস্ট
ডাউনলোড করুন
বাংলা ভাষা প্যাক [বাংলা]
* Download as জিপ
* Install with as https://www.nuget.org/packages/IronOcr.Languages.Bengali/'> নিউগেট
স্থাপন
আমাদের প্রথমে আপনাকে আমাদের নেট ওজেট প্রকল্পে আমাদের বাংলা ওসিআর প্যাকেজ ইনস্টল করতে হবে।
PM> Install-Package IronOCR.Languages.Bengali
কোড উদাহরণ
এই সি # কোড উদাহরণটি কোনও চিত্র বা পিডিএফ ডকুমেন্ট থেকে বাংলা পাঠ্য পড়বে।
//PM> Install-Package IronOcr.Languages.Bengali
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"images\Bengali.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Bengali
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"images\Bengali.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Bengali
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput("images\Bengali.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
কেন আয়রনওসিআর বেছে নিন?
আয়রন ওসিআর হ'ল একটি ইনস্টল করা সহজ, সম্পূর্ণ এবং ডকুমেন্টেড। নেট সফটওয়্যার লাইব্রেরি।
কোনও বাহ্যিক ওয়েব পরিষেবাদি ব্যবহার না করে চলমান ফি বা ইন্টারনেটে গোপনীয় ডকুমেন্ট প্রেরণ না করে 99.8% + ওসিআর নির্ভুলতা অর্জনের জন্য আয়রনসিআরআর বেছে নিন।
কেন সি # বিকাশকারীরা ভ্যানিলা পরীক্ষার চেয়ে আয়রণ ওসিআর বেছে নেয়:
- একটি একক ডিএলএল বা নুগেট হিসাবে ইনস্টল করুন
- বাক্সের বাইরে 5, 4 এবং 3 ইঞ্জিনের জন্য অন্তর্ভুক্ত।
- নির্ভুলতা 99.8% নিয়মিত টেস্টেরাক্টকে উল্লেখযোগ্যভাবে ছাড়িয়ে যায়।
- জ্বলন্ত গতি এবং মাল্টিথ্রেডিং
- এমভিসি, ওয়েব অ্যাপ, ডেস্কটপ, কনসোল এবং সার্ভার অ্যাপ্লিকেশন সামঞ্জস্যপূর্ণ
- কাজ করার জন্য কোনও এক্সেস বা সি ++ কোড নেই
- সম্পূর্ণ পিডিএফ ওসিআর সমর্থন
- ওসিআর প্রায় কোনও চিত্র ফাইল বা পিডিএফ সম্পাদন করতে
- সম্পূর্ণ। নেট কোর, স্ট্যান্ডার্ড এবং ফ্রেম ওয়ার্ক সমর্থন
- উইন্ডোজ, ম্যাক, লিনাক্স, অ্যাজুরে, ডকার, ল্যাম্বদা, এডাব্লুএস-এ স্থাপন করুন
- বারকোড এবং কিউআর কোডগুলি পড়ুন
- এক্সসিএইচএমএল হিসাবে ওসিআর রফতানি করুন
- অনুসন্ধানযোগ্য পিডিএফ ডকুমেন্টগুলিতে ওসিআর রফতানি করুন
- মাল্টিথ্রেডিং সমর্থন
- 126 আন্তর্জাতিক ভাষা সবই নুগেট বা ওক্রাডাটা ফাইলের মাধ্যমে পরিচালিত
- চিত্র, স্থানাঙ্ক, পরিসংখ্যান এবং ফন্টগুলি বের করুন। শুধু পাঠ্য নয়।
- বাণিজ্যিক ও মালিকানাধীন অ্যাপ্লিকেশনগুলির মধ্যে পরীক্ষামূলক ওসিআর পুনরায় বিতরণ করতে ব্যবহার করা যেতে পারে।
আয়রন ওসিআর বাস্তব বিশ্বের চিত্র এবং অসম্পূর্ণ নথি যেমন ফটোগ্রাফ, বা লো রেজোলিউশনের স্ক্যানগুলির সাথে কাজ করার সময় জ্বলজ্বল করে যেখানে ডিজিটাল শব্দ বা অসম্পূর্ণতা থাকতে পারে।
.NET প্ল্যাটফর্মের জন্য অন্যান্য নিখরচায় ওসিআর লাইব্রেরি যেমন অন্যান্য। নেট টেসারেক্ট এপিআই এবং ওয়েব পরিষেবাদি এই বাস্তব বিশ্বের ব্যবহারের ক্ষেত্রে এত ভাল সম্পাদন করে না।
পরীক্ষামূলক 5 সহ ওসিআর - সি # তে কোডিং শুরু করুন
নীচের কোডের নমুনাটি দেখায় যে সি # বা ভিবি। নেট ব্যবহার করে কোনও চিত্র থেকে পাঠ্য পড়া কতটা সহজ।
এক রৈখিক
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
কনফিগার হ্যালো ওয়ার্ল্ড
// PM> Install-Package IronOCR.Languages.Bengali
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... আপনি যে কোনও সংখ্যা যুক্ত করতে পারেন
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Bengali
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... আপনি যে কোনও সংখ্যা যুক্ত করতে পারেন
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Bengali
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
সি # পিডিএফ ওসিআর
একই পদ্ধতির অনুরূপভাবে কোনও পিডিএফ ডকুমেন্ট থেকে পাঠ্য নিষ্কাশন করতে ব্যবহার করা যেতে পারে।
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// আমরা ওসিআর-তে নির্দিষ্ট পিডিএফ পৃষ্ঠার নাম্বারও নির্বাচন করতে পারি
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// পিডিএফ প্রতি পৃষ্ঠার জন্য 1 পৃষ্ঠা
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// আমরা ওসিআর-তে নির্দিষ্ট পিডিএফ পৃষ্ঠার নাম্বারও নির্বাচন করতে পারি
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// পিডিএফ প্রতি পৃষ্ঠার জন্য 1 পৃষ্ঠা
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' আমরা ওসিআর-তে নির্দিষ্ট পিডিএফ পৃষ্ঠার নাম্বারও নির্বাচন করতে পারি
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' পিডিএফ প্রতি পৃষ্ঠার জন্য 1 পৃষ্ঠা
End Using
মাল্টিপেজ টিআইএফএফগুলির জন্য ওসিআর
ওসিআর পড়া টিআইএফএফ ফাইল ফর্ম্যাট একাধিক পৃষ্ঠার ডকুমেন্ট সহ। টিআইএফএফ অনুসন্ধানযোগ্য পাঠ্য সহ সরাসরি পিডিএফ ফাইলে রূপান্তর করা যায়।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
বারকোডস এবং কিউআর
আয়রণ ওসিআরের একটি অনন্য বৈশিষ্ট্য এটি পাঠ্যের জন্য স্ক্যান করার সময় নথিগুলি থেকে বারকোড এবং কিউআর কোডগুলি পড়তে পারে। OcrResult.OcrBarcode
ক্লাসের উদাহরণগুলি বিকাশকারীকে প্রতিটি স্ক্যান করা বারকোড সম্পর্কে বিশদ তথ্য দেয়।
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// প্রকার এবং অবস্থানের বৈশিষ্ট্যগুলিও উন্মুক্ত
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// প্রকার এবং অবস্থানের বৈশিষ্ট্যগুলিও উন্মুক্ত
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' প্রকার এবং অবস্থানের বৈশিষ্ট্যগুলিও উন্মুক্ত
Next Barcode
End Using
চিত্রগুলির নির্দিষ্ট অঞ্চলগুলিতে ওসিআর
আয়রন ওসিআরের সমস্ত স্ক্যানিং এবং পড়ার পদ্ধতিগুলি কোনও পৃষ্ঠা বা পৃষ্ঠাগুলির ঠিক কোন অংশ থেকে আমরা পাঠ্যটি পড়তে চাই তা নির্দিষ্ট করে দেওয়ার ক্ষমতা সরবরাহ করে। এটি যখন খুব কার্যকর হয় যখন আমরা প্রমিত মানের ফর্মগুলির দিকে চেয়ে থাকি এবং প্রচুর সময় সাশ্রয় করতে এবং দক্ষতা উন্নত করতে পারি।
ফসল অঞ্চলে ব্যবহার করার জন্য, আমরা একটি সিস্টেম রেফারেন্স যোগ করার জন্য প্রয়োজন হবে System.Drawing
যাতে আমরা ব্যবহার করতে পারেন System.Drawing.Rectangle
অবজেক্ট।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// মাত্রা px এ রয়েছে
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// মাত্রা px এ রয়েছে
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' মাত্রা px এ রয়েছে
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
নিম্নমানের স্ক্যানগুলির জন্য ওসিআর
আয়রন ওসিআর OcrInput
শ্রেণি সাধারণ OcrInput
পড়তে পারে না এমন স্ক্যানগুলি ঠিক করতে পারে।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
Input.Deskew(); // ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
Input.Deskew(); // ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
Input.Deskew() ' ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
অনুসন্ধানযোগ্য পিডিএফ হিসাবে ওসিআর ফলাফল রফতানি করুন
অনুলিপিযোগ্য পাঠ্য স্ট্রিং সহ পিডিএমে চিত্র অনুসন্ধান ইঞ্জিন এবং ডেটাবেস দ্বারা সূচকযুক্ত হতে পারে।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")
Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
টিআইএফএফ পিডিএফ রূপান্তর অনুসন্ধানযোগ্য
একটি অনুসন্ধানযোগ্য পিডিএফ-তে একটি টিআইএফএফ ডকুমেন্ট (বা চিত্র ফাইলগুলির কোনও গ্রুপ) রূপান্তর করুন যা ইন্ট্রানেট, ওয়েবসাইট এবং গুগল অনুসন্ধান ইঞ্জিন দ্বারা সূচিযুক্ত করা যেতে পারে।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
এইচটিএমএল হিসাবে ওসিআর ফলাফল রফতানি করুন
ওসিআর চিত্রটি এক্সএইচটিএমএল রূপান্তরতে।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
ওসিআর চিত্র বর্ধন ফিল্টার
আয়রণ ওসিআর ওসিআর এর কার্যকারিতা উন্নত করতে ওসিআর OcrInput
অবজেক্টের জন্য অনন্য ফিল্টার সরবরাহ করে।
চিত্র বর্ধন কোড উদাহরণ
ওসিআর ইনপুট চিত্রগুলিকে আরও ভাল, দ্রুত ওসিআর ফলাফল উত্পাদন করতে উচ্চতর মানের করে তোলে।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
Input.Deskew(); // ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
Input.Deskew(); // ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
Input.Deskew() ' ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ওসিআর চিত্র ফিল্টারগুলির তালিকা
ওসিআর পারফরম্যান্স বাড়ানোর জন্য ইনপুট ফিল্টারগুলি যা আয়রণ ওসিআর-এ অন্তর্নির্মিত রয়েছে সেগুলির মধ্যে রয়েছে:
- OcrInput.Rotate (ডাবল ডিগ্রি) - ঘড়ির কাঁটার দিকে কয়েকটি ডিগ্রি দ্বারা চিত্রগুলি ঘোরান । অ্যান্টি-ক্লকওয়াইজ জন্য, নেতিবাচক সংখ্যা ব্যবহার করুন।
- OcrInput.Binarize () - এই চিত্র ফিল্টারটি মাঝারি স্থলবিহীন প্রতিটি পিক্সেলকে কালো বা সাদা করে। ব্যাকগ্রাউন্ডে পাঠ্যের খুব কম বিপরীতে ওসিআর পারফরম্যান্সের ক্ষেত্রে উন্নতি করতে পারে।
- ওসিআরআইনপুট.টোগ্রেস্কেল () - এই চিত্র ফিল্টারটি প্রতিটি পিক্সেলকে গ্রেস্কেলের ছায়ায় পরিণত করে। ওসিআর নির্ভুলতা উন্নত করা অসম্ভব তবে গতি উন্নতি করতে পারে
- ওসিআরআইনপুট.কন্ট্রাস্ট () - স্বয়ংক্রিয়ভাবে বৈপরীত্য বৃদ্ধি করে। এই ফিল্টারটি প্রায়শই কম বিপরীতে স্ক্যানগুলিতে ওসিআর গতি এবং নির্ভুলতার উন্নতি করে।
- OcrInput.DeNoise () - ডিজিটাল গোলমাল সরিয়ে দেয়। এই ফিল্টারটি কেবল তখনই ব্যবহার করা উচিত যেখানে শব্দটি আশা করা যায়।
- ওসিআরআইনপুট.ইনভার্ট () - প্রতিটি রঙ উল্টে দেয়। যেমন সাদা কালো হয়: কালো সাদা হয় white
- ওসিআরআইনপুট.ডিলিট () - উন্নত রূপচর্চা । প্রসারণ একটি চিত্র বস্তু সীমানা পিক্সেল যোগ করা হয়েছে। এরোডের বিপরীতে
- OcrInput.Erode () - অ্যাডভান্সড মরফোলজি । ক্ষয়টি বস্তুর সীমানায় পিক্সেলগুলি সরায় ilate
- ওসিআরআইনপুট.ডেস্কিউ () - একটি চিত্র ঘোরান যাতে এটি সঠিক উপায়ে এবং অর্থোথোনাল হয়। এটি ওসিআরের পক্ষে খুব কার্যকর কারণ স্কিউ স্ক্যানগুলির পরীক্ষার সহনশীলতা 5 ডিগ্রি হিসাবে কম হতে পারে।
- ওসিআরআইনপুট.ডিপক্লেইনব্যাকগ্রাউন্ডনোইস () - ভারী পটভূমি শব্দের অপসারণ। চূড়ান্ত নথির পটভূমির গোলমাল জানা থাকলে কেবলমাত্র এই ফিল্টারটি ব্যবহার করুন, কারণ এই ফিল্টারটি পরিষ্কার নথিগুলির ওসিআর যথার্থতা হ্রাস করার ঝুঁকিপূর্ণ করবে এবং এটি খুব সিপিইউ ব্যয়বহুল।
- OcRInput.EnhanceResolution - নিম্নমানের চিত্রগুলির রেজোলিউশন বাড়ায়। এই ফিল্টারটি প্রায়শই প্রয়োজন হয় না কারণ ওসিআরআনপুট.নিমামডিপিআই এবং ওসিআরআইনপুট. টার্গেটডিপিআই স্বয়ংক্রিয়ভাবে কম রেজোলিউশন ইনপুটগুলি ধরা ও সমাধান করবে।
ক্লিনব্যাকগ্রাউন্ডনিউজ এটি এমন একটি সেটিং যা কিছুটা সময়সাপেক্ষ; তবে এটি গ্রন্থাগারটি ডিজিটাল চিত্রের মধ্যে স্বয়ংক্রিয়ভাবে ডিজিটাল শব্দ, কাগজ crumples এবং অন্যান্য অপূর্ণতা পরিষ্কার করার অনুমতি দেয় যা অন্যথায় এটি অন্যান্য ওসিআর লাইব্রেরি দ্বারা পঠনযোগ্যভাবে অক্ষম করে তোলে।
এনহান্সকন্ট্রাস্ট এমন একটি সেটিংস যা আয়রন ওসিআরকে স্বয়ংক্রিয়ভাবে কোনও চিত্রের পটভূমির বিপরীতে পাঠ্যের বৈসাদৃশ্য বাড়িয়ে তোলে, ওসিআরের যথার্থতা বৃদ্ধি করে এবং সাধারনত কর্মক্ষমতা এবং ওসিআরের গতি বাড়িয়ে তোলে।
এনহানসারেসোলিউশন এমন একটি সেটিংস যা স্বল্প-রেজোলিউশন চিত্রগুলি (যা ২ which৫ ডিপিআই এর নীচে রয়েছে) সনাক্ত করে এবং স্বয়ংক্রিয়ভাবে চিত্রটিকে উপগ্রহ করবে এবং তারপরে সমস্ত পাঠ্যকে তীক্ষ্ণ করবে যাতে এটি ওসিআর লাইব্রেরি দ্বারা নিখুঁতভাবে পড়তে পারে। যদিও এই অপারেশনটি নিজে সময় সাশ্রয়ী, তবে এটি সাধারণত কোনও চিত্রের ওসিআর অপারেশনের সামগ্রিক সময় হ্রাস করে।
ভাষা আয়রন ওসিআর 22 টি আন্তর্জাতিক ভাষার প্যাকগুলি সমর্থন করে এবং ওসিআর ক্রিয়াকলাপের জন্য প্রয়োগ করতে এক বা একাধিক ভাষা নির্বাচন করতে ভাষা সেটিংটি ব্যবহার করা যেতে পারে।
কৌশল আয়রন ওসিআর দুটি কৌশল সমর্থন করে। আমরা হয় কোনও ডকুমেন্টের দ্রুত এবং কম নির্ভুল স্ক্যানের জন্য যেতে পছন্দ করতে পারি, বা একটি বাক্যটিতে একে অপরের সাথে শব্দের পরিসংখ্যানগত সম্পর্ক দেখে স্বয়ংক্রিয়ভাবে ওসিআর পাঠ্যের যথার্থতা উন্নত করতে কিছু কৃত্রিম বুদ্ধিমত্তার মডেল ব্যবহার করে এমন একটি উন্নত কৌশল ব্যবহার করতে পারি ।
কালারস্পেস এমন একটি সেটিংস যার মাধ্যমে আমরা গ্রেস্কেল বা রঙে ওসিআর বেছে নিতে পারি। সাধারণত, গ্রেস্কেল সেরা বিকল্প is যাইহোক, কখনও কখনও যখন একই বর্ণের বর্ণ বা খুব পৃথক বর্ণের পটভূমি থাকে তবে একটি পূর্ণ বর্ণের বর্ণের স্থান আরও ভাল ফলাফল সরবরাহ করে।
হোয়াইটটেক্সটঅন ডার্কব্যাকগ্রাউন্ডগুলি সনাক্ত করুন। সাধারণত, সমস্ত ওসিআর লাইব্রেরি সাদা পটভূমিতে কালো পাঠ্য দেখতে আশা করে। এই সেটিংটি আয়রণ ওসিআরটিকে স্বয়ংক্রিয়ভাবে নেতিবাচক বা সাদা পাঠ্যযুক্ত গা dark় পৃষ্ঠাগুলি সনাক্ত করতে এবং সেগুলি পড়তে দেয়।
ইনপুটআইমেজটাইপ। এই সেটিংটি বিকাশকারীকে ওসিআর লাইব্রেরিটিকে কোনও সম্পূর্ণ ডকুমেন্ট বা স্নিপেটের মতো স্ক্রিনশটের দিকে তাকিয়ে আছে কিনা তা গাইড করার অনুমতি দেয়।
রোটেটএন্ডট্রেইন একটি উন্নত সেটিং যা আয়রন ওসিআরকে নথিগুলি যা কেবল ঘোরানো হয় না তা পড়ার অনন্য ক্ষমতা দেয় তবে সম্ভবত পাঠ্য নথির ফটোগ্রাফ যেমন দৃষ্টিকোণ ধারণ করে।
রিডবাকোডগুলি একটি দরকারী বৈশিষ্ট্য যা আয়রন ওসিআরকে স্বয়ংক্রিয়ভাবে পৃষ্ঠাগুলিতে বারকোড এবং কিউআর কোডগুলি পাঠ্য পড়ায়, অতিরিক্ত অতিরিক্ত সময়ের বোঝা যুক্ত না করে পড়তে দেয় allows
রঙের ঘনত্ব. কোনও রঙের গভীরতা নির্ধারণ করতে ওসিআর গ্রন্থাগার পিক্সেলটিতে কত বিট ব্যবহার করবে তা এই সেটিংটি নির্ধারণ করে। একটি উচ্চতর রঙের গভীরতা ওসিআর গুণমান বাড়িয়ে তুলতে পারে, তবে ওসিআর অপারেশনটি সম্পূর্ণ হওয়ার জন্য প্রয়োজনীয় সময়ও বাড়িয়ে তুলবে।
126 টি ভাষা প্যাক
আয়রন ওসিআর 126 আন্তর্জাতিক ভাষাগুলিকে ভাষা প্যাকগুলির মাধ্যমে সমর্থন করে যা ডিএলএল হিসাবে বিতরণ করা হয়, যা এই ওয়েবসাইট থেকে বা নিউগেট প্যাকেজ ম্যানেজার থেকে ডাউনলোড করা যায় ।
ভাষাগুলির মধ্যে জার্মান, ফরাসী, ইংরেজি, চীনা, জাপানি এবং আরও অনেক কিছু রয়েছে। পাসপোর্ট এমআরজেড, এমআইসিআর চেকস, ফিনান্সিয়াল ডেটা, লাইসেন্স প্লেট এবং আরও অনেক কিছুর জন্য বিশেষজ্ঞ ভাষার প্যাকগুলি বিদ্যমান। আপনি নিজের তৈরির মতো যেকোনও "টেস্ট্রেনডেটা" ফাইলও ব্যবহার করতে পারেন।
ভাষার উদাহরণ
অন্যান্য ওসিআর ভাষা ব্যবহার করা।
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// প্রয়োজনে চিত্র ফিল্টার যুক্ত করুন
// এই ক্ষেত্রে, এমনকি ভাবা ইনপুট খুব নিম্ন মানের
// আয়রনটেসারেক্ট পড়তে পারে যা প্রচলিত টেসারেক্ট না পারে।
var Result = Ocr.Read(input);
// কনসোল উইন্ডোজে সহজে আরবি মুদ্রণ করতে পারে না।
// পরিবর্তে ডিস্কে সংরক্ষণ করুন।
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// প্রয়োজনে চিত্র ফিল্টার যুক্ত করুন
// এই ক্ষেত্রে, এমনকি ভাবা ইনপুট খুব নিম্ন মানের
// আয়রনটেসারেক্ট পড়তে পারে যা প্রচলিত টেসারেক্ট না পারে।
var Result = Ocr.Read(input);
// কনসোল উইন্ডোজে সহজে আরবি মুদ্রণ করতে পারে না।
// পরিবর্তে ডিস্কে সংরক্ষণ করুন।
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' প্রয়োজনে চিত্র ফিল্টার যুক্ত করুন
' এই ক্ষেত্রে, এমনকি ভাবা ইনপুট খুব নিম্ন মানের
' আয়রনটেসারেক্ট পড়তে পারে যা প্রচলিত টেসারেক্ট না পারে।
Dim Result = Ocr.Read(input)
' কনসোল উইন্ডোজে সহজে আরবি মুদ্রণ করতে পারে না।
' পরিবর্তে ডিস্কে সংরক্ষণ করুন।
Result.SaveAsTextFile("arabic.txt")
End Using
একাধিক ভাষার উদাহরণ
ওসিআর একই সাথে একাধিক ভাষা ব্যবহার করাও সম্ভব। এটি ইউনিকোড ডকুমেন্টগুলিতে ইংরেজি ভাষার মেটাডেটা এবং url পেতে সত্যই সহায়তা করতে পারে।
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Bengali);
// আমরা যে কোনও সংখ্যক ভাষা যুক্ত করতে পারি
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Bengali);
// আমরা যে কোনও সংখ্যক ভাষা যুক্ত করতে পারি
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Bengali)
' আমরা যে কোনও সংখ্যক ভাষা যুক্ত করতে পারি
Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
বিস্তারিত ওসিআর ফলাফল অবজেক্টস
আয়রন ওসিআর প্রতিটি ওসিআর ক্রিয়াকলাপের জন্য একটি ওসিআর ফলাফল অবজেক্ট দেয়। সাধারণত, বিকাশকারীরা চিত্র থেকে টেক্সট স্ক্যান করতে কেবল এই বস্তুর পাঠ্য সম্পত্তি ব্যবহার করে। তবে ওসিআর ফলাফল ডিওএম এর চেয়ে অনেক বেশি উন্নত।
using IronOcr;
using System.Drawing; //বিধানসভা রেফারেন্স যুক্ত করুন
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //গুরুত্বপূর্ণ!
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// একটি বিশাল, বিস্তারিত এপিআই খুঁজে পেতে এখানে অন্বেষণ করুন:
// - পৃষ্ঠা, ব্লক, প্যারাফ্যাফস, লাইন, শব্দ, অক্ষর
// - চিত্র রফতানি, ফন্টের সমন্বয়, পরিসংখ্যানের ডেটা
}
using IronOcr;
using System.Drawing; //বিধানসভা রেফারেন্স যুক্ত করুন
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //গুরুত্বপূর্ণ!
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// একটি বিশাল, বিস্তারিত এপিআই খুঁজে পেতে এখানে অন্বেষণ করুন:
// - পৃষ্ঠা, ব্লক, প্যারাফ্যাফস, লাইন, শব্দ, অক্ষর
// - চিত্র রফতানি, ফন্টের সমন্বয়, পরিসংখ্যানের ডেটা
}
Imports IronOcr
Imports System.Drawing 'বিধানসভা রেফারেন্স যুক্ত করুন
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'গুরুত্বপূর্ণ!
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' একটি বিশাল, বিস্তারিত এপিআই খুঁজে পেতে এখানে অন্বেষণ করুন:
' - পৃষ্ঠা, ব্লক, প্যারাফ্যাফস, লাইন, শব্দ, অক্ষর
' - চিত্র রফতানি, ফন্টের সমন্বয়, পরিসংখ্যানের ডেটা
End Using
কর্মক্ষমতা
আয়রণ ওসিআর বক্সের বাইরে পারফরম্যান্স টিউন বা ভারী ইনপুট চিত্রগুলি পরিবর্তন করার প্রয়োজন নেই no
গতি জ্বলছে: আয়রনঅক্রি .2020 + 10 গুণ বেশি দ্রুত এবং পূর্ববর্তী বিল্ডগুলির তুলনায় 250% এরও কম ত্রুটি করে।
আরও জানুন
সি #, ভিবি, এফ #, বা অন্য কোনও নেট নেট ভাষায় ওসিআর সম্পর্কে আরও জানতে, দয়া করে আমাদের সম্প্রদায়ের টিউটোরিয়ালগুলি পড়ুন , যা আয়রন ওসিআর কীভাবে ব্যবহার করা যায় তার বাস্তব বিশ্বের উদাহরণ দেয় এবং কীভাবে সর্বোত্তমভাবে বেরোতে পারে তার সংক্ষিপ্তসারগুলি দেখায় এই গ্রন্থাগার
.NET বিকাশকারীদের জন্য একটি সম্পূর্ণ অবজেক্ট রেফারেন্স উপলব্ধ।