সি # এবং .নেটে বাংলা ওসিআর

এই দস্তাবেজের অন্যান্য সংস্করণ:

আয়রনসিআর হ'ল সি # সফটওয়্যার উপাদান যা নেট। কোডারদের বাংলা সহ 126 ভাষায় চিত্র এবং পিডিএফ নথি থেকে পাঠ্য পড়তে দেয়।

এটি টেস্টেরাক্টের একটি উন্নত কাঁটাচামচ, এটি কেবলমাত্র নেট নেট বিকাশকারীদের জন্য নির্মিত এবং গতি এবং যথার্থতার জন্য নিয়মিতভাবে অন্যান্য টেস্ট্রাক ইঞ্জিনকে ছাপিয়ে যায়।

আয়রনঅক.আর.ল্যাঙ্গোয়েজস.বাঙ্গালি এর সামগ্রীসমূহ

এই প্যাকেজে .NET এর জন্য 114 টি ওসিআর ভাষা রয়েছে:

  • বাংলা
  • বেঙ্গলিস্টে
  • বেঙ্গলিফাস্ট
  • বেঙ্গলিআলফেট
  • বাংলাআলাভবেট বেস্ট
  • বেঙ্গলিআল্ফবেটস্ট

ডাউনলোড করুন

বাংলা ভাষা প্যাক [বাংলা]
* Download as জিপ
* Install with as
https://www.nuget.org/packages/IronOcr.Languages.Bengali/'> নিউগেট

স্থাপন

আমাদের প্রথমে আপনাকে আমাদের নেট ওজেট প্রকল্পে আমাদের বাংলা ওসিআর প্যাকেজ ইনস্টল করতে হবে।

PM> Install-Package IronOCR.Languages.Bengali

কোড উদাহরণ

এই সি # কোড উদাহরণটি কোনও চিত্র বা পিডিএফ ডকুমেন্ট থেকে বাংলা পাঠ্য পড়বে।

//PM> Install-Package IronOcr.Languages.Bengali
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"images\Bengali.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Bengali
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"images\Bengali.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Bengali
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput("images\Bengali.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

কেন আয়রনওসিআর বেছে নিন?

আয়রন ওসিআর হ'ল একটি ইনস্টল করা সহজ, সম্পূর্ণ এবং ডকুমেন্টেড। নেট সফটওয়্যার লাইব্রেরি।

কোনও বাহ্যিক ওয়েব পরিষেবাদি ব্যবহার না করে চলমান ফি বা ইন্টারনেটে গোপনীয় ডকুমেন্ট প্রেরণ না করে 99.8% + ওসিআর নির্ভুলতা অর্জনের জন্য আয়রনসিআরআর বেছে নিন।

কেন সি # বিকাশকারীরা ভ্যানিলা পরীক্ষার চেয়ে আয়রণ ওসিআর বেছে নেয়:

  • একটি একক ডিএলএল বা নুগেট হিসাবে ইনস্টল করুন
  • বাক্সের বাইরে 5, 4 এবং 3 ইঞ্জিনের জন্য অন্তর্ভুক্ত।
  • নির্ভুলতা 99.8% নিয়মিত টেস্টেরাক্টকে উল্লেখযোগ্যভাবে ছাড়িয়ে যায়।
  • জ্বলন্ত গতি এবং মাল্টিথ্রেডিং
  • এমভিসি, ওয়েব অ্যাপ, ডেস্কটপ, কনসোল এবং সার্ভার অ্যাপ্লিকেশন সামঞ্জস্যপূর্ণ
  • কাজ করার জন্য কোনও এক্সেস বা সি ++ কোড নেই
  • সম্পূর্ণ পিডিএফ ওসিআর সমর্থন
  • ওসিআর প্রায় কোনও চিত্র ফাইল বা পিডিএফ সম্পাদন করতে
  • সম্পূর্ণ। নেট কোর, স্ট্যান্ডার্ড এবং ফ্রেম ওয়ার্ক সমর্থন
  • উইন্ডোজ, ম্যাক, লিনাক্স, অ্যাজুরে, ডকার, ল্যাম্বদা, এডাব্লুএস-এ স্থাপন করুন
  • বারকোড এবং কিউআর কোডগুলি পড়ুন
  • এক্সসিএইচএমএল হিসাবে ওসিআর রফতানি করুন
  • অনুসন্ধানযোগ্য পিডিএফ ডকুমেন্টগুলিতে ওসিআর রফতানি করুন
  • মাল্টিথ্রেডিং সমর্থন
  • 126 আন্তর্জাতিক ভাষা সবই নুগেট বা ওক্রাডাটা ফাইলের মাধ্যমে পরিচালিত
  • চিত্র, স্থানাঙ্ক, পরিসংখ্যান এবং ফন্টগুলি বের করুন। শুধু পাঠ্য নয়।
  • বাণিজ্যিক ও মালিকানাধীন অ্যাপ্লিকেশনগুলির মধ্যে পরীক্ষামূলক ওসিআর পুনরায় বিতরণ করতে ব্যবহার করা যেতে পারে।

আয়রন ওসিআর বাস্তব বিশ্বের চিত্র এবং অসম্পূর্ণ নথি যেমন ফটোগ্রাফ, বা লো রেজোলিউশনের স্ক্যানগুলির সাথে কাজ করার সময় জ্বলজ্বল করে যেখানে ডিজিটাল শব্দ বা অসম্পূর্ণতা থাকতে পারে।

.NET প্ল্যাটফর্মের জন্য অন্যান্য নিখরচায় ওসিআর লাইব্রেরি যেমন অন্যান্য। নেট টেসারেক্ট এপিআই এবং ওয়েব পরিষেবাদি এই বাস্তব বিশ্বের ব্যবহারের ক্ষেত্রে এত ভাল সম্পাদন করে না।

পরীক্ষামূলক 5 সহ ওসিআর - সি # তে কোডিং শুরু করুন

নীচের কোডের নমুনাটি দেখায় যে সি # বা ভিবি। নেট ব্যবহার করে কোনও চিত্র থেকে পাঠ্য পড়া কতটা সহজ।

এক রৈখিক

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

কনফিগার হ্যালো ওয়ার্ল্ড

// PM> Install-Package IronOCR.Languages.Bengali
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... আপনি যে কোনও সংখ্যা যুক্ত করতে পারেন
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Bengali
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... আপনি যে কোনও সংখ্যা যুক্ত করতে পারেন
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Bengali
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

সি # পিডিএফ ওসিআর

একই পদ্ধতির অনুরূপভাবে কোনও পিডিএফ ডকুমেন্ট থেকে পাঠ্য নিষ্কাশন করতে ব্যবহার করা যেতে পারে।

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// আমরা ওসিআর-তে নির্দিষ্ট পিডিএফ পৃষ্ঠার নাম্বারও নির্বাচন করতে পারি

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// পিডিএফ প্রতি পৃষ্ঠার জন্য 1 পৃষ্ঠা
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// আমরা ওসিআর-তে নির্দিষ্ট পিডিএফ পৃষ্ঠার নাম্বারও নির্বাচন করতে পারি

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// পিডিএফ প্রতি পৃষ্ঠার জন্য 1 পৃষ্ঠা
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' আমরা ওসিআর-তে নির্দিষ্ট পিডিএফ পৃষ্ঠার নাম্বারও নির্বাচন করতে পারি

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' পিডিএফ প্রতি পৃষ্ঠার জন্য 1 পৃষ্ঠা
End Using
VB   C#

মাল্টিপেজ টিআইএফএফগুলির জন্য ওসিআর

ওসিআর পড়া টিআইএফএফ ফাইল ফর্ম্যাট একাধিক পৃষ্ঠার ডকুমেন্ট সহ। টিআইএফএফ অনুসন্ধানযোগ্য পাঠ্য সহ সরাসরি পিডিএফ ফাইলে রূপান্তর করা যায়।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

বারকোডস এবং কিউআর

আয়রণ ওসিআরের একটি অনন্য বৈশিষ্ট্য এটি পাঠ্যের জন্য স্ক্যান করার সময় নথিগুলি থেকে বারকোড এবং কিউআর কোডগুলি পড়তে পারে। OcrResult.OcrBarcode ক্লাসের উদাহরণগুলি বিকাশকারীকে প্রতিটি স্ক্যান করা বারকোড সম্পর্কে বিশদ তথ্য দেয়।

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// প্রকার এবং অবস্থানের বৈশিষ্ট্যগুলিও উন্মুক্ত
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// প্রকার এবং অবস্থানের বৈশিষ্ট্যগুলিও উন্মুক্ত
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' প্রকার এবং অবস্থানের বৈশিষ্ট্যগুলিও উন্মুক্ত
Next Barcode
End Using
VB   C#

চিত্রগুলির নির্দিষ্ট অঞ্চলগুলিতে ওসিআর

আয়রন ওসিআরের সমস্ত স্ক্যানিং এবং পড়ার পদ্ধতিগুলি কোনও পৃষ্ঠা বা পৃষ্ঠাগুলির ঠিক কোন অংশ থেকে আমরা পাঠ্যটি পড়তে চাই তা নির্দিষ্ট করে দেওয়ার ক্ষমতা সরবরাহ করে। এটি যখন খুব কার্যকর হয় যখন আমরা প্রমিত মানের ফর্মগুলির দিকে চেয়ে থাকি এবং প্রচুর সময় সাশ্রয় করতে এবং দক্ষতা উন্নত করতে পারি।

ফসল অঞ্চলে ব্যবহার করার জন্য, আমরা একটি সিস্টেম রেফারেন্স যোগ করার জন্য প্রয়োজন হবে System.Drawing যাতে আমরা ব্যবহার করতে পারেন System.Drawing.Rectangle অবজেক্ট।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// মাত্রা px এ রয়েছে

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// মাত্রা px এ রয়েছে

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' মাত্রা px এ রয়েছে

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

নিম্নমানের স্ক্যানগুলির জন্য ওসিআর

আয়রন ওসিআর OcrInput শ্রেণি সাধারণ OcrInput পড়তে পারে না এমন স্ক্যানগুলি ঠিক করতে পারে।

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
Input.Deskew(); // ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
Input.Deskew(); // ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
Input.Deskew() ' ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

অনুসন্ধানযোগ্য পিডিএফ হিসাবে ওসিআর ফলাফল রফতানি করুন

অনুলিপিযোগ্য পাঠ্য স্ট্রিং সহ পিডিএমে চিত্র অনুসন্ধান ইঞ্জিন এবং ডেটাবেস দ্বারা সূচকযুক্ত হতে পারে।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

টিআইএফএফ পিডিএফ রূপান্তর অনুসন্ধানযোগ্য

একটি অনুসন্ধানযোগ্য পিডিএফ-তে একটি টিআইএফএফ ডকুমেন্ট (বা চিত্র ফাইলগুলির কোনও গ্রুপ) রূপান্তর করুন যা ইন্ট্রানেট, ওয়েবসাইট এবং গুগল অনুসন্ধান ইঞ্জিন দ্বারা সূচিযুক্ত করা যেতে পারে।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

এইচটিএমএল হিসাবে ওসিআর ফলাফল রফতানি করুন

ওসিআর চিত্রটি এক্সএইচটিএমএল রূপান্তরতে।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

ওসিআর চিত্র বর্ধন ফিল্টার

আয়রণ ওসিআর ওসিআর এর কার্যকারিতা উন্নত করতে ওসিআর OcrInput অবজেক্টের জন্য অনন্য ফিল্টার সরবরাহ করে।

চিত্র বর্ধন কোড উদাহরণ

ওসিআর ইনপুট চিত্রগুলিকে আরও ভাল, দ্রুত ওসিআর ফলাফল উত্পাদন করতে উচ্চতর মানের করে তোলে।

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
Input.Deskew(); // ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
Input.Deskew(); // ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
Input.Deskew() ' ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

ওসিআর চিত্র ফিল্টারগুলির তালিকা

ওসিআর পারফরম্যান্স বাড়ানোর জন্য ইনপুট ফিল্টারগুলি যা আয়রণ ওসিআর-এ অন্তর্নির্মিত রয়েছে সেগুলির মধ্যে রয়েছে:

  • OcrInput.Rotate (ডাবল ডিগ্রি) - ঘড়ির কাঁটার দিকে কয়েকটি ডিগ্রি দ্বারা চিত্রগুলি ঘোরান । অ্যান্টি-ক্লকওয়াইজ জন্য, নেতিবাচক সংখ্যা ব্যবহার করুন।
  • OcrInput.Binarize () - এই চিত্র ফিল্টারটি মাঝারি স্থলবিহীন প্রতিটি পিক্সেলকে কালো বা সাদা করে। ব্যাকগ্রাউন্ডে পাঠ্যের খুব কম বিপরীতে ওসিআর পারফরম্যান্সের ক্ষেত্রে উন্নতি করতে পারে।
  • ওসিআরআইনপুট.টোগ্রেস্কেল () - এই চিত্র ফিল্টারটি প্রতিটি পিক্সেলকে গ্রেস্কেলের ছায়ায় পরিণত করে। ওসিআর নির্ভুলতা উন্নত করা অসম্ভব তবে গতি উন্নতি করতে পারে
  • ওসিআরআইনপুট.কন্ট্রাস্ট () - স্বয়ংক্রিয়ভাবে বৈপরীত্য বৃদ্ধি করে। এই ফিল্টারটি প্রায়শই কম বিপরীতে স্ক্যানগুলিতে ওসিআর গতি এবং নির্ভুলতার উন্নতি করে।
  • OcrInput.DeNoise () - ডিজিটাল গোলমাল সরিয়ে দেয়। এই ফিল্টারটি কেবল তখনই ব্যবহার করা উচিত যেখানে শব্দটি আশা করা যায়।
  • ওসিআরআইনপুট.ইনভার্ট () - প্রতিটি রঙ উল্টে দেয়। যেমন সাদা কালো হয়: কালো সাদা হয় white
  • ওসিআরআইনপুট.ডিলিট () - উন্নত রূপচর্চাপ্রসারণ একটি চিত্র বস্তু সীমানা পিক্সেল যোগ করা হয়েছে। এরোডের বিপরীতে
  • OcrInput.Erode () - অ্যাডভান্সড মরফোলজিক্ষয়টি বস্তুর সীমানায় পিক্সেলগুলি সরায় ilate
  • ওসিআরআইনপুট.ডেস্কিউ () - একটি চিত্র ঘোরান যাতে এটি সঠিক উপায়ে এবং অর্থোথোনাল হয়। এটি ওসিআরের পক্ষে খুব কার্যকর কারণ স্কিউ স্ক্যানগুলির পরীক্ষার সহনশীলতা 5 ডিগ্রি হিসাবে কম হতে পারে।
  • ওসিআরআইনপুট.ডিপক্লেইনব্যাকগ্রাউন্ডনোইস () - ভারী পটভূমি শব্দের অপসারণ। চূড়ান্ত নথির পটভূমির গোলমাল জানা থাকলে কেবলমাত্র এই ফিল্টারটি ব্যবহার করুন, কারণ এই ফিল্টারটি পরিষ্কার নথিগুলির ওসিআর যথার্থতা হ্রাস করার ঝুঁকিপূর্ণ করবে এবং এটি খুব সিপিইউ ব্যয়বহুল।
  • OcRInput.EnhanceResolution - নিম্নমানের চিত্রগুলির রেজোলিউশন বাড়ায়। এই ফিল্টারটি প্রায়শই প্রয়োজন হয় না কারণ ওসিআরআনপুট.নিমামডিপিআই এবং ওসিআরআইনপুট. টার্গেটডিপিআই স্বয়ংক্রিয়ভাবে কম রেজোলিউশন ইনপুটগুলি ধরা ও সমাধান করবে।

ক্লিনব্যাকগ্রাউন্ডনিউজ এটি এমন একটি সেটিং যা কিছুটা সময়সাপেক্ষ; তবে এটি গ্রন্থাগারটি ডিজিটাল চিত্রের মধ্যে স্বয়ংক্রিয়ভাবে ডিজিটাল শব্দ, কাগজ crumples এবং অন্যান্য অপূর্ণতা পরিষ্কার করার অনুমতি দেয় যা অন্যথায় এটি অন্যান্য ওসিআর লাইব্রেরি দ্বারা পঠনযোগ্যভাবে অক্ষম করে তোলে।

এনহান্সকন্ট্রাস্ট এমন একটি সেটিংস যা আয়রন ওসিআরকে স্বয়ংক্রিয়ভাবে কোনও চিত্রের পটভূমির বিপরীতে পাঠ্যের বৈসাদৃশ্য বাড়িয়ে তোলে, ওসিআরের যথার্থতা বৃদ্ধি করে এবং সাধারনত কর্মক্ষমতা এবং ওসিআরের গতি বাড়িয়ে তোলে।

এনহানসারেসোলিউশন এমন একটি সেটিংস যা স্বল্প-রেজোলিউশন চিত্রগুলি (যা ২ which৫ ডিপিআই এর নীচে রয়েছে) সনাক্ত করে এবং স্বয়ংক্রিয়ভাবে চিত্রটিকে উপগ্রহ করবে এবং তারপরে সমস্ত পাঠ্যকে তীক্ষ্ণ করবে যাতে এটি ওসিআর লাইব্রেরি দ্বারা নিখুঁতভাবে পড়তে পারে। যদিও এই অপারেশনটি নিজে সময় সাশ্রয়ী, তবে এটি সাধারণত কোনও চিত্রের ওসিআর অপারেশনের সামগ্রিক সময় হ্রাস করে।

ভাষা আয়রন ওসিআর 22 টি আন্তর্জাতিক ভাষার প্যাকগুলি সমর্থন করে এবং ওসিআর ক্রিয়াকলাপের জন্য প্রয়োগ করতে এক বা একাধিক ভাষা নির্বাচন করতে ভাষা সেটিংটি ব্যবহার করা যেতে পারে।

কৌশল আয়রন ওসিআর দুটি কৌশল সমর্থন করে। আমরা হয় কোনও ডকুমেন্টের দ্রুত এবং কম নির্ভুল স্ক্যানের জন্য যেতে পছন্দ করতে পারি, বা একটি বাক্যটিতে একে অপরের সাথে শব্দের পরিসংখ্যানগত সম্পর্ক দেখে স্বয়ংক্রিয়ভাবে ওসিআর পাঠ্যের যথার্থতা উন্নত করতে কিছু কৃত্রিম বুদ্ধিমত্তার মডেল ব্যবহার করে এমন একটি উন্নত কৌশল ব্যবহার করতে পারি ।

কালারস্পেস এমন একটি সেটিংস যার মাধ্যমে আমরা গ্রেস্কেল বা রঙে ওসিআর বেছে নিতে পারি। সাধারণত, গ্রেস্কেল সেরা বিকল্প is যাইহোক, কখনও কখনও যখন একই বর্ণের বর্ণ বা খুব পৃথক বর্ণের পটভূমি থাকে তবে একটি পূর্ণ বর্ণের বর্ণের স্থান আরও ভাল ফলাফল সরবরাহ করে।

হোয়াইটটেক্সটঅন ডার্কব্যাকগ্রাউন্ডগুলি সনাক্ত করুন। সাধারণত, সমস্ত ওসিআর লাইব্রেরি সাদা পটভূমিতে কালো পাঠ্য দেখতে আশা করে। এই সেটিংটি আয়রণ ওসিআরটিকে স্বয়ংক্রিয়ভাবে নেতিবাচক বা সাদা পাঠ্যযুক্ত গা dark় পৃষ্ঠাগুলি সনাক্ত করতে এবং সেগুলি পড়তে দেয়।

ইনপুটআইমেজটাইপ। এই সেটিংটি বিকাশকারীকে ওসিআর লাইব্রেরিটিকে কোনও সম্পূর্ণ ডকুমেন্ট বা স্নিপেটের মতো স্ক্রিনশটের দিকে তাকিয়ে আছে কিনা তা গাইড করার অনুমতি দেয়।

রোটেটএন্ডট্রেইন একটি উন্নত সেটিং যা আয়রন ওসিআরকে নথিগুলি যা কেবল ঘোরানো হয় না তা পড়ার অনন্য ক্ষমতা দেয় তবে সম্ভবত পাঠ্য নথির ফটোগ্রাফ যেমন দৃষ্টিকোণ ধারণ করে।

রিডবাকোডগুলি একটি দরকারী বৈশিষ্ট্য যা আয়রন ওসিআরকে স্বয়ংক্রিয়ভাবে পৃষ্ঠাগুলিতে বারকোড এবং কিউআর কোডগুলি পাঠ্য পড়ায়, অতিরিক্ত অতিরিক্ত সময়ের বোঝা যুক্ত না করে পড়তে দেয় allows

রঙের ঘনত্ব. কোনও রঙের গভীরতা নির্ধারণ করতে ওসিআর গ্রন্থাগার পিক্সেলটিতে কত বিট ব্যবহার করবে তা এই সেটিংটি নির্ধারণ করে। একটি উচ্চতর রঙের গভীরতা ওসিআর গুণমান বাড়িয়ে তুলতে পারে, তবে ওসিআর অপারেশনটি সম্পূর্ণ হওয়ার জন্য প্রয়োজনীয় সময়ও বাড়িয়ে তুলবে।

126 টি ভাষা প্যাক

আয়রন ওসিআর 126 আন্তর্জাতিক ভাষাগুলিকে ভাষা প্যাকগুলির মাধ্যমে সমর্থন করে যা ডিএলএল হিসাবে বিতরণ করা হয়, যা এই ওয়েবসাইট থেকে বা নিউগেট প্যাকেজ ম্যানেজার থেকে ডাউনলোড করা যায়

ভাষাগুলির মধ্যে জার্মান, ফরাসী, ইংরেজি, চীনা, জাপানি এবং আরও অনেক কিছু রয়েছে। পাসপোর্ট এমআরজেড, এমআইসিআর চেকস, ফিনান্সিয়াল ডেটা, লাইসেন্স প্লেট এবং আরও অনেক কিছুর জন্য বিশেষজ্ঞ ভাষার প্যাকগুলি বিদ্যমান। আপনি নিজের তৈরির মতো যেকোনও "টেস্ট্রেনডেটা" ফাইলও ব্যবহার করতে পারেন।

ভাষার উদাহরণ

অন্যান্য ওসিআর ভাষা ব্যবহার করা।

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// প্রয়োজনে চিত্র ফিল্টার যুক্ত করুন
// এই ক্ষেত্রে, এমনকি ভাবা ইনপুট খুব নিম্ন মানের
// আয়রনটেসারেক্ট পড়তে পারে যা প্রচলিত টেসারেক্ট না পারে।

var Result = Ocr.Read(input);

// কনসোল উইন্ডোজে সহজে আরবি মুদ্রণ করতে পারে না।
// পরিবর্তে ডিস্কে সংরক্ষণ করুন।
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// প্রয়োজনে চিত্র ফিল্টার যুক্ত করুন
// এই ক্ষেত্রে, এমনকি ভাবা ইনপুট খুব নিম্ন মানের
// আয়রনটেসারেক্ট পড়তে পারে যা প্রচলিত টেসারেক্ট না পারে।

var Result = Ocr.Read(input);

// কনসোল উইন্ডোজে সহজে আরবি মুদ্রণ করতে পারে না।
// পরিবর্তে ডিস্কে সংরক্ষণ করুন।
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' প্রয়োজনে চিত্র ফিল্টার যুক্ত করুন
' এই ক্ষেত্রে, এমনকি ভাবা ইনপুট খুব নিম্ন মানের
' আয়রনটেসারেক্ট পড়তে পারে যা প্রচলিত টেসারেক্ট না পারে।

Dim Result = Ocr.Read(input)

' কনসোল উইন্ডোজে সহজে আরবি মুদ্রণ করতে পারে না।
' পরিবর্তে ডিস্কে সংরক্ষণ করুন।
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

একাধিক ভাষার উদাহরণ

ওসিআর একই সাথে একাধিক ভাষা ব্যবহার করাও সম্ভব। এটি ইউনিকোড ডকুমেন্টগুলিতে ইংরেজি ভাষার মেটাডেটা এবং url পেতে সত্যই সহায়তা করতে পারে।

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Bengali);

// আমরা যে কোনও সংখ্যক ভাষা যুক্ত করতে পারি

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Bengali);

// আমরা যে কোনও সংখ্যক ভাষা যুক্ত করতে পারি

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Bengali)

' আমরা যে কোনও সংখ্যক ভাষা যুক্ত করতে পারি

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

বিস্তারিত ওসিআর ফলাফল অবজেক্টস

আয়রন ওসিআর প্রতিটি ওসিআর ক্রিয়াকলাপের জন্য একটি ওসিআর ফলাফল অবজেক্ট দেয়। সাধারণত, বিকাশকারীরা চিত্র থেকে টেক্সট স্ক্যান করতে কেবল এই বস্তুর পাঠ্য সম্পত্তি ব্যবহার করে। তবে ওসিআর ফলাফল ডিওএম এর চেয়ে অনেক বেশি উন্নত।

using IronOcr;
using System.Drawing; //বিধানসভা রেফারেন্স যুক্ত করুন

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //গুরুত্বপূর্ণ!

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// একটি বিশাল, বিস্তারিত এপিআই খুঁজে পেতে এখানে অন্বেষণ করুন:
// - পৃষ্ঠা, ব্লক, প্যারাফ্যাফস, লাইন, শব্দ, অক্ষর
// - চিত্র রফতানি, ফন্টের সমন্বয়, পরিসংখ্যানের ডেটা
}
using IronOcr;
using System.Drawing; //বিধানসভা রেফারেন্স যুক্ত করুন

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //গুরুত্বপূর্ণ!

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// একটি বিশাল, বিস্তারিত এপিআই খুঁজে পেতে এখানে অন্বেষণ করুন:
// - পৃষ্ঠা, ব্লক, প্যারাফ্যাফস, লাইন, শব্দ, অক্ষর
// - চিত্র রফতানি, ফন্টের সমন্বয়, পরিসংখ্যানের ডেটা
}
Imports IronOcr
Imports System.Drawing 'বিধানসভা রেফারেন্স যুক্ত করুন

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'গুরুত্বপূর্ণ!

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' একটি বিশাল, বিস্তারিত এপিআই খুঁজে পেতে এখানে অন্বেষণ করুন:
' - পৃষ্ঠা, ব্লক, প্যারাফ্যাফস, লাইন, শব্দ, অক্ষর
' - চিত্র রফতানি, ফন্টের সমন্বয়, পরিসংখ্যানের ডেটা
End Using
VB   C#

কর্মক্ষমতা

আয়রণ ওসিআর বক্সের বাইরে পারফরম্যান্স টিউন বা ভারী ইনপুট চিত্রগুলি পরিবর্তন করার প্রয়োজন নেই no

গতি জ্বলছে: আয়রনঅক্রি .2020 + 10 গুণ বেশি দ্রুত এবং পূর্ববর্তী বিল্ডগুলির তুলনায় 250% এরও কম ত্রুটি করে।

আরও জানুন

সি #, ভিবি, এফ #, বা অন্য কোনও নেট নেট ভাষায় ওসিআর সম্পর্কে আরও জানতে, দয়া করে আমাদের সম্প্রদায়ের টিউটোরিয়ালগুলি পড়ুন , যা আয়রন ওসিআর কীভাবে ব্যবহার করা যায় তার বাস্তব বিশ্বের উদাহরণ দেয় এবং কীভাবে সর্বোত্তমভাবে বেরোতে পারে তার সংক্ষিপ্তসারগুলি দেখায় এই গ্রন্থাগার

.NET বিকাশকারীদের জন্য একটি সম্পূর্ণ অবজেক্ট রেফারেন্স উপলব্ধ।