সি # এবং .নেটে বাংলা ওসিআর

এই দস্তাবেজের অন্যান্য সংস্করণ:

আয়রনসিআর হ'ল সি # সফটওয়্যার উপাদান যা নেট। কোডারদের বাংলা সহ 126 ভাষায় চিত্র এবং পিডিএফ নথি থেকে পাঠ্য পড়তে দেয়।

এটি টেস্টেরাক্টের একটি উন্নত কাঁটাচামচ, এটি কেবলমাত্র নেট নেট বিকাশকারীদের জন্য নির্মিত এবং গতি এবং যথার্থতার জন্য নিয়মিতভাবে অন্যান্য টেস্ট্রাক ইঞ্জিনকে ছাপিয়ে যায়।

আয়রনঅক.আর.ল্যাঙ্গোয়েজস.বাঙ্গালি এর সামগ্রীসমূহ

এই প্যাকেজে .NET এর জন্য 114 টি ওসিআর ভাষা রয়েছে:

  • বাংলা
  • বেঙ্গলিস্টে
  • বেঙ্গলিফাস্ট
  • বেঙ্গলিআলফেট
  • বাংলাআলাভবেট বেস্ট
  • বেঙ্গলিআল্ফবেটস্ট

ডাউনলোড করুন

বাংলা ভাষা প্যাক [বাংলা]
Download as জিপ
Install with as https://www.nuget.org/packages/IronOcr.Languages.Bengali/

স্থাপন

আমাদের প্রথমে আপনাকে আমাদের নেট ওজেট প্রকল্পে আমাদের বাংলা ওসিআর প্যাকেজ ইনস্টল করতে হবে।

PM> Install-Package IronOCR.Languages.Bengali

কোড উদাহরণ

এই সি # কোড উদাহরণটি কোনও চিত্র বা পিডিএফ ডকুমেন্ট থেকে বাংলা পাঠ্য পড়বে।

// PM> Install-Package IronOcr.Languages.Bengali
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput(@"images\Bengali.png"))
{
    var Result = Ocr.Read(Input);
    var AllText = Result.Text;
}
// PM> Install-Package IronOcr.Languages.Bengali
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput(@"images\Bengali.png"))
{
    var Result = Ocr.Read(Input);
    var AllText = Result.Text;
}
' PM> Install-Package IronOcr.Languages.Bengali
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput("images\Bengali.png")
	Dim Result = Ocr.Read(Input)
	Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel

কেন আয়রনওসিআর বেছে নিন?

আয়রনওসিআর হ'ল একটি ইনস্টল করা সহজ, সম্পূর্ণ এবং ডকুমেন্টেড .NET সফটওয়্যার লাইব্রেরি।

কোনও বাহ্যিক ওয়েব পরিষেবা ব্যবহার না করে চলমান ফি বা ইন্টারনেটে গোপনীয় ডকুমেন্ট প্রেরণ না করে 99.8% + ওসিআর নির্ভুলতা অর্জনের জন্য আয়রনওসিআর বেছে নিন।

কেন সি # বিকাশকারীরা ভ্যানিলা পরীক্ষার চেয়ে আয়রনওসিআর বেছে নেয়:

  • একটি একক ডিএলএল বা NuGet হিসাবে ইনস্টল করুন
  • বাক্সের বাইরে 5, 4 এবং 3 ইঞ্জিনের জন্য অন্তর্ভুক্ত।
  • নির্ভুলতা 99.8% নিয়মিত টেস্টেরাক্টকে উল্লেখযোগ্যভাবে ছাড়িয়ে যায়।
  • জ্বলন্ত গতি এবং মাল্টিথ্রেডিং
  • এমভিসি, ওয়েব অ্যাপ, ডেস্কটপ, কনসোল এবং সার্ভার অ্যাপ্লিকেশন সামঞ্জস্যপূর্ণ
  • কাজ করার জন্য কোনও এক্সেস বা সি ++ কোড নেই
  • সম্পূর্ণ পিডিএফ ওসিআর সমর্থন
  • ওসিআর প্রায় কোনও চিত্র ফাইল বা পিডিএফ সম্পাদন করতে
  • সম্পূর্ণ .NET কোর, স্ট্যান্ডার্ড এবং ফ্রেমওয়ার্ক সমর্থন
  • উইন্ডোজ, ম্যাক, লিনাক্স, অ্যাজুরে, ডকার, ল্যাম্বদা, এডাব্লুএস-এ স্থাপন করুন
  • বারকোড এবং কিউআর কোডগুলি পড়ুন
  • এক্সএইচটিএমএল হিসাবে ওসিআর রফতানি করুন
  • অনুসন্ধানযোগ্য পিডিএফ ডকুমেন্টগুলিতে ওসিআর রফতানি করুন
  • মাল্টিথ্রেডিং সমর্থন
  • 126 আন্তর্জাতিক ভাষা সবই NuGet বা ওসিআরডাটা ফাইলের মাধ্যমে পরিচালিত
  • চিত্র, স্থানাঙ্ক, পরিসংখ্যান এবং ফন্টগুলি বের করুন। শুধু পাঠ্য নয়।
  • বাণিজ্যিক ও মালিকানাধীন অ্যাপ্লিকেশনগুলির মধ্যে পরীক্ষামূলক ওসিআর পুনরায় বিতরণ করতে ব্যবহার করা যেতে পারে।

আয়রনওসিআর বাস্তব বিশ্বের চিত্র এবং অসম্পূর্ণ নথি যেমন ফটোগ্রাফ, বা লো রেজোলিউশনের স্ক্যানগুলির সাথে কাজ করার সময় জ্বলজ্বল করে যেখানে ডিজিটাল শব্দ বা অসম্পূর্ণতা থাকতে পারে।

.NET প্ল্যাটফর্মের জন্য অন্যান্য নিখরচায় ওসিআর লাইব্রেরি যেমন অন্যান্য .NET টেসারেক্ট এপিআই এবং ওয়েব পরিষেবা এই বাস্তব বিশ্বের ব্যবহারের ক্ষেত্রে এত ভাল সম্পাদন করে না।

পরীক্ষামূলক 5 সহ ওসিআর - সি # তে কোডিং শুরু করুন

নীচের কোডের নমুনাটি দেখায় যে সি # বা ভিবি .NET ব্যবহার করে কোনও চিত্র থেকে পাঠ্য পড়া কতটা সহজ।

এক রৈখিক

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
$vbLabelText   $csharpLabel

কনফিগার হ্যালো ওয়ার্ল্ড

// PM> Install-Package IronOCR.Languages.Bengali
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
    Input.AddImage("images/sample.jpeg");
    //... আপনি যে কোনও সংখ্যা যুক্ত করতে পারেন
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Bengali
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
    Input.AddImage("images/sample.jpeg");
    //... আপনি যে কোনও সংখ্যা যুক্ত করতে পারেন
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Bengali
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput()
	Input.AddImage("images/sample.jpeg")
	'... আপনি যে কোনও সংখ্যা যুক্ত করতে পারেন
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

সি # পিডিএফ ওসিআর

একই পদ্ধতি অনুরূপভাবে কোনও পিডিএফ ডকুমেন্ট থেকে পাঠ্য নিষ্কাশন করতে ব্যবহার করা যেতে পারে।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var input = new OcrInput())
{
    input.AddPdf("example.pdf", "password");
    // আমরা ওসিআর-তে নির্দিষ্ট পিডিএফ পৃষ্ঠার নম্বরও নির্বাচন করতে পারি

    var Result = Ocr.Read(input);

    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages");
    // পিডিএফ প্রতি পৃষ্ঠার জন্য 1 পৃষ্ঠা
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var input = new OcrInput())
{
    input.AddPdf("example.pdf", "password");
    // আমরা ওসিআর-তে নির্দিষ্ট পিডিএফ পৃষ্ঠার নম্বরও নির্বাচন করতে পারি

    var Result = Ocr.Read(input);

    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages");
    // পিডিএফ প্রতি পৃষ্ঠার জন্য 1 পৃষ্ঠা
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using input = New OcrInput()
	input.AddPdf("example.pdf", "password")
	' আমরা ওসিআর-তে নির্দিষ্ট পিডিএফ পৃষ্ঠার নম্বরও নির্বাচন করতে পারি

	Dim Result = Ocr.Read(input)

	Console.WriteLine(Result.Text)
	Console.WriteLine($"{Result.Pages.Count()} Pages")
	' পিডিএফ প্রতি পৃষ্ঠার জন্য 1 পৃষ্ঠা
End Using
$vbLabelText   $csharpLabel

মাল্টিপেইজ টিআইএফএফগুলির জন্য ওসিআর

ওসিআর পড়া টিআইএফএফ ফাইল ফর্ম্যাট একাধিক পৃষ্ঠার ডকুমেন্ট সহ। টিআইএফএফ অনুসন্ধানযোগ্য পাঠ্য সহ সরাসরি পিডিএফ ফাইলে রূপান্তর করা যায়।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("multi-frame.tiff");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("multi-frame.tiff");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput()
	Input.AddMultiFrameTiff("multi-frame.tiff")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

বারকোডস এবং কিউআর

আয়রন ওসিআরের একটি অনন্য বৈশিষ্ট্য এটি পাঠ্যের জন্য স্ক্যান করার সময় নথিগুলি থেকে বারকোড এবং কিউআর কোডগুলি পড়তে পারে। OcrResult.OcrBarcode ক্লাসের উদাহরণগুলি বিকাশকারীকে প্রতিটি স্ক্যান করা বারকোড সম্পর্কে বিশদ তথ্য দেয়।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
    input.AddImage("img/Barcode.png");
    var Result = Ocr.Read(input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // প্রকার এবং অবস্থানের বৈশিষ্ট্যগুলিও উন্মুক্ত
    }
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
    input.AddImage("img/Barcode.png");
    var Result = Ocr.Read(input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // প্রকার এবং অবস্থানের বৈশিষ্ট্যগুলিও উন্মুক্ত
    }
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
	input.AddImage("img/Barcode.png")
	Dim Result = Ocr.Read(input)

	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
		' প্রকার এবং অবস্থানের বৈশিষ্ট্যগুলিও উন্মুক্ত
	Next Barcode
End Using
$vbLabelText   $csharpLabel

চিত্রগুলির নির্দিষ্ট অঞ্চলগুলিতে ওসিআর

আয়রন ওসিআরের সমস্ত স্ক্যানিং এবং পড়ার পদ্ধতিগুলি কোনও পৃষ্ঠা বা পৃষ্ঠাগুলির ঠিক কোন অংশ থেকে আমরা পাঠ্যটি পড়তে চাই তা নির্দিষ্ট করে দেওয়ার ক্ষমতা সরবরাহ করে। এটি যখন খুব কার্যকর হয় যখন আমরা প্রমিত মানের ফর্মগুলির দিকে চেয়ে থাকি এবং প্রচুর সময় সাশ্রয় করতে এবং দক্ষতা উন্নত করতে পারি।

ফসল এলাকায় ব্যবহার করার জন্য, আমরা একটি সিস্টেম রেফারেন্স যোগ করার জন্য প্রয়োজন হবে System.Drawing যাতে আমরা ব্যবহার করতে পারি System.Drawing.Rectangle অবজেক্ট।

using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
    var ContentArea = new Rectangle { X = 215, Y = 1250, Height = 280, Width = 1335 };
    // মাত্রা px এ রয়েছে

    Input.Add("document.png", ContentArea);

    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
    var ContentArea = new Rectangle { X = 215, Y = 1250, Height = 280, Width = 1335 };
    // মাত্রা px এ রয়েছে

    Input.Add("document.png", ContentArea);

    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Imports IronOcr
Imports System.Drawing

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput()
	Dim ContentArea = New Rectangle With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	' মাত্রা px এ রয়েছে

	Input.Add("document.png", ContentArea)

	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

নিম্নমানের স্ক্যানগুলির জন্য ওসিআর

আয়রন ওসিআর OcrInput শ্রেণি সাধারণ OcrInput পড়তে পারে না এমন স্ক্যানগুলি ঠিক করতে পারে।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    Input.DeNoise(); // ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
    Input.Deskew(); // ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে

    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    Input.DeNoise(); // ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
    Input.Deskew(); // ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে

    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
	Input.DeNoise() ' ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
	Input.Deskew() ' ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে

	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

অনুসন্ধানযোগ্য পিডিএফ হিসাবে ওসিআর ফলাফল রফতানি করুন

অনুলিপিযোগ্য পাঠ্য স্ট্রিং সহ পিডিএফএমে চিত্র অনুসন্ধান ইঞ্জিন এবং ডেটাবেস দ্বারা সূচকযুক্ত হতে পারে।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
    Input.Title = "Quarterly Report";
    Input.AddImage("image1.jpeg");
    Input.AddImage("image2.png");
    Input.AddImage("image3.gif");

    var Result = Ocr.Read(Input);
    Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
    Input.Title = "Quarterly Report";
    Input.AddImage("image1.jpeg");
    Input.AddImage("image2.png");
    Input.AddImage("image3.gif");

    var Result = Ocr.Read(Input);
    Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput()
	Input.Title = "Quarterly Report"
	Input.AddImage("image1.jpeg")
	Input.AddImage("image2.png")
	Input.AddImage("image3.gif")

	Dim Result = Ocr.Read(Input)
	Result.SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

টিআইএফএফ পিডিএফ রূপান্তর অনুসন্ধানযোগ্য

একটি অনুসন্ধানযোগ্য পিডিএফ-তে একটি টিআইএফএফ ডকুমেন্ট (বা চিত্র ফাইলগুলির কোনও গ্রুপ) রূপান্তর করুন যা ইন্ট্রানেট, ওয়েবসাইট এবং গুগল অনুসন্ধান ইঞ্জিন দ্বারা সূচিযুক্ত করা যেতে পারে।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("example.tiff");
    var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("example.tiff");
    var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput()
	Input.AddMultiFrameTiff("example.tiff")
	Dim Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

এইচটিএমএল হিসাবে ওসিআর ফলাফল রফটানি করুন

ওসিআর চিত্রটি এক্সএইচটিএমএল রূপান্তরতে।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
    Input.Title = "Html Title";
    Input.AddImage("image1.jpeg");

    var Result = Ocr.Read(Input);
    Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput())
{
    Input.Title = "Html Title";
    Input.AddImage("image1.jpeg");

    var Result = Ocr.Read(Input);
    Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput()
	Input.Title = "Html Title"
	Input.AddImage("image1.jpeg")

	Dim Result = Ocr.Read(Input)
	Result.SaveAsHocrFile("results.html")
End Using
$vbLabelText   $csharpLabel

ওসিআর চিত্র বর্ধন ফিল্টার

আয়রন ওসিআর ওসিআর এর কার্যকারিতা উন্নত করতে ওসিআর OcrInput অবজেক্টের জন্য অনন্য ফিল্টার সরবরাহ করে।

চিত্র বর্ধন কোড উদাহরণ

ওসিআর ইনপুট চিত্রগুলিকে আরও ভাল, দ্রুত ওসিআর ফলাফল উত্পাদন করতে উচ্চতর মানের করে তোলে।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    Input.DeNoise(); // ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
    Input.Deskew(); // ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে

    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    Input.DeNoise(); // ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
    Input.Deskew(); // ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে

    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali

Using Input = New OcrInput("LowQuality.jpeg")
	Input.DeNoise() ' ডিজিটাল শব্দ এবং দুর্বল স্ক্যানিং ঠিক করে
	Input.Deskew() ' ঘূর্ণন এবং দৃষ্টিভঙ্গি স্থির করে

	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

ওসিআর চিত্র ফিল্টারগুলির তালিকা

ওসিআর পারফরম্যান্স বাড়ানোর জন্য ইনপুট ফিল্টারগুলি যা আয়রণ ওসিআর-এ অন্তর্নির্মিত রয়েছে সেগুলির মধ্যে রয়েছে:

  • OcrInput.Rotate (ডাবল ডিগ্রি) - ঘড়ির কাঁটার কাঁটা কয়েকটি ডিগ্রি দ্বারা চিত্রগুলি ঘোরান করে। অ্যান্টি-ক্লকওয়াইজ জন্য, নেতিবাচক সংখ্যা ব্যবহার করুন।
  • OcrInput.Binarize () - এই চিত্র ফিল্টারটি মাঝারি স্থলবিহীন প্রতিটি পিক্সেলকে কালো বা সাদা করে। ব্যাকগ্রাউন্ডে পাঠ্যের খুব কম বিপরীতে ওসিআর পারফরম্যান্সের ক্ষেত্রে উন্নতি করতে পারে।
  • ওসিআরআইনপুট.টোগ্রেস্কেল () - এই চিত্র ফিল্টারটি প্রতিটি পিক্সেলকে গ্রেস্কেলের ছায়ায় পরিণত করে। ওসিআর নির্ভুলতা উন্নত করা অসম্ভব তবে গতি উন্নতি করতে পারে।
  • ওসিআরআইনপুট.কন্ট্রাস্ট () - স্বয়ংক্রিয়ভাবে বৈপরীত্য বৃদ্ধি করে। এই ফিল্টারটি প্রায়শই কম বিপরীতে স্ক্যানগুলিতে ওসিআর গতি এবং নির্ভুলতার উন্নতি করে।
  • OcrInput.DeNoise () - ডিজিটাল গোলমাল সরিয়ে দেয়। এই ফিল্টারটি কেবল তখনই ব্যবহার করা উচিত যেখানে শব্দটি আশা করা যায়।
  • ওসিআরআইনপুট.ইনভার্ট () - প্রতিটি রঙ উল্টে দেয়। যেমন সাদা কালো হয়: কালো সাদা হয়।
  • ওসিআরআইনপুট.ডিলিট () - উন্নত রূপচর্চাপ্রসারণ একটি চিত্র বস্তু সীমানা পিক্সেল যোগ করা হয়েছে। এরোডের বিপরীতে।
  • OcrInput.Erode () - অ্যাডভান্সড মরফোলজিক্ষয়টি বস্তুর সীমানায় পিক্সেলগুলি সরায়।
  • ওসিআরআইনপুট.ডেস্কিউ () - একটি চিত্র ঘোরান যাতে এটি সঠিক উপায়ে এবং অর্থোথোনাল হয়। এটি ওসিআরের পক্ষে খুব কার্যকর কারণ স্কিউ স্ক্যানগুলির পরীক্ষার সহনশীলতা 5 ডিগ্রি হিসাবে কম হতে পারে।
  • ওসিআরআইনপুট.ডিপক্লেইনব্যাকগ্রাউন্ডনোইস () - ভারী পটভূমি শব্দের অপসারণ। চূড়ান্ত নথির পটভূমির গোলমাল জানা থাকলে কেবলমাত্র এই ফিল্টারটি ব্যবহার করুন, কারণ এই ফিল্টারটি পরিষ্কার নথিগুলির ওসিআর যথার্থতা হ্রাস করার ঝুঁকিপূর্ণ করবে এবং এটি খুব সিপিইউ ব্যয়বহুল।
  • OcRInput.EnhanceResolution - নিম্নমানের চিত্রগুলির রেজোলিউশন বাড়ায়। এই ফিল্টারটি প্রায়শই প্রয়োজন হয় না কারণ ওসিআরআনপুট.নিমামডিপিআই এবং ওসিআরআইনপুট. টার্গেটডিপিআই স্বয়ংক্রিয়ভাবে কম রেজোলিউশন ইনপুটগুলি ধরা ও সমাধান করবে।

ক্লিনব্যাকগ্রাউন্ডনিউজ এটি এমন একটি সেটিং যা কিছুটা সময়সাপেক্ষ; তবে এটি গ্রন্থাগারটি ডিজিটাল চিত্রের মধ্যে স্বয়ংক্রিয়ভাবে ডিজিটাল শব্দ, কাগজ crumples এবং অন্যান্য অপূর্ণতা পরিষ্কার করার অনুমতি দেয় যা অন্যথায় এটি অন্যান্য ওসিআর লাইব্রেরি দ্বারা পঠনযোগ্যভাবে অক্ষম করে তোলে।

এনহান্সকন্ট্রাস্ট এমন একটি সেটিংস যা আয়রন ওসিআরকে স্বয়ংক্রিয়ভাবে কোনও চিত্রের পটভূমির বিপরীতে পাঠ্যের বৈসাদৃশ্য বাড়িয়ে তোলে, ওসিআরের যথার্থতা বৃদ্ধি করে এবং সাধারনত কর্মক্ষমতা এবং ওসিআরের গতি বাড়িয়ে তোলে।

এনহানসারেসোলিউশন এমন একটি সেটিংস যা স্বল্প-রেজোলিউশন চিত্রগুলি (যা ২ which৫ ডিপিআই এর নীচে রয়েছে) সনাক্ত করে এবং স্বয়ংক্রিয়ভাবে চিত্রটিকে উপগ্রহ করবে এবং তারপরে সমস্ত পাঠ্যকে তীক্ষ্ণ করবে যাতে এটি ওসিআর লাইব্রেরি দ্বারা নিখুঁতভাবে পড়তে পারে। যদিও এই অপারেশনটি নিজে সময় সাশ্রয়ী, তবে এটি সাধারণত কোনও চিত্রের ওসিআর অপারেশনের সামগ্রিক সময় হ্রাস করে।

ভাষা আয়রন ওসিআর 22 টি আন্তর্জাতিক ভাষার প্যাকগুলি সমর্থন করে এবং ওসিআর ক্রিয়াকলাপের জন্য প্রয়োগ করতে এক বা একাধিক ভাষা নির্বাচন করতে ভাষা সেটিংটি ব্যবহার করা যেতে পারে।

কৌশল আয়রন ওসিআর দুটি কৌশল সমর্থন করে। আমরা হয় কোনও ডকুমেন্টের দ্রুত এবং কম নির্ভুল স্ক্যানের জন্য যেতে পছন্দ করতে পারি, বা একটি বাক্যটিতে একে অপরের সাথে শব্দের পরিসংখ্যানগত সম্পর্ক দেখে স্বয়ংক্রিয়ভাবে ওসিআর পাঠ্যের যথার্থতা উন্নত করতে কিছু কৃত্রিম বুদ্ধিমত্তার মডেল ব্যবহার করে এমন একটি উন্নত কৌশল ব্যবহার করতে পারি ।

কালারস্পেস এমন একটি সেটিংস যার মাধ্যমে আমরা গ্রেস্কেল বা রঙে ওসিআর বেছে নিতে পারি। সাধারণত, গ্রেস্কেল সেরা বিকল্প is যাইহোক, কখনও কখনও যখন একই বর্ণের বর্ণ বা খুব পৃথক বর্ণের পটভূমি থাকে তবে একটি পূর্ণ বর্ণের বর্ণের স্থান আরও ভাল ফলাফল সরবরাহ করে।

হোয়াইটটেক্সটঅন ডার্কব্যাকগ্রাউন্ডগুলি সনাক্ত করুন। সাধারণত, সমস্ত ওসিআর লাইব্রেরি সাদা পটভূমিতে কালো পাঠ্য দেখতে আশা করে। এই সেটিংটি আয়রণ ওসিআরটিকে স্বয়ংক্রিয়ভাবে নেতিবাচক বা সাদা পাঠ্যযুক্ত গা dark় পৃষ্ঠাগুলি সনাক্ত করতে এবং সেগুলি পড়তে দেয়।

ইনপুটআইমেজটাইপ। এই সেটিংটি বিকাশকারীকে ওসিআর লাইব্রেরিটিকে কোনও সম্পূর্ণ ডকুমেন্ট বা স্নিপেটের মতো স্ক্রিনশটের দিকে তাকিয়ে আছে কিনা তা গাইড করার অনুমতি দেয়।

রোটেটএন্ডট্রেইন একটি উন্নত সেটিং যা আয়রন ওসিআরকে নথিগুলি যা কেবল ঘোরানো হয় না তা পড়ার অনন্য ক্ষমতা দেয় তবে সম্ভবত পাঠ্য নথির ফটোগ্রাফ যেমন দৃষ্টিকোণ ধারণ করে।

রিডবাকোডগুলি একটি দরকারী বৈশিষ্ট্য যা আয়রন ওসিআরকে স্বয়ংক্রিয়ভাবে পৃষ্ঠাগুলিতে বারকোড এবং কিউআর কোডগুলি পাঠ্য পড়ায়, অতিরিক্ত অতিরিক্ত সময়ের বোঝা যুক্ত না করে পড়তে দেয়।

রঙের ঘনত্ব. কোনও রঙের গভীরতা নির্ধারণ করতে ওসিআর গ্রন্থাগার পিক্সেলটিতে কত বিট ব্যবহার করবে তা এই সেটিংটি নির্ধারণ করে। একটি উচ্চতর রঙের গভীরতা ওসিআর গুণমান বাড়িয়ে তুলতে পারে, তবে ওসিআর অপারেশনটি সম্পূর্ণ হওয়ার জন্য প্রয়োজনীয় সময়ও বাড়িয়ে তুলবে।

126 টি ভাষা প্যাক

আয়রন ওসিআর 126 আন্তর্জাতিক ভাষাগুলিকে ভাষা প্যাকগুলির মাধ্যমে সমর্থন করে যা ডিএলএল হিসাবে বিতরণ করা হয়, যা এই ওয়েবসাইট থেকে বা নিউগেট প্যাকেজ ম্যানেজার থেকে ডাউনলোড করা যায়

ভাষাগুলির মধ্যে জার্মান, ফরাসী, ইংরেজি, চীনা, জাপানি এবং আরও অনেক কিছু রয়েছে। পাসপোর্ট এমআরজেড, এমআইসিআর চেকস, ফিনান্সিয়াল ডেটা, লাইসেন্স প্লেট এবং আরও অনেক কিছুর জন্য বিশেষজ্ঞ ভাষার প্যাকগুলি বিদ্যমান। আপনি নিজের তৈরির মতো যেকোনও "টেস্ট্রেনডেটা" ফাইলও ব্যবহার করতে পারেন।

ভাষার উদাহরণ

অন্যান্য ওসিআর ভাষা ব্যবহার করা।

using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
    input.AddImage("img/arabic.gif");
    // প্রয়োজনে চিত্র ফিল্টার যুক্ত করুন
    // এই ক্ষেত্রে, এমনকি ভাবা ইনপুট খুব নিম্ন মানের
    // আয়রনটেসারেক্ট পড়তে পারে যা প্রচলিত টেসারেক্ট না পারে।

    var Result = Ocr.Read(input);

    // কনসোল উইন্ডোজে সহজে আরবি মুদ্রণ করতে পারে না।
    // পরিবর্তে ডিস্কে সংরক্ষণ করুন।
    Result.SaveAsTextFile("arabic.txt");
}
using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
    input.AddImage("img/arabic.gif");
    // প্রয়োজনে চিত্র ফিল্টার যুক্ত করুন
    // এই ক্ষেত্রে, এমনকি ভাবা ইনপুট খুব নিম্ন মানের
    // আয়রনটেসারেক্ট পড়তে পারে যা প্রচলিত টেসারেক্ট না পারে।

    var Result = Ocr.Read(input);

    // কনসোল উইন্ডোজে সহজে আরবি মুদ্রণ করতে পারে না।
    // পরিবর্তে ডিস্কে সংরক্ষণ করুন।
    Result.SaveAsTextFile("arabic.txt");
}
Imports IronOcr
' PM> Install IronOcr.Languages.Arabic

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
	input.AddImage("img/arabic.gif")
	' প্রয়োজনে চিত্র ফিল্টার যুক্ত করুন
	' এই ক্ষেত্রে, এমনকি ভাবা ইনপুট খুব নিম্ন মানের
	' আয়রনটেসারেক্ট পড়তে পারে যা প্রচলিত টেসারেক্ট না পারে।

	Dim Result = Ocr.Read(input)

	' কনসোল উইন্ডোজে সহজে আরবি মুদ্রণ করতে পারে না।
	' পরিবর্তে ডিস্কে সংরক্ষণ করুন।
	Result.SaveAsTextFile("arabic.txt")
End Using
$vbLabelText   $csharpLabel

একাধিক ভাষার উদাহরণ

ওসিআর একই সাথে একাধিক ভাষা ব্যবহার করাও সম্ভব। এটি ইউনিকোড ডকুমেন্টগুলিতে ইংরেজি ভাষার মেটাডেটা এবং URL পেতে সত্যি সহায়তা করতে পারে।

using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Bengali);

// আমরা যে কোনও সংখ্যক ভাষা যুক্ত করতে পারি

using (var input = new OcrInput())
{
    input.Add("multi-language.pdf");
    var Result = Ocr.Read(input);
    Result.SaveAsTextFile("results.txt");
}
using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Bengali);

// আমরা যে কোনও সংখ্যক ভাষা যুক্ত করতে পারি

using (var input = new OcrInput())
{
    input.Add("multi-language.pdf");
    var Result = Ocr.Read(input);
    Result.SaveAsTextFile("results.txt");
}
Imports IronOcr
' PM> Install IronOcr.Languages.ChineseSimplified

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Bengali)

' আমরা যে কোনও সংখ্যক ভাষা যুক্ত করতে পারি

Using input = New OcrInput()
	input.Add("multi-language.pdf")
	Dim Result = Ocr.Read(input)
	Result.SaveAsTextFile("results.txt")
End Using
$vbLabelText   $csharpLabel

বিস্তারিত ওসিআর ফলাফল অবজেক্টs

আয়রন ওসিআর প্রতিটি ওসিআর ক্রিয়াকলাপের জন্য একটি ওসিআর ফলাফল অবজেক্ট দেয়। সাধারণত, বিকাশকারীরা চিত্র থেকে টেক্সট স্ক্যান করতে কেবল এই বস্তুর পাঠ্য সম্পত্তি ব্যবহার করে। তবে ওসিআর ফলাফল ডিওএম এর চেয়ে অনেক বেশি উন্নত।

using IronOcr;
using System.Drawing; //বিধানসভা রেফারেন্স যুক্ত করুন

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //গুরুত্বপূর্ণ!

using (var Input = new OcrInput(@"images\sample.tiff"))
{
    OcrResult Result = Ocr.Read(Input);
    var Pages = Result.Pages;
    var Words = Pages[0].Words;
    var Barcodes = Result.Barcodes;
    // একটি বিশাল, বিস্তারিত এপিআই খুঁজে পেতে এখানে অন্বেষণ করুন:
    // - পৃষ্ঠা, ব্লক, প্যারাহফেলস, লাইন, শব্দ, অক্ষর
    // - চিত্র রফতানি, ফন্টের সমন্বয়, পরিসংখ্যানের ডেটা
}
using IronOcr;
using System.Drawing; //বিধানসভা রেফারেন্স যুক্ত করুন

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //গুরুত্বপূর্ণ!

using (var Input = new OcrInput(@"images\sample.tiff"))
{
    OcrResult Result = Ocr.Read(Input);
    var Pages = Result.Pages;
    var Words = Pages[0].Words;
    var Barcodes = Result.Barcodes;
    // একটি বিশাল, বিস্তারিত এপিআই খুঁজে পেতে এখানে অন্বেষণ করুন:
    // - পৃষ্ঠা, ব্লক, প্যারাহফেলস, লাইন, শব্দ, অক্ষর
    // - চিত্র রফতানি, ফন্টের সমন্বয়, পরিসংখ্যানের ডেটা
}
Imports IronOcr
Imports System.Drawing 'বিধানসভা রেফারেন্স যুক্ত করুন

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'গুরুত্বপূর্ণ!

Using Input = New OcrInput("images\sample.tiff")
	Dim Result As OcrResult = Ocr.Read(Input)
	Dim Pages = Result.Pages
	Dim Words = Pages(0).Words
	Dim Barcodes = Result.Barcodes
	' একটি বিশাল, বিস্তারিত এপিআই খুঁজে পেতে এখানে অন্বেষণ করুন:
	' - পৃষ্ঠা, ব্লক, প্যারাহফেলস, লাইন, শব্দ, অক্ষর
	' - চিত্র রফতানি, ফন্টের সমন্বয়, পরিসংখ্যানের ডেটা
End Using
$vbLabelText   $csharpLabel

কর্মক্ষমতা

আয়রন ওসিআর বক্সের বাইরে পারফরম্যান্স টিউন বা ভারী ইনপুট চিত্রগুলি পরিবর্তন করার প্রয়োজন নেই কোন

গতি জ্বলছে: আয়রনঅক্রি .2020 + 10 গুণ বেশি দ্রুত এবং পূর্ববর্তী বিল্ডগুলির তুলনায় 250% এরও কম ত্রুটি করে।

আরও জানুন

সি #, ভিবি, এফ #, বা অন্য কোনও .NET নেট ভাষায় ওসিআর সম্পর্কে আরও জানতে, দয়া করে আমাদের সম্প্রদায়ের টিউটোরিয়ালগুলি পড়ুন , যা আয়রন ওসিআর কীভাবে ব্যবহার করা যায় তার বাস্তব বিশ্বের উদাহরণ দেয় এবং কীভাবে সর্বোত্তমভাবে বেরোতে পারে তার সংক্ষিপ্তসারগুলি দেখায় এই গ্রন্থাগার

.NET বিকাশকারীদের জন্য একটি সম্পূর্ণ অবজেক্ট রেফারেন্স উপলব্ধ।