সি # এবং .নেটে বাংলা ওসিআর
এই দসতাবেজের অনযানয সংসকরণ:
আযরনসিআর হ'ল সি # সফটওযযার উপাদান যা নেট। কোডারদের বাংলা সহ 126 ভাষায চিতর এবং পিডিএফ নথি থেকে পাঠয পডতে দেয।
এটি টেসটেরাকটের একটি উননত কাটাচামচ, এটি কেবলমাতর নেট নেট বিকাশকারীদের জনয নিরমিত এবং গতি এবং যথারথতার জনয নিযমিতভাবে অনযানয টেসটরাক ইঞজিনকে ছাপিযে যায।
আযরনঅক.আর.লযাঙগোযেজস.বাঙগালি এর সামগরীসমহ
এই পযাকেজে .NET এর জনয 114 টি ওসিআর ভাষা রযেছে:
- বাংলা
- বেঙগলিসটে
- বেঙগলিফাসট
- বেঙগলিআলফেট
- বাংলাআলাভবেট বেসট
- বেঙগলিআলফবেটসট
ডাউনলোড করন
বাংলা ভাষা পযাক [বাংলা]
Download as জিপ
Install with as https://www.nuget.org/packages/IronOcr.Languages.Bengali/
সথাপন
আমাদের পরথমে আপনাকে আমাদের নেট ওজেট পরকলপে আমাদের বাংলা ওসিআর পযাকেজ ইনসটল করতে হবে।
PM> Install-Package IronOCR.Languages.Bengali
কোড উদাহরণ
এই সি # কোড উদাহরণটি কোনও চিতর বা পিডিএফ ডকমেনট থেকে বাংলা পাঠয পডবে।
// PM> Install-Package IronOcr.Languages.Bengali
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"images\Bengali.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
// PM> Install-Package IronOcr.Languages.Bengali
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"images\Bengali.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
' PM> Install-Package IronOcr.Languages.Bengali
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput("images\Bengali.png")
Dim Result = Ocr.Read(Input)
Dim AllText = Result.Text
End Using
কেন আযরনওসিআর বেছে নিন?
আযরনওসিআর হ'ল একটি ইনসটল করা সহজ, সমপরণ এবং ডকমেনটেড .NET সফটওযযার লাইবরেরি।
কোনও বাহযিক ওযেব পরিষেবা বযবহার না করে চলমান ফি বা ইনটারনেটে গোপনীয ডকমেনট পরেরণ না করে 99.8% + ওসিআর নিরভলতা অরজনের জনয আযরনওসিআর বেছে নিন।
কেন সি # বিকাশকারীরা ভযানিলা পরীকষার চেযে আযরনওসিআর বেছে নেয:
- একটি একক ডিএলএল বা NuGet হিসাবে ইনসটল করন
- বাকসের বাইরে 5, 4 এবং 3 ইঞজিনের জনয অনতরভকত।
- নিরভলতা 99.8% নিযমিত টেসটেরাকটকে উললেখযোগযভাবে ছাডিযে যায।
- জবলনত গতি এবং মালটিথরেডিং
- এমভিসি, ওযেব অযাপ, ডেসকটপ, কনসোল এবং সারভার অযাপলিকেশন সামঞজসযপরণ
- কাজ করার জনয কোনও একসেস বা সি ++ কোড নেই
- সমপরণ পিডিএফ ওসিআর সমরথন
- ওসিআর পরায কোনও চিতর ফাইল বা পিডিএফ সমপাদন করতে
- সমপরণ .NET কোর, সটযানডারড এবং ফরেমওযারক সমরথন
- উইনডোজ, মযাক, লিনাকস, অযাজরে, ডকার, লযামবদা, এডাবলএস-এ সথাপন করন
- বারকোড এবং কিউআর কোডগলি পডন
- একসএইচটিএমএল হিসাবে ওসিআর রফতানি করন
- অনসনধানযোগয পিডিএফ ডকমেনটগলিতে ওসিআর রফতানি করন
- মালটিথরেডিং সমরথন
- 126 আনতরজাতিক ভাষা সবই NuGet বা ওসিআরডাটা ফাইলের মাধযমে পরিচালিত
- চিতর, সথানাঙক, পরিসংখযান এবং ফনটগলি বের করন। শধ পাঠয নয।
- বাণিজযিক ও মালিকানাধীন অযাপলিকেশনগলির মধযে পরীকষামলক ওসিআর পনরায বিতরণ করতে বযবহার করা যেতে পারে।
আযরনওসিআর বাসতব বিশবের চিতর এবং অসমপরণ নথি যেমন ফটোগরাফ, বা লো রেজোলিউশনের সকযানগলির সাথে কাজ করার সময জবলজবল করে যেখানে ডিজিটাল শবদ বা অসমপরণতা থাকতে পারে।
.NET পলযাটফরমের জনয অনযানয নিখরচায ওসিআর লাইবরেরি যেমন অনযানয .NET টেসারেকট এপিআই এবং ওযেব পরিষেবা এই বাসতব বিশবের বযবহারের কষেতরে এত ভাল সমপাদন করে না।
পরীকষামলক 5 সহ ওসিআর - সি # তে কোডিং শর করন
নীচের কোডের নমনাটি দেখায যে সি # বা ভিবি .NET বযবহার করে কোনও চিতর থেকে পাঠয পডা কতটা সহজ।
এক রৈখিক
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
কনফিগার হযালো ওযারলড
// PM> Install-Package IronOCR.Languages.Bengali
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
Input.AddImage("images/sample.jpeg");
//... আপনি যে কোনও সংখযা যকত করতে পারেন
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Bengali
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
Input.AddImage("images/sample.jpeg");
//... আপনি যে কোনও সংখযা যকত করতে পারেন
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Bengali
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg")
'... আপনি যে কোনও সংখযা যকত করতে পারেন
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
সি # পিডিএফ ওসিআর
একই পদধতি অনরপভাবে কোনও পিডিএফ ডকমেনট থেকে পাঠয নিষকাশন করতে বযবহার করা যেতে পারে।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// আমরা ওসিআর-তে নিরদিষট পিডিএফ পষঠার নমবরও নিরবাচন করতে পারি
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// পিডিএফ পরতি পষঠার জনয 1 পষঠা
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// আমরা ওসিআর-তে নিরদিষট পিডিএফ পষঠার নমবরও নিরবাচন করতে পারি
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// পিডিএফ পরতি পষঠার জনয 1 পষঠা
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' আমরা ওসিআর-তে নিরদিষট পিডিএফ পষঠার নমবরও নিরবাচন করতে পারি
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' পিডিএফ পরতি পষঠার জনয 1 পষঠা
End Using
মালটিপেইজ টিআইএফএফগলির জনয ওসিআর
ওসিআর পডা টিআইএফএফ ফাইল ফরমযাট একাধিক পষঠার ডকমেনট সহ। টিআইএফএফ অনসনধানযোগয পাঠয সহ সরাসরি পিডিএফ ফাইলে রপানতর করা যায।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("multi-frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("multi-frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
Input.AddMultiFrameTiff("multi-frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
বারকোডস এবং কিউআর
আযরন ওসিআরের একটি অননয বৈশিষটয এটি পাঠযের জনয সকযান করার সময নথিগলি থেকে বারকোড এবং কিউআর কোডগলি পডতে পারে। OcrResult.OcrBarcode
কলাসের উদাহরণগলি বিকাশকারীকে পরতিটি সকযান করা বারকোড সমপরকে বিশদ তথয দেয।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// পরকার এবং অবসথানের বৈশিষটযগলিও উনমকত
}
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// পরকার এবং অবসথানের বৈশিষটযগলিও উনমকত
}
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' পরকার এবং অবসথানের বৈশিষটযগলিও উনমকত
Next Barcode
End Using
চিতরগলির নিরদিষট অঞচলগলিতে ওসিআর
আযরন ওসিআরের সমসত সকযানিং এবং পডার পদধতিগলি কোনও পষঠা বা পষঠাগলির ঠিক কোন অংশ থেকে আমরা পাঠযটি পডতে চাই তা নিরদিষট করে দেওযার কষমতা সরবরাহ করে। এটি যখন খব কারযকর হয যখন আমরা পরমিত মানের ফরমগলির দিকে চেযে থাকি এবং পরচর সময সাশরয করতে এবং দকষতা উননত করতে পারি।
ফসল এলাকায বযবহার করার জনয, আমরা একটি সিসটেম রেফারেনস যোগ করার জনয পরযোজন হবে System.Drawing
যাতে আমরা বযবহার করতে পারি System.Drawing.Rectangle
অবজেকট।
using IronOcr;
using System.Drawing;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
var ContentArea = new Rectangle { X = 215, Y = 1250, Height = 280, Width = 1335 };
// মাতরা px এ রযেছে
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
using System.Drawing;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
var ContentArea = new Rectangle { X = 215, Y = 1250, Height = 280, Width = 1335 };
// মাতরা px এ রযেছে
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Imports System.Drawing
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
Dim ContentArea = New Rectangle With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' মাতরা px এ রযেছে
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
নিমনমানের সকযানগলির জনয ওসিআর
আযরন ওসিআর OcrInput
শরেণি সাধারণ OcrInput
পডতে পারে না এমন সকযানগলি ঠিক করতে পারে।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ডিজিটাল শবদ এবং দরবল সকযানিং ঠিক করে
Input.Deskew(); // ঘরণন এবং দষটিভঙগি সথির করে
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ডিজিটাল শবদ এবং দরবল সকযানিং ঠিক করে
Input.Deskew(); // ঘরণন এবং দষটিভঙগি সথির করে
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ডিজিটাল শবদ এবং দরবল সকযানিং ঠিক করে
Input.Deskew() ' ঘরণন এবং দষটিভঙগি সথির করে
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
অনসনধানযোগয পিডিএফ হিসাবে ওসিআর ফলাফল রফতানি করন
অনলিপিযোগয পাঠয সটরিং সহ পিডিএফএমে চিতর অনসনধান ইঞজিন এবং ডেটাবেস দবারা সচকযকত হতে পারে।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
Input.Title = "Quarterly Report"
Input.AddImage("image1.jpeg")
Input.AddImage("image2.png")
Input.AddImage("image3.gif")
Dim Result = Ocr.Read(Input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
টিআইএফএফ পিডিএফ রপানতর অনসনধানযোগয
একটি অনসনধানযোগয পিডিএফ-তে একটি টিআইএফএফ ডকমেনট (বা চিতর ফাইলগলির কোনও গরপ) রপানতর করন যা ইনটরানেট, ওযেবসাইট এবং গগল অনসনধান ইঞজিন দবারা সচিযকত করা যেতে পারে।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
Input.AddMultiFrameTiff("example.tiff")
Dim Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf")
End Using
এইচটিএমএল হিসাবে ওসিআর ফলাফল রফটানি করন
ওসিআর চিতরটি একসএইচটিএমএল রপানতরতে।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
var Result = Ocr.Read(Input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput())
{
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
var Result = Ocr.Read(Input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput()
Input.Title = "Html Title"
Input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(Input)
Result.SaveAsHocrFile("results.html")
End Using
ওসিআর চিতর বরধন ফিলটার
আযরন ওসিআর ওসিআর এর কারযকারিতা উননত করতে ওসিআর OcrInput
অবজেকটের জনয অননয ফিলটার সরবরাহ করে।
চিতর বরধন কোড উদাহরণ
ওসিআর ইনপট চিতরগলিকে আরও ভাল, দরত ওসিআর ফলাফল উতপাদন করতে উচচতর মানের করে তোলে।
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ডিজিটাল শবদ এবং দরবল সকযানিং ঠিক করে
Input.Deskew(); // ঘরণন এবং দষটিভঙগি সথির করে
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ডিজিটাল শবদ এবং দরবল সকযানিং ঠিক করে
Input.Deskew(); // ঘরণন এবং দষটিভঙগি সথির করে
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ডিজিটাল শবদ এবং দরবল সকযানিং ঠিক করে
Input.Deskew() ' ঘরণন এবং দষটিভঙগি সথির করে
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ওসিআর চিতর ফিলটারগলির তালিকা
ওসিআর পারফরমযানস বাডানোর জনয ইনপট ফিলটারগলি যা আযরণ ওসিআর-এ অনতরনিরমিত রযেছে সেগলির মধযে রযেছে:
- OcrInput.Rotate (ডাবল ডিগরি) - ঘডির কাটার কাটা কযেকটি ডিগরি দবারা চিতরগলি ঘোরান করে। অযানটি-কলকওযাইজ জনয, নেতিবাচক সংখযা বযবহার করন।
- OcrInput.Binarize () - এই চিতর ফিলটারটি মাঝারি সথলবিহীন পরতিটি পিকসেলকে কালো বা সাদা করে। বযাকগরাউনডে পাঠযের খব কম বিপরীতে ওসিআর পারফরমযানসের কষেতরে উননতি করতে পারে।
- ওসিআরআইনপট.টোগরেসকেল () - এই চিতর ফিলটারটি পরতিটি পিকসেলকে গরেসকেলের ছাযায পরিণত করে। ওসিআর নিরভলতা উননত করা অসমভব তবে গতি উননতি করতে পারে।
- ওসিআরআইনপট.কনটরাসট () - সবযংকরিযভাবে বৈপরীতয বদধি করে। এই ফিলটারটি পরাযশই কম বিপরীতে সকযানগলিতে ওসিআর গতি এবং নিরভলতার উননতি করে।
- OcrInput.DeNoise () - ডিজিটাল গোলমাল সরিযে দেয। এই ফিলটারটি কেবল তখনই বযবহার করা উচিত যেখানে শবদটি আশা করা যায।
- ওসিআরআইনপট.ইনভারট () - পরতিটি রঙ উলটে দেয। যেমন সাদা কালো হয: কালো সাদা হয।
- ওসিআরআইনপট.ডিলিট () - উননত রপচরচা । পরসারণ একটি চিতর বসত সীমানা পিকসেল যোগ করা হযেছে। এরোডের বিপরীতে।
- OcrInput.Erode () - অযাডভানসড মরফোলজি । কষযটি বসতর সীমানায পিকসেলগলি সরায।
- ওসিআরআইনপট.ডেসকিউ () - একটি চিতর ঘোরান যাতে এটি সঠিক উপাযে এবং অরথোথোনাল হয। এটি ওসিআরের পকষে খব কারযকর কারণ সকিউ সকযানগলির পরীকষার সহনশীলতা 5 ডিগরি হিসাবে কম হতে পারে।
- ওসিআরআইনপট.ডিপকলেইনবযাকগরাউনডনোইস () - ভারী পটভমি শবদের অপসারণ। চডানত নথির পটভমির গোলমাল জানা থাকলে কেবলমাতর এই ফিলটারটি বযবহার করন, কারণ এই ফিলটারটি পরিষকার নথিগলির ওসিআর যথারথতা হরাস করার ঝকিপরণ করবে এবং এটি খব সিপিইউ বযযবহল।
- OcRInput.EnhanceResolution - নিমনমানের চিতরগলির রেজোলিউশন বাডায। এই ফিলটারটি পরাযশই পরযোজন হয না কারণ ওসিআরআনপট.নিমামডিপিআই এবং ওসিআরআইনপট. টারগেটডিপিআই সবযংকরিযভাবে কম রেজোলিউশন ইনপটগলি ধরা ও সমাধান করবে।
কলিনবযাকগরাউনডনিউজ এটি এমন একটি সেটিং যা কিছটা সমযসাপেকষ; তবে এটি গরনথাগারটি ডিজিটাল চিতরের মধযে সবযংকরিযভাবে ডিজিটাল শবদ, কাগজ crumples এবং অনযানয অপরণতা পরিষকার করার অনমতি দেয যা অনযথায এটি অনযানয ওসিআর লাইবরেরি দবারা পঠনযোগযভাবে অকষম করে তোলে।
এনহানসকনটরাসট এমন একটি সেটিংস যা আযরন ওসিআরকে সবযংকরিযভাবে কোনও চিতরের পটভমির বিপরীতে পাঠযের বৈসাদশয বাডিযে তোলে, ওসিআরের যথারথতা বদধি করে এবং সাধারনত করমকষমতা এবং ওসিআরের গতি বাডিযে তোলে।
এনহানসারেসোলিউশন এমন একটি সেটিংস যা সবলপ-রেজোলিউশন চিতরগলি (যা ২ which৫ ডিপিআই এর নীচে রযেছে) সনাকত করে এবং সবযংকরিযভাবে চিতরটিকে উপগরহ করবে এবং তারপরে সমসত পাঠযকে তীকষণ করবে যাতে এটি ওসিআর লাইবরেরি দবারা নিখতভাবে পডতে পারে। যদিও এই অপারেশনটি নিজে সময সাশরযী, তবে এটি সাধারণত কোনও চিতরের ওসিআর অপারেশনের সামগরিক সময হরাস করে।
ভাষা আযরন ওসিআর 22 টি আনতরজাতিক ভাষার পযাকগলি সমরথন করে এবং ওসিআর করিযাকলাপের জনয পরযোগ করতে এক বা একাধিক ভাষা নিরবাচন করতে ভাষা সেটিংটি বযবহার করা যেতে পারে।
কৌশল আযরন ওসিআর দটি কৌশল সমরথন করে। আমরা হয কোনও ডকমেনটের দরত এবং কম নিরভল সকযানের জনয যেতে পছনদ করতে পারি, বা একটি বাকযটিতে একে অপরের সাথে শবদের পরিসংখযানগত সমপরক দেখে সবযংকরিযভাবে ওসিআর পাঠযের যথারথতা উননত করতে কিছ কতরিম বদধিমততার মডেল বযবহার করে এমন একটি উননত কৌশল বযবহার করতে পারি ।
কালারসপেস এমন একটি সেটিংস যার মাধযমে আমরা গরেসকেল বা রঙে ওসিআর বেছে নিতে পারি। সাধারণত, গরেসকেল সেরা বিকলপ is যাইহোক, কখনও কখনও যখন একই বরণের বরণ বা খব পথক বরণের পটভমি থাকে তবে একটি পরণ বরণের বরণের সথান আরও ভাল ফলাফল সরবরাহ করে।
হোযাইটটেকসটঅন ডারকবযাকগরাউনডগলি সনাকত করন। সাধারণত, সমসত ওসিআর লাইবরেরি সাদা পটভমিতে কালো পাঠয দেখতে আশা করে। এই সেটিংটি আযরণ ওসিআরটিকে সবযংকরিযভাবে নেতিবাচক বা সাদা পাঠযযকত গা dark পষঠাগলি সনাকত করতে এবং সেগলি পডতে দেয।
ইনপটআইমেজটাইপ। এই সেটিংটি বিকাশকারীকে ওসিআর লাইবরেরিটিকে কোনও সমপরণ ডকমেনট বা সনিপেটের মতো সকরিনশটের দিকে তাকিযে আছে কিনা তা গাইড করার অনমতি দেয।
রোটেটএনডটরেইন একটি উননত সেটিং যা আযরন ওসিআরকে নথিগলি যা কেবল ঘোরানো হয না তা পডার অননয কষমতা দেয তবে সমভবত পাঠয নথির ফটোগরাফ যেমন দষটিকোণ ধারণ করে।
রিডবাকোডগলি একটি দরকারী বৈশিষটয যা আযরন ওসিআরকে সবযংকরিযভাবে পষঠাগলিতে বারকোড এবং কিউআর কোডগলি পাঠয পডায, অতিরিকত অতিরিকত সমযের বোঝা যকত না করে পডতে দেয।
রঙের ঘনতব. কোনও রঙের গভীরতা নিরধারণ করতে ওসিআর গরনথাগার পিকসেলটিতে কত বিট বযবহার করবে তা এই সেটিংটি নিরধারণ করে। একটি উচচতর রঙের গভীরতা ওসিআর গণমান বাডিযে তলতে পারে, তবে ওসিআর অপারেশনটি সমপরণ হওযার জনয পরযোজনীয সমযও বাডিযে তলবে।
126 টি ভাষা পযাক
আযরন ওসিআর 126 আনতরজাতিক ভাষাগলিকে ভাষা পযাকগলির মাধযমে সমরথন করে যা ডিএলএল হিসাবে বিতরণ করা হয, যা এই ওযেবসাইট থেকে বা নিউগেট পযাকেজ মযানেজার থেকে ডাউনলোড করা যায ।
ভাষাগলির মধযে জারমান, ফরাসী, ইংরেজি, চীনা, জাপানি এবং আরও অনেক কিছ রযেছে। পাসপোরট এমআরজেড, এমআইসিআর চেকস, ফিনানসিযাল ডেটা, লাইসেনস পলেট এবং আরও অনেক কিছর জনয বিশেষজঞ ভাষার পযাকগলি বিদযমান। আপনি নিজের তৈরির মতো যেকোনও "টেসটরেনডেটা" ফাইলও বযবহার করতে পারেন।
ভাষার উদাহরণ
অনযানয ওসিআর ভাষা বযবহার করা।
using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// পরযোজনে চিতর ফিলটার যকত করন
// এই কষেতরে, এমনকি ভাবা ইনপট খব নিমন মানের
// আযরনটেসারেকট পডতে পারে যা পরচলিত টেসারেকট না পারে।
var Result = Ocr.Read(input);
// কনসোল উইনডোজে সহজে আরবি মদরণ করতে পারে না।
// পরিবরতে ডিসকে সংরকষণ করন।
Result.SaveAsTextFile("arabic.txt");
}
using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// পরযোজনে চিতর ফিলটার যকত করন
// এই কষেতরে, এমনকি ভাবা ইনপট খব নিমন মানের
// আযরনটেসারেকট পডতে পারে যা পরচলিত টেসারেকট না পারে।
var Result = Ocr.Read(input);
// কনসোল উইনডোজে সহজে আরবি মদরণ করতে পারে না।
// পরিবরতে ডিসকে সংরকষণ করন।
Result.SaveAsTextFile("arabic.txt");
}
Imports IronOcr
' PM> Install IronOcr.Languages.Arabic
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' পরযোজনে চিতর ফিলটার যকত করন
' এই কষেতরে, এমনকি ভাবা ইনপট খব নিমন মানের
' আযরনটেসারেকট পডতে পারে যা পরচলিত টেসারেকট না পারে।
Dim Result = Ocr.Read(input)
' কনসোল উইনডোজে সহজে আরবি মদরণ করতে পারে না।
' পরিবরতে ডিসকে সংরকষণ করন।
Result.SaveAsTextFile("arabic.txt")
End Using
একাধিক ভাষার উদাহরণ
ওসিআর একই সাথে একাধিক ভাষা বযবহার করাও সমভব। এটি ইউনিকোড ডকমেনটগলিতে ইংরেজি ভাষার মেটাডেটা এবং URL পেতে সতযি সহাযতা করতে পারে।
using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Bengali);
// আমরা যে কোনও সংখযক ভাষা যকত করতে পারি
using (var input = new OcrInput())
{
input.Add("multi-language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Bengali);
// আমরা যে কোনও সংখযক ভাষা যকত করতে পারি
using (var input = new OcrInput())
{
input.Add("multi-language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
Imports IronOcr
' PM> Install IronOcr.Languages.ChineseSimplified
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Bengali)
' আমরা যে কোনও সংখযক ভাষা যকত করতে পারি
Using input = New OcrInput()
input.Add("multi-language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
বিসতারিত ওসিআর ফলাফল অবজেকটs
আযরন ওসিআর পরতিটি ওসিআর করিযাকলাপের জনয একটি ওসিআর ফলাফল অবজেকট দেয। সাধারণত, বিকাশকারীরা চিতর থেকে টেকসট সকযান করতে কেবল এই বসতর পাঠয সমপততি বযবহার করে। তবে ওসিআর ফলাফল ডিওএম এর চেযে অনেক বেশি উননত।
using IronOcr;
using System.Drawing; //বিধানসভা রেফারেনস যকত করন
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //গরতবপরণ!
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// একটি বিশাল, বিসতারিত এপিআই খজে পেতে এখানে অনবেষণ করন:
// - পষঠা, বলক, পযারাহফেলস, লাইন, শবদ, অকষর
// - চিতর রফতানি, ফনটের সমনবয, পরিসংখযানের ডেটা
}
using IronOcr;
using System.Drawing; //বিধানসভা রেফারেনস যকত করন
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Bengali;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //গরতবপরণ!
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// একটি বিশাল, বিসতারিত এপিআই খজে পেতে এখানে অনবেষণ করন:
// - পষঠা, বলক, পযারাহফেলস, লাইন, শবদ, অকষর
// - চিতর রফতানি, ফনটের সমনবয, পরিসংখযানের ডেটা
}
Imports IronOcr
Imports System.Drawing 'বিধানসভা রেফারেনস যকত করন
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Bengali
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'গরতবপরণ!
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' একটি বিশাল, বিসতারিত এপিআই খজে পেতে এখানে অনবেষণ করন:
' - পষঠা, বলক, পযারাহফেলস, লাইন, শবদ, অকষর
' - চিতর রফতানি, ফনটের সমনবয, পরিসংখযানের ডেটা
End Using
করমকষমতা
আযরন ওসিআর বকসের বাইরে পারফরমযানস টিউন বা ভারী ইনপট চিতরগলি পরিবরতন করার পরযোজন নেই কোন
গতি জবলছে: আযরনঅকরি .2020 + 10 গণ বেশি দরত এবং পরববরতী বিলডগলির তলনায 250% এরও কম তরটি করে।
আরও জানন
সি #, ভিবি, এফ #, বা অনয কোনও .NET নেট ভাষায ওসিআর সমপরকে আরও জানতে, দযা করে আমাদের সমপরদাযের টিউটোরিযালগলি পডন , যা আযরন ওসিআর কীভাবে বযবহার করা যায তার বাসতব বিশবের উদাহরণ দেয এবং কীভাবে সরবোততমভাবে বেরোতে পারে তার সংকষিপতসারগলি দেখায এই গরনথাগার
.NET বিকাশকারীদের জনয একটি সমপরণ অবজেকট রেফারেনস উপলবধ।