سنڌي او سي آر سي # ۽ .ٽان ۾

ھن دستاويز جا ٻيا نسخو:

IronOCR هڪ C#سافٽويئر جزو آهي. NET ڪوڊرز 126 ٻولي ۾ تصويرون ۽ PDF دستاويزن مان متن پڙهڻ لاءِ ، سنڌي سميت.

اهو ٽرسٽيڪٽ جو ترقي يافته ڪانٽو آهي ، خاص طور تي اين اي ٽي ڊولپرز لاءِ ٺاهيو ويو آهي ۽ باقائدگي ۽ درستگيءَ سان ٻئي ٽيسٽ ٽيسٽ انجنز کي باقاعدي طور تي بهتر ڪري ٿو.

IronOcr.Languages.Sindhi جو مواد

هن پيڪيج ۾ 43 او سي آر ٻوليون شامل آهن .NET:

  • سنڌي
  • سنڌي بيسٽ
  • سنڌي فاسٽ

ڊائون لوڊ ڪريو

سنڌي ٻولي پيڪ [सिन्धी]
* Download as زيڊ
* Install with
https://www.nuget.org/packages/IronOcr.Languages.Sindhi/'> نياگٽ

انسٽاليشن

اسان کي پنهنجي سنڌي او سي آر پيڪيج کي انسٽال ڪرڻ آهي .هئي منصوبو.

PM> Install-Package IronOCR.Languages.Sindhi

ڪوڊ جو مثال

ھي C#ڪوڊ مثال طور سنڌي متن کي تصويري يا PDF دستاويزن مان پڙهي ٿو.

//PM> Install-Package IronOcr.Languages.Sindhi
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;
using (var Input = new OcrInput(@"images\Sindhi.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Sindhi
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;
using (var Input = new OcrInput(@"images\Sindhi.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Sindhi
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sindhi
Using Input = New OcrInput("images\Sindhi.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

آئرن او سي آر ڇو چونڊيو؟

لوھ او سي آر هڪ آسان انسٽال ، مڪمل ۽ سٺو دستاويز آھي .NET سافٽ ويئر لائبريري.

99.8٪ حاصل ڪرڻ لاءِ آئرن او سي آر چونڊيو + او سي آر درستگي بغير ڪنهن ٻاهرين ويب خدمتن ، جاري ويندڙ فيس يا انٽرنيٽ تي خفيه دستاويز موڪلڻ.

سي # ڊولپرز وينلا ٽريسرٽ مٿان آئرن او سي آر چونڊيندا آهن:

  • هڪ ڊي ايل يا نگٽ طور انسٽال ڪيو
  • ٽيزرٽڪس 5 ، 4 ۽ 3 انجنز کي دٻي مان شامل ڪن ٿا.
  • درستگي 99.8 ٪ باقاعده ٽيسر جي ڪارڪردگي کان وڌيڪ.
  • ٻرندڙ رفتار ۽ ملٽي ٽرينڊنگ
  • MVC ، ويب ايپ ، ڊيسڪٽاپ ، ڪنسول ۽ سرور ايپليڪيشن مطابقت رکندڙ
  • ڪم ڪرڻ لاءِ ڪو ايڪسز يا سي ++ ڪوڊ ناهي
  • مڪمل پي ڊي ايف او سي مدد
  • او سي آر کي انجام ڏيڻ لاءِ تقريبن ڪنهن تصويري فائل يا پي ڊي ايف کي انجام ڏيڻ
  • مڪمل. خالص ڪور ، معياري ۽ فريم ورڪ جي مدد
  • ونڊوز ، ميڪ ، لينڪس ، ايزور ، ڊوکر ، لمبا ، AWS تي ترتيب ڏيو
  • بارڪوڊس ۽ QR ڪوڊ پڙهو
  • XHTML ڏانھن او سي آر ٻاھر موڪليو
  • ڳوليل پي ايڇ ڊي دستاويزن کي او سي آر برآمد ڪريو
  • ملٽي ٽرڻ واري مدد
  • 126 بين الاقوامي ٻوليون سڀئي ٺاھيو NuGet يا OcrData فائلن ذريعي
  • تصويرون ڪ ،و ، همراه ، شماريات ۽ فانٽ. رڳو متن نه.
  • ٽيسيسٽرڪ او سي آر کي تجارتي ۽ ملڪيت جي ايپليڪيشنن ۾ ٻيهر ورهائڻ لاءِ استعمال ڪري سگهجي ٿو.

لوھ او سي آر چمڪندي آھي جڏھن حقيقي دنيا جي تصويرن سان گڏ ڪم ڪري رھيا آھن ۽ ناممڪن دستاويز جھڙوڪ تصويرون ، يا گھٽ ريزوليوشن جا اسڪين جيڪي ڊجيٽل شور يا نقصن آھن.

ٻيون مفت او سي آر لائبريريون.

او سي آر ٽائيسر 5 سان گڏ - سي # ۾ ڪوڊنگ شروع ڪريو.

هيٺ ڏنل ڪوڊ جو نمونو ڏيکاري ٿو ته C#يا VB .NET استعمال ڪندي تصوير مان متن پڙهڻ ڪيتري آسان آهي.

ون لائنر

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

ترتيب وار هيلو ورلڊ

// PM> Install-Package IronOCR.Languages.Sindhi
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... توهان تصويرون جو به انگ شامل ڪري سگهو ٿا
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Sindhi
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... توهان تصويرون جو به انگ شامل ڪري سگهو ٿا
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Sindhi
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sindhi
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

سي # پي ڊي ايف او سي آر

ساڳيو طريقو ساڳيو ئي ڪنهن پي ڊي ايف دستاويز مان متن ڪ toڻ لاءِ استعمال ڪري سگهجي ٿو

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// اسان او سي آر کي مخصوص پي PDF صفحن جي چونڊ پڻ چونڊي سگھو ٿا

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// پي ڊي ايف جي هر پيج لاءِ 1 پيج
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// اسان او سي آر کي مخصوص پي PDF صفحن جي چونڊ پڻ چونڊي سگھو ٿا

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// پي ڊي ايف جي هر پيج لاءِ 1 پيج
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sindhi
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' اسان او سي آر کي مخصوص پي PDF صفحن جي چونڊ پڻ چونڊي سگھو ٿا

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' پي ڊي ايف جي هر پيج لاءِ 1 پيج
End Using
VB   C#

او پي سي آر ملٽي پيج آئي ٽي ايف لاءِ

OCR پڙهو TIFF فائل فارميٽ سميت ڪيترائي پيج دستاويز TIFF سڌو سنئون PDF فائل ۾ پڻ ڳولا لائق متن ۾ تبديل ٿي سگھي ٿو.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sindhi

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

بارڪوڊس ۽ QR

آئرن او سي آر جي هڪ خاص خصوصيت اها آهي ته اهو دستاويزن مان بارڪوڊ ۽ ق آر ڪوڊ پڙهي سگهي ٿو جڏهن اهو متن لاءِ اسڪين ڪري رهيو هجي. OcrResult.OcrBarcode ڪلاس جا مثال ، ڊولپر کي هر اسڪين ٿيل بارڪوڊ بابت تفصيلي OcrResult.OcrBarcode ڏي ٿو.

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// قسم ۽ جڳهن جون ملڪيتون به پڌرو ٿيون
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// قسم ۽ جڳهن جون ملڪيتون به پڌرو ٿيون
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' قسم ۽ جڳهن جون ملڪيتون به پڌرو ٿيون
Next Barcode
End Using
VB   C#

او سي آر تصويرن جي مخصوص علائقن تي

آئرن او سي آر جي سکيننگ ۽ پڙهڻ جي سڀني طريقن کي قابليت مهيا ڪري ٿي ته ڪنهن صفحات يا صفحن جو ڪهڙو حصو اسين متن پڙهڻ چاهيندا آهيون. اهو تڏهن تمام مفيد آهي جڏهن اسان معياري شڪل کي ڏسي رهيا آهيون ۽ گهڻو وقت بچائي سگهندا ۽ ڪارڪردگي بهتر بڻائي سگهنداسين.

فصلن جي علائقن کي استعمال ڪرڻ لاء، اسان کي هڪ نظام جي حوالي شامل ڪرڻ جي ضرورت پوندي System.Drawing پوء اسان کي استعمال ڪري سگهو ٿا ته System.Drawing.Rectangle شئي.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// طول و عرض پي ايڪس ۾ آھن

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// طول و عرض پي ايڪس ۾ آھن

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sindhi

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' طول و عرض پي ايڪس ۾ آھن

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

او آر سي گهٽ معيار واري اسڪينس لاءِ

The IronOCR OcrInput ڪلاس اسڪينس کي درست ڪري سگھي ٿو جيڪي عام Tesseract پڙهي نٿا سگھن.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ڊجيٽل شور ۽ خراب اسڪيننگ کي درست ڪري ٿو
Input.Deskew(); // گردش ۽ نظارو درست ڪري ٿو
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ڊجيٽل شور ۽ خراب اسڪيننگ کي درست ڪري ٿو
Input.Deskew(); // گردش ۽ نظارو درست ڪري ٿو
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sindhi

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ڊجيٽل شور ۽ خراب اسڪيننگ کي درست ڪري ٿو
Input.Deskew() ' گردش ۽ نظارو درست ڪري ٿو
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

او سي آر جا نتيجا ڳولھيو PDF ڳولي

نقل واري متن واري اسٽرنگ سان پي ڊي ايف تي تصوير. سرچ انجن ۽ ڊيٽابيس ذريعي انڊيڪس ڪري سگهجي ٿو.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sindhi

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

TIFF ڳولھندڙ پي وي ايف ڪنورليشن لاءِ

هڪ TIFF دستاويز (يا تصويري فائلن جو ڪو گروپ) سڌي طرح سرچ لائق پي ڊي ايف ۾ تبديل ڪريو جيڪا انڊٽريٽ ، ويبسائيٽ ۽ گوگل سرچ انجڻ ذريعي ترتيب ڏني وڃي.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sindhi

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

اي سي آر جا نتيجا HTML وانگر برآمد ڪريو

او سي آر جي تصوير کي XHTML تبديلي.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sindhi
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

او سي آر تصوير بهتر ڪندڙ فلٽر

آئرن او سي آر او سي آر جي ڪارڪردگي کي بهتر بڻائڻ لاءِ OcrInput شين لاءِ ڌار فلٽر فراهم ڪري ٿو.

تصويرن جي واڌاري جو ڪوڊ مثال

او سي آر نتيجن کي بهتر ، تيز او آر سي نتيجا پيدا ڪرڻ لاءِ او سي آر ان پٽ تصويرن کي وڌيڪ معيار بڻائي ٿو.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ڊجيٽل شور ۽ خراب اسڪيننگ کي درست ڪري ٿو
Input.Deskew(); // گردش ۽ نظارو درست ڪري ٿو
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ڊجيٽل شور ۽ خراب اسڪيننگ کي درست ڪري ٿو
Input.Deskew(); // گردش ۽ نظارو درست ڪري ٿو
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sindhi

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ڊجيٽل شور ۽ خراب اسڪيننگ کي درست ڪري ٿو
Input.Deskew() ' گردش ۽ نظارو درست ڪري ٿو
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

او سي آر تصويري فلٽرن جي لسٽ

او سي آر ڪارڪردگي کي وڌائڻ لاءِ انپٽ فلٽر جيڪي IronOCR ۾ ٺهيل آهن انهن ۾ شامل آهن:

  • OcrInput.Rotate (ٻيئي درجي) - گھڻن گھڙيون وارين تصويرون تصويرون گھمائيندو گھڙي وار وانگر ، ناڪاري نمبر استعمال ڪريو.
  • OcrInput.Binarize () - ھي تصويري فلٽر ھر وچ عڪس کي وچ واري زمين سان ڀوري يا اڇي رنگ مٽائيندو آھي . متن جي پس منظر جي تمام گهٽ تڪرار جي او سي آر جي ڪارڪردگي وارا ڪيس بهتر ڪري سگھن ٿا.
  • OcrInput.ToGrayScale () - ھي تصويري فلٽر ھر پکسل کي گري اسڪيل جي ڇانو ۾ بدلائي ٿو. او سي آر جي درستگي کي وڌائڻ بهتر ناهي پر رفتار کي بهتر ڪري سگھي ٿو
  • OcrInput.Contrast () - پاڻمرادو تڪرار وڌائي ٿو. اهو فلٽر گهڻو ڪري او سي آر جي رفتار ۽ درستگي گهٽ برعڪس اسڪينن ۾ بهتر ڪندو آهي.
  • OcrInput.DeNoise () - ڊجيٽل شور کي ختم ڪري ٿو. هي فلٽر صرف ان صورت ۾ استعمال ڪرڻ گهرجي جتي شور جي توقع هجي.
  • OcrInput.Invert () - ھر رنگ کي Inيرائي ٿو. مثلا اڇا اڇا ٿي ويندا آهن: ڪارا اڇا ٿي ويندا آهن.
  • OcrInput.Dilate () - جديد مورفولوجي. دلولي ، هڪ تصوير ۾ شين جي حدن ۾ پکسلز شامل ڪندو آهي. ايروڊ جي سامهون
  • OcrInput.Erode () - جديد مورفولوجي. Erosion تي Dilate جي اعتراض boundariesOpposite جا جزا لاھيندو
  • OcrInput.Deskew () - ھڪڙي تصوير کي گھمائيندو آھي تنھنڪري اھو صحيح طريقو مٿي ۽ آرٿوگونل آھي. اهو او سي آر لاءِ تمام گهڻو فائديمند آهي ڇاڪاڻ ته ترچيل جاچ لاءِ تيزيري رواداري 5 درجا گهٽ ٿي سگهي ٿي.
  • OcrInput.DeepCleanBackgroundNoise () - سخت پس منظر شور کي ختم ڪرڻ. صرف هن فلٽر کي استعمال ڪريو صرف صورت ۾ انتهائي دستاويزي پس منظر شور isاڻايل آهي ، ڇاڪاڻ ته اهو فلٽر به او سي آر جي صاف دستاويزن جي درستگي کي گهٽائڻ جو خطرو هوندو ، ۽ تمام سي پي يو قيمتي آهي
  • OcrInput.EnhanceResolution - گهٽ معيار وارا تصويرن جي قرارداد کي وڌائيندو آهي. ھن فلٽر کي گھڻي ضرورت ناھي ڇو جو OcrInput.MinimumDPI ۽ OcrInput.TargetDPI خودڪار طريقي سان گھٽ ريزوليوشن انپٽ کي پڪ ۽ حل ڪندا

صاف صاف ميدان وارو گوڙ. اها هڪ سيٽنگ آهي جيڪا ڪجهه وقت وڃائيندڙ آهي ؛ بهرحال ، اها لائبريري کي ڊجيٽل تصوير سان پاڻمرادو صاف ڪرڻ ، پيپر ڪرپٽ ۽ ٻين خرابين کي ڊجيٽل تصوير جي اندر پهچائڻ جي اجازت ڏي ٿي جيڪا ٻي صورت ۾ اهو ٻين او سي آر لائبريرين طرفان پڙهڻ جي قابل نه بڻجندي.

EnhanceContrast هڪ سيٽنگ آهي جنهن جي ڪري آئرن او سي آر هڪ تصوير جي پس منظر جي خلاف متن جي تضاد کي پاڻمرادو وڌائي ٿي ، OCR جي درستگي کي وڌائي ۽ عام طور تي ڪارڪردگي ۽ OCR جي رفتار کي وڌائي.

EnhanceResolution هڪ سيٽنگ آهي جيڪا گهٽ ريزوليشن واري تصويرن جي نشاندهي ڪندي (جيڪي 275 dpi کان گهٽ آهن) ۽ پاڻمرادو scوٽو وڌائيندي ۽ پوءِ س allي متن کي تيز ڪري ڇڏين ته اها مڪمل طور تي او سي آر لائبريري سان پڙهي سگهجي ٿي. جيتوڻيڪ اهو آپريشن پنهنجو پاڻ ۾ وقت ڏيڻ وارو آهي ، اهو عام طور تي هڪ تصوير تي او سي آر آپريشن جي مجموعي وقت کي گهٽائي ٿو.

ٻولي آئرن او سي آر 22 بين الاقوامي ٻولين وارو پيڪ سپورٽ ڪري ٿي ، ۽ ٻولي سيٽنگ هڪ يا وڌيڪ ڪيترن ئي ٻولين کي چونڊڻ لاءِ استعمال ڪري سگهجي ٿي او سي آر آپريشن لاءِ لاڳو ٿيڻ لاءِ.

حڪمت عملي آئرن او سي آر ٻن حڪمت عملين جي مدد ڪندو آهي. اسان يا ته چونڊون ٿا يا ته ڪنهن دستاويزن جي تيز ۽ گهٽ درست اسڪين لاءِ ، يا هڪ ترقي يافته حڪمت عملي استعمال ڪئي وئي جيڪا او آر سي متن جي درستگي کي پاڻمرادو بهتر ڪرڻ جي لاءِ ڪجهه مصنوعي ذهانت وارو ماڊل استعمال ڪندي لفظن جي شمارياتي رشتي کي هڪ جملو ۾ ڏسي .

رنگ اسپيس هڪ سيٽنگ آهي جنهن جي ذريعي اسان خاڪي رنگ يا رنگ ۾ OCR چونڊي سگهون ٿا. عام طور تي ، گري اسڪيل هڪ بهترين آپشن آهي. جيتوڻيڪ ، ڪڏهن ڪڏهن ، جڏهن اهڙا ساڳيا رنگن جا متن يا پس منظر هوندا آهن پر تمام مختلف رنگن سان ، مڪمل رنگ وارو رنگ بهتر نتيجا مهيا ڪندو.

DetectWhiteTextOnDarkBackgrounds. عام طور تي ، او سي آر جون تمام لائبريريون توقع ڪن ٿيون ته ڪاري رنگ اڇي پس منظر تي. اها ترتيب آئرن او سي آر کي پاڻمرادو منفيات ، يا اڇي متن سان اڇي صفحن کي پاڻمرادو ڳولڻ ، ۽ انهن کي پڙهڻ جي اجازت ڏئي ٿي.

انپٽ آئي ايمج ٽائيپ. اها ترتيب ڊولپر کي او سي آر لائبريري کي هدايت ڪرڻ جي اجازت ڏئي ٿي ته ڇا اهو مڪمل دستاويز يا سنيپٽ ڏسي رهيو آهي ، جهڙوڪ اسڪرين شاٽ.

RotateAndStraighten هڪ ترقي يافته سيٽنگ آهي جيڪا آئرن او سي آر کي دستاويزن پڙهڻ جي منفرد قابليت جي اجازت ڏي ٿي جيڪي نه رڳو گھميون ، پر شايد تناظر تي مشتمل هجن ، جهڙوڪ ٽيڪسٽ دستاويزن جون تصويرون.

ReadBarcodes هڪ مفيد خاصيت آهي جيڪا آئرن او سي آر کي صفحن تي پاڻمرادو بارڪوڊ ۽ QR ڪوڊ پڙهڻ جي اجازت ڏئي ٿي جئين اهو متن به پڙهي پوي ، بغير هڪ وڏو اضافي وقت جي لوڊ شامل ڪيو وڃي.

رنگ جي کوٽائي. اها جوڙجڪ او سي آر لائبريري ڪيتري بٽس في پکسل ڪتب آڻيندي ڪنهن رنگ جي کوٽائي کي استعمال ڪندي. وڌيڪ رنگن جي کوٽائي شايد او سي آر جي معيار کي وڌائي سگھي ٿي ، پر او سي آر آپريشن کي مڪمل ڪرڻ لاءِ گهربل وقت کي به وڌائي سگهندي.

126 لئنگويج پيڪ

آئرن او سي آر 126 بين الاقوامي ٻولين کي ٻولي پيڪز جي مدد ڪري ٿو جيڪي ڊي ايل ايلز وانگر ورهائي سگهجن ٿيون ، جيڪي هن ويب سائيٽ تان ڊائون لوڊ ڪري سگهجن ٿيون ، يا NuGet Package Manager مان پڻ.

ٻولين ۾ جرمن ، فرينچ ، انگريزي ، چيني ، جاپاني ۽ ٻيون ڪيتريون شامل آهن. پاسپورٽ ايم آر زيڊ ، ايم آءِ سي آر چيڪ ، مالياتي ڊيٽا ، لائسنس پليٽس ۽ ٻين ڪيترن لاءِ خصوصي ٻولي جا پيڪ موجود آهن. توهان پڻ ڪنهن به قسم جي فائل استعمال ڪري سگهو ٿا.

ٻولي مثال

ٻين او سي آر ٻوليون استعمال ڪرڻ.

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// جيڪڏهن ضرورت هجي تصويري فلٽر شامل ڪريو
// انهي حالت ۾ ، سوچي سمجهي انپٽ تمام گهٽ معيار آهي
// IronTesseract اهو پڙهي سگھي ٿو ته جيڪو روايتي Tesseract نه ٿو ڪري سگهي.

var Result = Ocr.Read(input);

// کنسول ونڊوز تي آساني سان عربي ڇپائي نه ٿو سگهي.
// اچو ته ڊسڪ جي بدران محفوظ ڪريون.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// جيڪڏهن ضرورت هجي تصويري فلٽر شامل ڪريو
// انهي حالت ۾ ، سوچي سمجهي انپٽ تمام گهٽ معيار آهي
// IronTesseract اهو پڙهي سگھي ٿو ته جيڪو روايتي Tesseract نه ٿو ڪري سگهي.

var Result = Ocr.Read(input);

// کنسول ونڊوز تي آساني سان عربي ڇپائي نه ٿو سگهي.
// اچو ته ڊسڪ جي بدران محفوظ ڪريون.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' جيڪڏهن ضرورت هجي تصويري فلٽر شامل ڪريو
' انهي حالت ۾ ، سوچي سمجهي انپٽ تمام گهٽ معيار آهي
' IronTesseract اهو پڙهي سگھي ٿو ته جيڪو روايتي Tesseract نه ٿو ڪري سگهي.

Dim Result = Ocr.Read(input)

' کنسول ونڊوز تي آساني سان عربي ڇپائي نه ٿو سگهي.
' اچو ته ڊسڪ جي بدران محفوظ ڪريون.
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

گھڻائي ٻولي جو مثال

اهو پڻ ممڪن آهي ته هڪ ئي وقت ڪيترن ئي ٻولين کي استعمال ڪندي او سي آر کي. اهو واقعي يونيڪوڊ دستاويزن ۾ انگريزي ٻولي ميٽا ۽ urls حاصل ڪرڻ ۾ مدد ڪري سگهي ٿو.

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Sindhi);

// اسان ٻولين جو تعداد شامل ڪري سگهون ٿا

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Sindhi);

// اسان ٻولين جو تعداد شامل ڪري سگهون ٿا

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Sindhi)

' اسان ٻولين جو تعداد شامل ڪري سگهون ٿا

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

تفصيلي او سي آر جا نتيجا آبجیکٹ

آئرن او سي آر او آر سي جي ھر ھڪڙي شئي لاءِ او سي آر جو نتيجو واري مقصد واپس ڪري ٿو. عام طور تي ، ڊولپر صرف ان شيٽ جي ملڪيت کي استعمال ڪندا آهن متن کان اسڪين ٿيل شڪل حاصل ڪرڻ لاءِ. تنهن هوندي ، او سي آر جا نتيجا DOM انهي کان وڌيڪ ترقي يافته آهن.

using IronOcr;
using System.Drawing; //اسيمبلي جو حوالو شامل ڪريو

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! اهم

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// وڏي ، تفصيلي API ڳولڻ لاءِ هتي ڳولهيو:
// - صفحا ، بلاڪ ، خطاطي ، لکير ، لفظ ، چارس
// - تصويري برآمد ، فانٽ ڪوآرڊينيٽ ، شمارياتي ڊيٽا
}
using IronOcr;
using System.Drawing; //اسيمبلي جو حوالو شامل ڪريو

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sindhi;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! اهم

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// وڏي ، تفصيلي API ڳولڻ لاءِ هتي ڳولهيو:
// - صفحا ، بلاڪ ، خطاطي ، لکير ، لفظ ، چارس
// - تصويري برآمد ، فانٽ ڪوآرڊينيٽ ، شمارياتي ڊيٽا
}
Imports IronOcr
Imports System.Drawing 'اسيمبلي جو حوالو شامل ڪريو

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sindhi
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '! اهم

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' وڏي ، تفصيلي API ڳولڻ لاءِ هتي ڳولهيو:
' - صفحا ، بلاڪ ، خطاطي ، لکير ، لفظ ، چارس
' - تصويري برآمد ، فانٽ ڪوآرڊينيٽ ، شمارياتي ڊيٽا
End Using
VB   C#

ڪارڪردگي

آئرن او سي آر ڪم کي دٻي سان گڏ ڪم ڪري ٿو يا ان پٽن جي تصويرن کي وڏي پئماني تي تبديل ڪرڻ جي ضرورت ناهي.

رفتار ٻرندڙ آهي: IronOcr.2020 + 10 ڀيرا وڌيڪ تيزي سان آھي ۽ اڳين اڏاوتن جي ڀيٽ ۾ 250٪ کان گھٽ غلطيون ٿو ڪري

وڌيڪ سکو

سي # ، وي بي ، ايف # ، يا ڪنهن ٻي ۾ او سي آر بابت وڌيڪ اڻڻ لاءِ ، مهرباني ڪري اسان جي ڪميونٽي جا سبق پڙهو ، جيڪي حقيقي دنيا جا مثال پيش ڪن ته آئرن او سي آر ڪيئن استعمال ٿي سگهي ٿو ۽ شايد انهي کي نڀائيندو ته بهترين کان ڪيئن حاصل ڪجي. هيءَ لائبريري.

.NET ڊولپرز لاءِ هڪ مڪمل اعتراض جو حوالو پڻ موجود آهي.