سی # اور .نیٹ میں اردو او سی آر

اس دستاویز کے دوسرے ورژن:

آئرن او سی آر ایک # سافٹ ویئر اجزاء ہے۔ NET کوڈروں کو اردو سمیت 126 زبان میں تصاویر اور پی ڈی ایف دستاویزات سے متن پڑھنے کی اجازت دیتا ہے۔

یہ ٹیسسرکٹ کا ایک اعلی درجے کا کانٹا ہے ، جو خصوصی طور پر .NET ڈویلپرز کے لئے بنایا گیا ہے اور رفتار اور درستگی دونوں کے ل regularly باقاعدگی سے دوسرے ٹیسریکٹ انجنوں کو آگے بڑھاتا ہے۔

IronOcr.Languages. اردو کے مشمولات

اس پیکیج میں NET کیلئے 37 OCR زبانیں ہیں۔

  • اردو
  • اردوبیسٹ
  • اردوفاسٹ

ڈاؤن لوڈ کریں

اردو زبان کا پیک [اردو]
* Download as زپ
* Install with
https://www.nuget.org/packages/IronOcr.Languages.Urdu/'> نیو گیٹ

تنصیب

سب سے پہلے ہمیں اپنے اردو OCR پیکیج کو اپنے NET پروجیکٹ پر انسٹال کرنا ہے۔

PM> Install-Package IronOCR.Languages.Urdu

کوڈ کی مثال

یہ سی # کوڈ مثال میں کسی تصویری یا پی ڈی ایف دستاویز سے اردو متن پڑھتا ہے۔

//PM> Install-Package IronOcr.Languages.Urdu
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput(@"images\Urdu.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Urdu
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput(@"images\Urdu.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Urdu
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu
Using Input = New OcrInput("images\Urdu.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

آئرن او سی آر کیوں منتخب کریں؟

آئرن او سی آر ایک انسٹال کرنے میں آسان ، مکمل اور اچھی طرح سے دستاویزی نیٹ سافٹ ویئر لائبریری ہے۔

بغیر کسی بیرونی ویب خدمات ، جاری فیسوں یا انٹرنیٹ پر خفیہ دستاویزات بھیجے بغیر 99.8٪ + OCR کی درستگی حاصل کرنے کے لئے آئرن او سی آر کا انتخاب کریں۔

کیوں سی # ڈویلپر ونیلا ٹیسریکٹ کے مقابلے میں آئرن او سی آر کا انتخاب کرتے ہیں:

  • ایک ہی DLL یا نوگیٹ کے طور پر انسٹال کریں
  • باکس سے باہر ٹیسریکٹ 5 ، 4 اور 3 انجنوں پر مشتمل ہے۔
  • درستگی 99.8٪ باقاعدگی سے ٹیسریکٹ کو نمایاں کردیتی ہے۔
  • چل چلاتی رفتار اور ملٹی تھریڈنگ
  • ایم وی سی ، ویب ایپ ، ڈیسک ٹاپ ، کنسول اور سرور ایپلی کیشن مطابقت رکھتا ہے
  • کام کرنے کیلئے کوئی Exes یا C ++ کوڈ نہیں ہے
  • مکمل پی ڈی ایف او سی آر سپورٹ
  • تقریبا کسی بھی تصویری فائل یا پی ڈی ایف کو OCR انجام دینے کے لئے
  • مکمل. نیٹ کور ، معیاری اور فریم ورک کی معاونت
  • ونڈوز ، میک ، لینکس ، Azure ، ڈوکر ، لیمبڈا ، AWS پر تعینات کریں
  • بار کوڈ اور کیو آر کوڈ پڑھیں
  • او سی آر کو ایکس ایچ ٹی ایم ایل کے بطور برآمد کریں
  • او سی آر کو تلاش کرنے کے قابل پی ڈی ایف دستاویزات میں ایکسپورٹ کریں
  • ملٹی اسٹریڈنگ سپورٹ
  • 126 بین الاقوامی زبانیں سبھی نوگیٹ یا اوکر ڈیٹا فائلوں کے ذریعہ منظم ہوتی ہیں
  • امیجز ، کوآرڈینیٹ ، شماریات اور فونٹ نکالیں۔ صرف متن ہی نہیں۔
  • تجارتی اور ملکیتی ایپلی کیشنز میں ٹیسریکٹ او سی آر کو دوبارہ تقسیم کرنے کے لئے استعمال کیا جاسکتا ہے۔

آئرن OCR چمکتے ہیں جب حقیقی دنیا کی تصاویر اور نامکمل دستاویزات جیسے تصاویر ، یا کم ریزولوشن کے اسکین کے ساتھ کام کرتے وقت جس میں ڈیجیٹل شور یا خامی ہوسکتی ہے۔

NET پلیٹ فارم کے لئے دیگر مفت OCR لائبریریاں جیسے دوسرے. نیٹ ٹیسسرکٹ APIs اور ویب سروسز دنیا کے ان حقیقی معاملات پر اتنی اچھی کارکردگی کا مظاہرہ نہیں کرتی ہیں۔

ٹیسریکٹ 5 کے ساتھ OCR - C#میں کوڈنگ شروع کریں

ذیل میں کوڈ نمونہ ظاہر کرتا ہے کہ C#یا VB NET کا استعمال کرتے ہوئے کسی تصویر سے متن کو پڑھنا کتنا آسان ہے۔

ون لائنر

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

قابل ترتیب ہیلو ورلڈ

// PM> Install-Package IronOCR.Languages.Urdu
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... آپ کسی بھی تعداد میں تصاویر شامل کرسکتے ہیں
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Urdu
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... آپ کسی بھی تعداد میں تصاویر شامل کرسکتے ہیں
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Urdu
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

سی # پی ڈی ایف او سی آر

کسی بھی پی ڈی ایف دستاویز سے متن نکالنے کے لئے اسی طرح کا نقطہ نظر استعمال کیا جاسکتا ہے۔

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// ہم OCR کے لئے مخصوص پی ڈی ایف پیج نمبر کو بھی منتخب کرسکتے ہیں

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// پی ڈی ایف کے ہر صفحے کے لئے 1 پیج
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// ہم OCR کے لئے مخصوص پی ڈی ایف پیج نمبر کو بھی منتخب کرسکتے ہیں

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// پی ڈی ایف کے ہر صفحے کے لئے 1 پیج
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' ہم OCR کے لئے مخصوص پی ڈی ایف پیج نمبر کو بھی منتخب کرسکتے ہیں

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' پی ڈی ایف کے ہر صفحے کے لئے 1 پیج
End Using
VB   C#

ملٹی پیج TIFFs کے لئے OCR

او سی آر پڑھنا TIFF فائل فارمیٹ بشمول متعدد صفحات کی دستاویزات۔ ٹی آئی ایف ایف کو بھی تلاش کے قابل متن کے ساتھ براہ راست پی ڈی ایف فائل میں تبدیل کیا جاسکتا ہے۔

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

بارکوڈ اور کیو آر

آئرن او سی آر کی ایک منفرد خصوصیت یہ ہے کہ وہ دستاویزات سے بار کوڈز اور کیو آر کوڈ پڑھ سکتی ہے جب وہ متن کی جانچ کررہی ہے۔ OcrResult.OcrBarcode کلاس کے واقعات ڈویلپر کو ہر اسکین شدہ بار کوڈ کے بارے میں تفصیلی معلومات دیتے ہیں۔

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// قسم اور مقام کی خصوصیات بھی بے نقاب
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// قسم اور مقام کی خصوصیات بھی بے نقاب
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' قسم اور مقام کی خصوصیات بھی بے نقاب
Next Barcode
End Using
VB   C#

تصاویر کے مخصوص علاقوں پر OCR

آئرن او سی آر کے تمام اسکیننگ اور پڑھنے کے طریقوں سے یہ صلاحیت مہیا ہوتی ہے کہ کسی صفحے یا صفحات کا کون سا حصہ ہم متن کو پڑھنا چاہتے ہیں۔ یہ بہت مفید ہے جب ہم معیاری شکلوں کو دیکھ رہے ہیں اور بہت زیادہ وقت بچا سکتے ہیں اور کارکردگی کو بہتر بنا سکتے ہیں۔

فصلوں کے علاقوں کو استعمال کرنے کے ل we ، ہمیں سسٹم System.Drawing لئے سسٹم کا حوالہ شامل کرنے کی ضرورت ہوگی تاکہ ہم سسٹم System.Drawing.Rectangle ۔ System.Drawing.Rectangle آبجیکٹ کا استعمال کرسکیں۔

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ابعاد px میں ہیں

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ابعاد px میں ہیں

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' ابعاد px میں ہیں

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

او سی آر برائے کم کوالٹی اسکین

آئرن او سی آر اور ان OcrInput کلاس اسکینوں کو ٹھیک کرسکتی ہے جو عام OcrInput نہیں پڑھ سکتے ہیں۔

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ڈیجیٹل شور اور ناقص سکیننگ کو ٹھیک کرتا ہے
Input.Deskew(); // گردش اور نقطہ نظر کو ٹھیک کرتا ہے
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ڈیجیٹل شور اور ناقص سکیننگ کو ٹھیک کرتا ہے
Input.Deskew(); // گردش اور نقطہ نظر کو ٹھیک کرتا ہے
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ڈیجیٹل شور اور ناقص سکیننگ کو ٹھیک کرتا ہے
Input.Deskew() ' گردش اور نقطہ نظر کو ٹھیک کرتا ہے
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

او سی آر کے نتائج کو تلاش کے قابل پی ڈی ایف کے بطور برآمد کریں

نقل کے قابل متن والے تار کے ساتھ پی ڈی ایف میں تصویر۔ سرچ انجن اور ڈیٹا بیس کے ذریعہ ترتیب دیئے جاسکتے ہیں۔

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

تلاش کرنے کے قابل پی ڈی ایف تبادلوں کیلئے TIFF

ٹی آئی ایف ایف دستاویز (یا تصویر فائلوں کے کسی گروپ) کو سیدھے تلاش پی ڈی ایف میں تبدیل کریں جس کو انٹرانیٹ ، ویب سائٹ اور گوگل سرچ انجنوں کے ذریعہ ترتیب دیا جاسکتا ہے۔

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

OCR کے نتائج کو بطور HTML برآمد کریں

OCR تصویری میں XHTML تبادلوں۔

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

OCR تصویری افزونی فلٹر

ICROCR OC کارکردگی کو بہتر بنانے کے لئے OcrInput آبجیکٹ کے لئے انوکھا فلٹر مہیا کرتا ہے۔

تصویری افزونیہ کوڈ کی مثال

او سی آر ان پٹ امیجز کو بہتر ، تیز تر او سی آر نتائج پیدا کرنے کیلئے اعلی معیار کا درجہ دیتا ہے۔

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ڈیجیٹل شور اور ناقص سکیننگ کو ٹھیک کرتا ہے
Input.Deskew(); // گردش اور نقطہ نظر کو ٹھیک کرتا ہے
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ڈیجیٹل شور اور ناقص سکیننگ کو ٹھیک کرتا ہے
Input.Deskew(); // گردش اور نقطہ نظر کو ٹھیک کرتا ہے
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ڈیجیٹل شور اور ناقص سکیننگ کو ٹھیک کرتا ہے
Input.Deskew() ' گردش اور نقطہ نظر کو ٹھیک کرتا ہے
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR تصویری فلٹرز کی فہرست

او سی آر کی کارکردگی کو بڑھانے کے لئے ان پٹ فلٹرز میں جو آئرن او سی آر میں شامل ہیں شامل ہیں:

  • OcrInput.Rotate (ڈبل ڈگری) - گھڑی کی سمت میں متعدد ڈگری کے ذریعہ تصاویر گھوماتا ہے ۔ مخالف گھڑی کے لwise ، منفی اعداد کا استعمال کریں۔
  • OcrInput.Binarize () - یہ تصویری فلٹر ہر پکسل کو سیاہ یا سفید بنا دیتا ہے جس کی درمیانی زمین نہیں ہے۔ متن کے بہت کم اس کے برعکس پس منظر سے او سی آر کی کارکردگی کے معاملات میں بہتری آسکتی ہے۔
  • OcrInput.ToGrayScale () - یہ تصویری فلٹر ہر پکسل کو گرے اسکیل کے سایہ میں بدل دیتا ہے۔ OCR کی درستگی کو بہتر بنانا نا ممکن ہے لیکن اس کی رفتار میں بہتری آسکتی ہے
  • OcrInput.Contrast () - خود بخود اس کے برعکس بڑھاتا ہے۔ یہ فلٹر اکثر کم برعکس اسکینوں میں OCR کی رفتار اور درستگی کو بہتر بناتا ہے۔
  • OcrInput.DeNoise () - ڈیجیٹل شور کو ہٹا دیتا ہے۔ یہ فلٹر صرف اس صورت میں استعمال ہونا چاہئے جہاں شور کی توقع ہے۔
  • OcrInput.Invert () - ہر رنگ کو تبدیل کرتا ہے۔ مثال کے طور پر سفید سیاہ ہو جاتا ہے: سیاہ سفید ہو جاتا ہے.
  • OcrInput.Dilate () - اعلی درجے کی شکلیں ۔ بازی ایک تصویر میں اشیاء کی حدود کو پکسلز کا اضافہ کر دیتی. ایروڈ کے مخالف
  • OcrInput.Erode () - اعلی درجے کی شکلیں ۔ کٹاؤ آبجیکٹ کی حدود پر پکسلز کو ہٹاتا ہے
  • OcrInput.Deskew () - کسی شبیہ کو گھماتا ہے تاکہ یہ صحیح راستہ ہو اور آرتھوگونل۔ یہ او سی آر کے لئے بہت مفید ہے کیونکہ اسککی اسکینوں کے لئے ٹیسریکٹ رواداری 5 ڈگری تک کم ہوسکتی ہے۔
  • OcrInput.DeepCleanBackgroundNoise () - بھاری پس منظر کا شور مٹانا ۔ صرف اس صورت میں اس فلٹر کا استعمال کریں جب انتہائی دستاویز کے پس منظر میں شور معلوم ہوا ہو ، کیونکہ یہ فلٹر صاف دستاویزات کی او سی آر کی درستگی کو کم کرنے کا خطرہ بھی رکھے گا ، اور یہ بہت سی پی یو مہنگا ہے۔
  • OcrInput.EnhanceResolution - کم معیار کی تصاویر کی ریزولوشن میں اضافہ۔ اس فلٹر کی اکثر ضرورت نہیں ہوتی ہے کیونکہ OcrInput.MinimumDPI اور OcrInput.TargetDPI خود بخود کم ریزولوشن ان پٹس کو پکڑ لے اور حل کرے گا۔

کلین بیک گراؤنڈنوائس۔ یہ ایک ایسی ترتیب ہے جو کچھ وقت طلب ہے۔ تاہم ، اس لائبریری کو ڈیجیٹل شبیہہ کے اندر خود بخود ڈیجیٹل شور ، کاغذ کے پھوڑے اور دیگر خرابیوں کو صاف کرنے کی اجازت دیتا ہے جو دوسری صورت میں اسے دیگر او سی آر لائبریریوں کے پڑھنے کے قابل نہیں بنا دیتا ہے۔

اینہنسکونسٹسٹ ایک ایسی ترتیب ہے جس کی وجہ سے آئرن او سی آر کسی بھی شبیہہ کے پس منظر کے خلاف متن کے تضاد کو خود بخود بڑھاتا ہے ، او سی آر کی درستگی میں اضافہ ہوتا ہے اور عام طور پر کارکردگی اور او سی آر کی رفتار میں اضافہ ہوتا ہے۔

اینہانس آرسولیوشن ایک ایسی ترتیب ہے جو خود کار طریقے سے کم ریزولوشن کی تصاویر (جو 275 ڈی پی آئی سے کم ہے) کا پتہ لگائے گی اور خود بخود شبیہہ کو اوپر لے جائے گی اور پھر تمام ٹیکسٹ کو تیز کردے گی تاکہ اسے او سی آر لائبریری کے ذریعہ بالکل پڑھا جاسکے۔ اگرچہ یہ آپریشن خود میں وقت طلب ہے ، لیکن عام طور پر یہ ایک شبیہہ پر OCR آپریشن کے لئے مجموعی طور پر وقت کو کم کرتا ہے۔

زبان آئرن او سی آر 22 بین الاقوامی زبان کے پیکوں کی حمایت کرتا ہے ، اور زبان کی ترتیب او سی آر آپریشن کے لئے لاگو ہونے والی ایک یا ایک سے زیادہ زبانوں کو منتخب کرنے کے ل. استعمال کی جاسکتی ہے۔

حکمت عملی آئرن OCR دو حکمت عملی کی حمایت کرتا ہے۔ ہم کسی دستاویز کی تیز اور کم درست اسکین کے ل for انتخاب کرسکتے ہیں ، یا ایک اعلی حکمت عملی کا استعمال کرسکتے ہیں جس میں الفاظ کے ایک دوسرے سے الفاظ کے اعدادوشمار کے تعلقات کو دیکھ کر خود بخود OCR متن کی درستگی کو بہتر بنانے کے لئے کچھ مصنوعی ذہانت کے ماڈل استعمال کیے جاتے ہیں۔ .

کلر اسپیس ایک ایسی ترتیب ہے جس کے تحت ہم گرے اسکیل یا رنگ میں OCR کا انتخاب کرسکتے ہیں۔ عام طور پر ، گرے اسکیل بہترین آپشن ہے۔ تاہم ، کبھی کبھی جب اسی طرح کی رنگت کے متن یا پس منظر ہوتے ہیں لیکن بہت مختلف رنگ ہوتے ہیں تو ، رنگ کی ایک مکمل رنگت بہتر نتائج فراہم کرے گی۔

وائٹ ٹیکسٹآن ڈارک بیک گراؤنڈز کا پتہ لگائیں۔ عام طور پر ، تمام او سی آر لائبریریاں سفید پس منظر پر سیاہ متن دیکھنے کی توقع کرتی ہیں۔ اس ترتیب سے آئرن او سی آر کو خود بخود منفی ، یا سفید متن والے تاریک صفحات کا پتہ لگانے اور انھیں پڑھنے کی اجازت دیتا ہے۔

ان پٹ امیج ٹائپ۔ یہ ترتیب ڈویلپر کو OCR لائبریری کی رہنمائی کرنے کی اجازت دیتی ہے کہ آیا یہ مکمل دستاویز یا اسکیپٹ ، جیسے اسکرین شاٹ کو دیکھ رہا ہے۔

روٹیٹ اینڈ سکرین ایک اعلی درجے کی ترتیب ہے جو آئرن او سی آر کو ان دستاویزات کو پڑھنے کی انوکھی صلاحیت کی اجازت دیتی ہے جو نہ صرف گھومائے جاتے ہیں ، لیکن شاید اس میں نقطہ نظر بھی ہوتا ہے ، جیسے متن کی دستاویزات کی تصاویر۔

ریڈ بارکوڈس ایک مفید خصوصیت ہے جو آئرن او سی آر کو صفحات پر خود بخود بار کوڈز اور کیو آر کوڈ پڑھنے کی اجازت دیتی ہے کیونکہ یہ متن کو بھی پڑھتا ہے ، بغیر کسی اضافی اضافے کا بوجھ۔

کلرڈیپتھ۔ اس ترتیب سے یہ طے ہوتا ہے کہ رنگ کی گہرائی کا تعین کرنے کے لئے OCR لائبریری فی پکسل کتنے بٹس استعمال کرے گی۔ رنگ کی اعلی گہرائی سے OCR کے معیار میں اضافہ ہوسکتا ہے ، لیکن OCR آپریشن کو مکمل ہونے میں درکار وقت میں بھی اضافہ ہوگا۔

126 زبان پیک

آئرن او سی آر 126 بین الاقوامی زبانوں کو زبان کے پیک کے ذریعہ سپورٹ کرتا ہے جو ڈی ایل ایل کے بطور تقسیم ہوتے ہیں ، جو اس ویب سائٹ سے ڈاؤنلوڈ کیے جاسکتے ہیں ، یا نیو گیٹ پیکیج مینیجر سے بھی ۔

زبانوں میں جرمن ، فرانسیسی ، انگریزی ، چینی ، جاپانی اور بہت کچھ شامل ہے۔ پاسپورٹ ایم آر زیڈ ، ایم آئی سی آر چیکس ، فنانشل ڈیٹا ، لائسنس پلیٹیں اور بہت ساری چیزوں کے لئے ماہر زبان کے پیک موجود ہیں۔ آپ کسی بھی ٹیسریکٹ ". ٹرینڈ ڈیٹا" فائل کو بھی استعمال کرسکتے ہیں - جس میں آپ خود بناتے ہیں۔

زبان کی مثال

OCR کی دوسری زبانیں استعمال کرنا۔

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// اگر ضرورت ہو تو تصویری فلٹرز شامل کریں
// اس معاملے میں ، یہاں تک کہ سوچا ان پٹ بہت کم معیار کا ہے
// آئرن ٹیسریکٹ پڑھ سکتا ہے کہ کون سا روایتی ٹیسسرکٹ نہیں کرسکتا۔

var Result = Ocr.Read(input);

// کنسول ونڈوز پر آسانی سے عربی پرنٹ نہیں کرسکتا ہے۔
// اس کے بجائے ڈسک میں محفوظ کریں۔
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// اگر ضرورت ہو تو تصویری فلٹرز شامل کریں
// اس معاملے میں ، یہاں تک کہ سوچا ان پٹ بہت کم معیار کا ہے
// آئرن ٹیسریکٹ پڑھ سکتا ہے کہ کون سا روایتی ٹیسسرکٹ نہیں کرسکتا۔

var Result = Ocr.Read(input);

// کنسول ونڈوز پر آسانی سے عربی پرنٹ نہیں کرسکتا ہے۔
// اس کے بجائے ڈسک میں محفوظ کریں۔
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' اگر ضرورت ہو تو تصویری فلٹرز شامل کریں
' اس معاملے میں ، یہاں تک کہ سوچا ان پٹ بہت کم معیار کا ہے
' آئرن ٹیسریکٹ پڑھ سکتا ہے کہ کون سا روایتی ٹیسسرکٹ نہیں کرسکتا۔

Dim Result = Ocr.Read(input)

' کنسول ونڈوز پر آسانی سے عربی پرنٹ نہیں کرسکتا ہے۔
' اس کے بجائے ڈسک میں محفوظ کریں۔
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

زبان کی ایک سے زیادہ مثال

او سی آر کا ایک ہی وقت میں متعدد زبانیں استعمال کرنا بھی ممکن ہے۔ اس سے یونیکوڈ دستاویزات میں انگریزی زبان کا میٹا ڈیٹا اور یو آر ایل حاصل کرنے میں واقعی مدد مل سکتی ہے۔

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Urdu);

// ہم کسی بھی زبان کو شامل کرسکتے ہیں

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Urdu);

// ہم کسی بھی زبان کو شامل کرسکتے ہیں

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Urdu)

' ہم کسی بھی زبان کو شامل کرسکتے ہیں

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

تفصیلی OCR نتائج آبجیکٹ

آئرن OCR ہر OCR آپریشن کے لئے OCR کا نتیجہ آبجیکٹ دیتا ہے۔ عام طور پر ، ڈویلپر صرف اس شے کی ٹیکسٹ پراپرٹی کو امیج سے ٹیکسٹ اسکین کرنے کے لئے استعمال کرتے ہیں۔ تاہم ، او سی آر کے نتائج ڈوم اس سے کہیں زیادہ ترقی یافتہ ہیں۔

using IronOcr;
using System.Drawing; //اسمبلی حوالہ شامل کریں

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //اہم!

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// ایک بڑے پیمانے پر ، تفصیلی API تلاش کرنے کے لئے یہاں دریافت کریں:
// - صفحات ، بلاک ، پیرافیفس ، لکیریں ، الفاظ ، حروف
// - تصویری برآمد ، فانٹ کوآرڈینیٹ ، شماریاتی اعداد و شمار
}
using IronOcr;
using System.Drawing; //اسمبلی حوالہ شامل کریں

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //اہم!

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// ایک بڑے پیمانے پر ، تفصیلی API تلاش کرنے کے لئے یہاں دریافت کریں:
// - صفحات ، بلاک ، پیرافیفس ، لکیریں ، الفاظ ، حروف
// - تصویری برآمد ، فانٹ کوآرڈینیٹ ، شماریاتی اعداد و شمار
}
Imports IronOcr
Imports System.Drawing 'اسمبلی حوالہ شامل کریں

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'اہم!

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' ایک بڑے پیمانے پر ، تفصیلی API تلاش کرنے کے لئے یہاں دریافت کریں:
' - صفحات ، بلاک ، پیرافیفس ، لکیریں ، الفاظ ، حروف
' - تصویری برآمد ، فانٹ کوآرڈینیٹ ، شماریاتی اعداد و شمار
End Using
VB   C#

کارکردگی

آئرن او سی آر باکس کے باہر کارکردگی کا مظاہرہ کرنے کی ضرورت نہیں ہے یا ان پٹ امیجز میں بہت زیادہ ترمیم کریں گے۔

رفتار تیز چل رہی ہے: آئرن او سی 2020 + 10 گنا زیادہ تیز ہے اور پچھلی تعمیرات سے 250 فیصد سے بھی کم غلطیاں کرتا ہے۔

اورجانیے

سی # ، وی بی ، ایف # ، یا کسی اور NET زبان میں OCR کے بارے میں مزید معلومات کے ل please ، براہ کرم ہمارے کمیونٹی ٹیوٹوریلز کو پڑھیں ، جس میں آئرن OCR کو کس طرح استعمال کیا جاسکتا ہے اس کی حقیقی دنیا میں مثال ملتی ہے اور ممکن ہے کہ اس سے بہتر طور پر کیسے فائدہ اٹھایا جاسکے۔ یہ لائبریری

.NET ڈویلپرز کے لئے ایک مکمل آبجیکٹ حوالہ بھی دستیاب ہے۔