<meta http-equiv="content-language" content="ur">
<h1 style="text-align:right;direction:rtl">سی # اور .نیٹ میں اردو او سی آر</h1>
<h6 style="text-align:right;direction:rtl"> اس دستاویز کے دوسرے ورژن:</h6>
<ul style="text-align:right;direction:rtl">
<li style="text-align:right;direction:rtl"> <a href="../urdu-ur">اردو میں</a></li>
<li style="text-align:right;direction:rtl"> <a href="../urdu">انگریزی</a></li>
<li style="text-align:right;direction:rtl"> <a href="../../">مزید لانگاؤز</a></li>
</ul>
<p style="text-align:right;direction:rtl"> آئرن او سی آر ایک # سافٹ ویئر اجزاء ہے۔ NET کوڈروں کو اردو سمیت 126 زبان میں
تصاویر اور پی ڈی ایف دستاویزات سے متن پڑھنے کی اجازت دیتا ہے۔</p>
<p style="text-align:right;direction:rtl"> یہ ٹیسسرکٹ کا ایک اعلی درجے کا کانٹا ہے ، جو خصوصی طور پر .NET ڈویلپرز کے
لئے بنایا گیا ہے اور رفتار اور درستگی دونوں کے ل regularly باقاعدگی سے دوسرے ٹیسریکٹ انجنوں کو آگے بڑھاتا ہے۔</p>
<h2 style="text-align:right;direction:rtl"> IronOcr.Languages. اردو کے مشمولات</h2>
<p style="text-align:right;direction:rtl"> اس پیکیج میں NET کیلئے 37 OCR زبانیں ہیں۔</p>
<ul style="text-align:right;direction:rtl">
<li style="text-align:right;direction:rtl"> اردو</li>
<li style="text-align:right;direction:rtl"> اردوبیسٹ</li>
<li style="text-align:right;direction:rtl"> اردوفاسٹ</li>
</ul>
<h2 style="text-align:right;direction:rtl"> ڈاؤن لوڈ کریں</h2>
<p style="text-align:right;direction:rtl"> اردو زبان کا پیک <span style='white-space:default'>[اردو]</span> <br/> *
Download as <a class='languages-dll' href='/csharp/ocr/packages/language-packs/Urdu.ocrdata.zip'>زپ <i
class='fa fa-download'></i></a><br/> * Install with <a target='_blank' class='languages-nuget'
href="https://www.nuget.org/packages/IronOcr.Languages.Urdu/">https://www.nuget.org/packages/IronOcr.Languages.Urdu/</a>
نیو گیٹ<i class='nuget-icon'></i></p>
<h2 style="text-align:right;direction:rtl"> تنصیب</h2>
<p style="text-align:right;direction:rtl"> سب سے پہلے ہمیں اپنے <strong>اردو</strong> OCR پیکیج کو اپنے NET پروجیکٹ پر
انسٹال کرنا ہے۔</p>
<p style="text-align:right;direction:rtl"> <code>PM> Install-Package IronOCR.Languages.Urdu</code></p>
<h2 style="text-align:right;direction:rtl"> کوڈ کی مثال</h2>
<p style="text-align:right;direction:rtl"> یہ سی # کوڈ مثال میں کسی تصویری یا پی ڈی ایف دستاویز سے اردو متن پڑھتا ہے۔
</p>
```csharp
// Install the IronOcr.Languages.Urdu package via NuGet Package Manager
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Urdu
Ocr.Language = OcrLanguage.Urdu;
// Initialize OCR input and specify the image file
using (var Input = new OcrInput(@"images\Urdu.png"))
{
// Perform OCR on the input
var Result = Ocr.Read(Input);
// Extract text from the OCR result
var AllText = Result.Text;
// Display the extracted text
Console.WriteLine(AllText);
}
<meta http-equiv="content-language" content="ur">
<h1 style="text-align:right;direction:rtl">سی # اور .نیٹ میں اردو او سی آر</h1>
<h6 style="text-align:right;direction:rtl"> اس دستاویز کے دوسرے ورژن:</h6>
<ul style="text-align:right;direction:rtl">
<li style="text-align:right;direction:rtl"> <a href="../urdu-ur">اردو میں</a></li>
<li style="text-align:right;direction:rtl"> <a href="../urdu">انگریزی</a></li>
<li style="text-align:right;direction:rtl"> <a href="../../">مزید لانگاؤز</a></li>
</ul>
<p style="text-align:right;direction:rtl"> آئرن او سی آر ایک # سافٹ ویئر اجزاء ہے۔ NET کوڈروں کو اردو سمیت 126 زبان میں
تصاویر اور پی ڈی ایف دستاویزات سے متن پڑھنے کی اجازت دیتا ہے۔</p>
<p style="text-align:right;direction:rtl"> یہ ٹیسسرکٹ کا ایک اعلی درجے کا کانٹا ہے ، جو خصوصی طور پر .NET ڈویلپرز کے
لئے بنایا گیا ہے اور رفتار اور درستگی دونوں کے ل regularly باقاعدگی سے دوسرے ٹیسریکٹ انجنوں کو آگے بڑھاتا ہے۔</p>
<h2 style="text-align:right;direction:rtl"> IronOcr.Languages. اردو کے مشمولات</h2>
<p style="text-align:right;direction:rtl"> اس پیکیج میں NET کیلئے 37 OCR زبانیں ہیں۔</p>
<ul style="text-align:right;direction:rtl">
<li style="text-align:right;direction:rtl"> اردو</li>
<li style="text-align:right;direction:rtl"> اردوبیسٹ</li>
<li style="text-align:right;direction:rtl"> اردوفاسٹ</li>
</ul>
<h2 style="text-align:right;direction:rtl"> ڈاؤن لوڈ کریں</h2>
<p style="text-align:right;direction:rtl"> اردو زبان کا پیک <span style='white-space:default'>[اردو]</span> <br/> *
Download as <a class='languages-dll' href='/csharp/ocr/packages/language-packs/Urdu.ocrdata.zip'>زپ <i
class='fa fa-download'></i></a><br/> * Install with <a target='_blank' class='languages-nuget'
href="https://www.nuget.org/packages/IronOcr.Languages.Urdu/">https://www.nuget.org/packages/IronOcr.Languages.Urdu/</a>
نیو گیٹ<i class='nuget-icon'></i></p>
<h2 style="text-align:right;direction:rtl"> تنصیب</h2>
<p style="text-align:right;direction:rtl"> سب سے پہلے ہمیں اپنے <strong>اردو</strong> OCR پیکیج کو اپنے NET پروجیکٹ پر
انسٹال کرنا ہے۔</p>
<p style="text-align:right;direction:rtl"> <code>PM> Install-Package IronOCR.Languages.Urdu</code></p>
<h2 style="text-align:right;direction:rtl"> کوڈ کی مثال</h2>
<p style="text-align:right;direction:rtl"> یہ سی # کوڈ مثال میں کسی تصویری یا پی ڈی ایف دستاویز سے اردو متن پڑھتا ہے۔
</p>
```csharp
// Install the IronOcr.Languages.Urdu package via NuGet Package Manager
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Urdu
Ocr.Language = OcrLanguage.Urdu;
// Initialize OCR input and specify the image file
using (var Input = new OcrInput(@"images\Urdu.png"))
{
// Perform OCR on the input
var Result = Ocr.Read(Input);
// Extract text from the OCR result
var AllText = Result.Text;
// Display the extracted text
Console.WriteLine(AllText);
}
آئرن او سی آر کیوں منتخب کریں؟
آئرن او سی آر ایک انسٹال کرنے میں آسان ، مکمل اور اچھی طرح سے دستاویزی نیٹ سافٹ ویئر لائبریری ہے۔
بغیر کسی بیرونی ویب خدمات ، جاری فیسوں یا انٹرنیٹ پر خفیہ دستاویزات بھیجے بغیر 99.8٪ + OCR کی درستگی حاصل کرنے کے لئے آئرن او سی آر کا انتخاب کریں۔
کیوں سی # ڈویلپر ونیلا ٹیسریکٹ کے مقابلے میں آئرن او سی آر کا انتخاب کرتے ہیں:
- ایک ہی DLL یا نوگیٹ کے طور پر انسٹال کریں
- باکس سے باہر ٹیسریکٹ 5 ، 4 اور 3 انجنوں پر مشتمل ہے۔
- درستگی 99.8٪ باقاعدگی سے ٹیسریکٹ کو نمایاں کردیتی ہے۔
- چل چلاتی رفتار اور ملٹی تھریڈنگ
- ایم وی سی ، ویب ایپ ، ڈیسک ٹاپ ، کنسول اور سرور ایپلی کیشن مطابقت رکھتا ہے
- کام کرنے کیلئے کوئی Exes یا C ++ کوڈ نہیں ہے
- مکمل پی ڈی ایف او سی آر سپورٹ
- تقریبا کسی بھی تصویری فائل یا پی ڈی ایف کو OCR انجام دینے کے لئے
- مکمل. نیٹ کور ، معیاری اور فریم ورک کی معاونت
- ونڈوز ، میک ، لینکس ، Azure ، ڈوکر ، لیمبڈا ، AWS پر تعینات کریں
- بار کوڈ اور کیو آر کوڈ پڑھیں
- او سی آر کو ایکس ایچ ٹی ایم ایل کے بطور برآمد کریں
- او سی آر کو تلاش کرنے کے قابل پی ڈی ایف دستاویزات میں ایکسپورٹ کریں
- ملٹی اسٹریڈنگ سپورٹ
- 126 بین الاقوامی زبانیں سبھی نوگیٹ یا اوکر ڈیٹا فائلوں کے ذریعہ منظم ہوتی ہیں
- امیجز ، کوآرڈینیٹ ، شماریات اور فونٹ نکالیں۔ صرف متن ہی نہیں۔
- تجارتی اور ملکیتی ایپلی کیشنز میں ٹیسریکٹ او سی آر کو دوبارہ تقسیم کرنے کے لئے استعمال کیا جاسکتا ہے۔
آئرن OCR چمکتے ہیں جب حقیقی دنیا کی تصاویر اور نامکمل دستاویزات جیسے تصاویر ، یا کم ریزولوشن کے اسکین کے ساتھ کام کرتے وقت جس میں ڈیجیٹل شور یا خامی ہوسکتی ہے۔
NET پلیٹ فارم کے لئے دیگر مفت OCR لائبریریاں جیسے دوسرے. نیٹ ٹیسسرکٹ APIs اور ویب سروسز دنیا کے ان حقیقی معاملات پر اتنی اچھی کارکردگی کا مظاہرہ نہیں کرتی ہیں۔
ٹیسریکٹ 5 کے ساتھ OCR - C#میں کوڈنگ شروع کریں
ذیل میں کوڈ نمونہ ظاہر کرتا ہے کہ C#یا VB NET کا استعمال کرتے ہوئے کسی تصویر سے متن کو پڑھنا کتنا آسان ہے۔
ون لائنر
// Perform OCR on a single image and extract text in one line
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Console.WriteLine(Text);
// Perform OCR on a single image and extract text in one line
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Console.WriteLine(Text);
' Perform OCR on a single image and extract text in one line
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
Console.WriteLine(Text)
قابل ترتیب ہیلو ورلڈ
// Full-featured example: Perform OCR on multiple images and extract text.
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Urdu
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput())
{
Input.AddImage("images/sample.jpeg");
// Add as many images as required
var Result = Ocr.Read(Input);
// Print the OCR result to the console
Console.WriteLine(Result.Text);
}
// Full-featured example: Perform OCR on multiple images and extract text.
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Urdu
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput())
{
Input.AddImage("images/sample.jpeg");
// Add as many images as required
var Result = Ocr.Read(Input);
// Print the OCR result to the console
Console.WriteLine(Result.Text);
}
' Full-featured example: Perform OCR on multiple images and extract text.
Imports IronOcr
Private Ocr = New IronTesseract()
' Set the OCR language to Urdu
Ocr.Language = OcrLanguage.Urdu
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg")
' Add as many images as required
Dim Result = Ocr.Read(Input)
' Print the OCR result to the console
Console.WriteLine(Result.Text)
End Using
سی # پی ڈی ایف او سی آر
کسی بھی پی ڈی ایف دستاویز سے متن نکالنے کے لئے اسی طرح کا نقطہ نظر استعمال کیا جاسکتا ہے۔
using IronOcr;
var Ocr = new IronTesseract();
// Set language to Urdu
Ocr.Language = OcrLanguage.Urdu;
using (var input = new OcrInput())
{
// Add a PDF file for OCR, with an optional password
input.AddPdf("example.pdf", "password");
// We can also select specific PDF page numbers for OCR
var Result = Ocr.Read(input);
// Output the extracted text
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// Output each page information in the PDF
}
using IronOcr;
var Ocr = new IronTesseract();
// Set language to Urdu
Ocr.Language = OcrLanguage.Urdu;
using (var input = new OcrInput())
{
// Add a PDF file for OCR, with an optional password
input.AddPdf("example.pdf", "password");
// We can also select specific PDF page numbers for OCR
var Result = Ocr.Read(input);
// Output the extracted text
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// Output each page information in the PDF
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set language to Urdu
Ocr.Language = OcrLanguage.Urdu
Using input = New OcrInput()
' Add a PDF file for OCR, with an optional password
input.AddPdf("example.pdf", "password")
' We can also select specific PDF page numbers for OCR
Dim Result = Ocr.Read(input)
' Output the extracted text
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' Output each page information in the PDF
End Using
ملٹی پیج TIFFs کے لئے OCR
او سی آر پڑھنا TIFF فائل فارمیٹ بشمول متعدد صفحات کی دستاویزات۔ ٹی آئی ایف ایف کو بھی تلاش کے قابل متن کے ساتھ براہ راست پی ڈی ایف فائل میں تبدیل کیا جاسکتا ہے۔
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput())
{
// Add a multi-page TIFF for OCR processing
Input.AddMultiFrameTiff("multi-frame.tiff");
var Result = Ocr.Read(Input);
// Output the OCR result
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput())
{
// Add a multi-page TIFF for OCR processing
Input.AddMultiFrameTiff("multi-frame.tiff");
var Result = Ocr.Read(Input);
// Output the OCR result
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu
Using Input = New OcrInput()
' Add a multi-page TIFF for OCR processing
Input.AddMultiFrameTiff("multi-frame.tiff")
Dim Result = Ocr.Read(Input)
' Output the OCR result
Console.WriteLine(Result.Text)
End Using
بارکوڈ اور کیو آر
آئرن او سی آر کی ایک منفرد خصوصیت یہ ہے کہ وہ دستاویزات سے بار کوڈز اور کیو آر کوڈ پڑھ سکتی ہے جب وہ متن کی جانچ کررہی ہے۔ OcrResult.OcrBarcode
کلاس کے واقعات ڈویلپر کو ہر اسکین شدہ بار کوڈ کے بارے میں تفصیلی معلومات دیتے ہیں۔
using IronOcr;
var Ocr = new IronTesseract();
// Enable barcode reading
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
// Iterate over each detected barcode
foreach (var Barcode in Result.Barcodes)
{
// Print barcode value to console
Console.WriteLine(Barcode.Value);
// Additional properties like type and location are also available
}
}
using IronOcr;
var Ocr = new IronTesseract();
// Enable barcode reading
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
// Iterate over each detected barcode
foreach (var Barcode in Result.Barcodes)
{
// Print barcode value to console
Console.WriteLine(Barcode.Value);
// Additional properties like type and location are also available
}
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Enable barcode reading
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
' Iterate over each detected barcode
For Each Barcode In Result.Barcodes
' Print barcode value to console
Console.WriteLine(Barcode.Value)
' Additional properties like type and location are also available
Next Barcode
End Using
تصاویر کے مخصوص علاقوں پر OCR
آئرن او سی آر کے تمام اسکیننگ اور پڑھنے کے طریقوں سے یہ صلاحیت مہیا ہوتی ہے کہ کسی صفحے یا صفحات کا کون سا حصہ ہم متن کو پڑھنا چاہتے ہیں۔ یہ بہت مفید ہے جب ہم معیاری شکلوں کو دیکھ رہے ہیں اور بہت زیادہ وقت بچا سکتے ہیں اور کارکردگی کو بہتر بنا سکتے ہیں۔
فصلوں کے علاقوں کو استعمال کرنے کے ل we ، ہمیں سسٹم System.Drawing
لئے سسٹم کا حوالہ شامل کرنے کی ضرورت ہوگی تاکہ ہم سسٹم System.Drawing.Rectangle
۔ System.Drawing.Rectangle
آبجیکٹ کا استعمال کرسکیں۔
using IronOcr;
using System.Drawing; // Required for defining rectangles
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput())
{
// Define the rectangular content area to be scanned
var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Coordinates are in pixels
// Add the specified area from the image file for OCR
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
// Output the OCR result
Console.WriteLine(Result.Text);
}
using IronOcr;
using System.Drawing; // Required for defining rectangles
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput())
{
// Define the rectangular content area to be scanned
var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Coordinates are in pixels
// Add the specified area from the image file for OCR
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
// Output the OCR result
Console.WriteLine(Result.Text);
}
Imports IronOcr
Imports System.Drawing ' Required for defining rectangles
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu
Using Input = New OcrInput()
' Define the rectangular content area to be scanned
Dim ContentArea = New Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' Coordinates are in pixels
' Add the specified area from the image file for OCR
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
' Output the OCR result
Console.WriteLine(Result.Text)
End Using
او سی آر برائے کم کوالٹی اسکین
آئرن او سی آر اور ان OcrInput
کلاس اسکینوں کو ٹھیک کرسکتی ہے جو عام OcrInput
نہیں پڑھ سکتے ہیں۔
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
// Handle low-quality TIFF scans for OCR
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
// Correct digital noise and skewing
Input.DeNoise(); // Fixes digital noise and poor scanning
Input.Deskew(); // Fixes rotation and perspective errors
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
// Handle low-quality TIFF scans for OCR
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
// Correct digital noise and skewing
Input.DeNoise(); // Fixes digital noise and poor scanning
Input.Deskew(); // Fixes rotation and perspective errors
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu
' Handle low-quality TIFF scans for OCR
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
' Correct digital noise and skewing
Input.DeNoise() ' Fixes digital noise and poor scanning
Input.Deskew() ' Fixes rotation and perspective errors
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
او سی آر کے نتائج کو تلاش کے قابل پی ڈی ایف کے بطور برآمد کریں
نقل کے قابل متن والے تار کے ساتھ پی ڈی ایف میں تصویر۔ سرچ انجن اور ڈیٹا بیس کے ذریعہ ترتیب دیئے جاسکتے ہیں۔
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput())
{
// Define the PDF title and add images for OCR
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
var Result = Ocr.Read(Input);
// Save result as a searchable PDF
Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput())
{
// Define the PDF title and add images for OCR
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
var Result = Ocr.Read(Input);
// Save result as a searchable PDF
Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu
Using Input = New OcrInput()
' Define the PDF title and add images for OCR
Input.Title = "Quarterly Report"
Input.AddImage("image1.jpeg")
Input.AddImage("image2.png")
Input.AddImage("image3.gif")
Dim Result = Ocr.Read(Input)
' Save result as a searchable PDF
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
تلاش کرنے کے قابل پی ڈی ایف تبادلوں کیلئے TIFF
ٹی آئی ایف ایف دستاویز (یا تصویر فائلوں کے کسی گروپ) کو سیدھے تلاش پی ڈی ایف میں تبدیل کریں جس کو انٹرانیٹ ، ویب سائٹ اور گوگل سرچ انجنوں کے ذریعہ ترتیب دیا جاسکتا ہے۔
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput())
{
// Add a multi-frame TIFF and convert it to a searchable PDF
Input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput())
{
// Add a multi-frame TIFF and convert it to a searchable PDF
Input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu
Using Input = New OcrInput()
' Add a multi-frame TIFF and convert it to a searchable PDF
Input.AddMultiFrameTiff("example.tiff")
Dim Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf")
End Using
OCR کے نتائج کو بطور HTML برآمد کریں
OCR تصویری میں XHTML تبادلوں۔
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput())
{
// Specify a title for the HTML and add the image for conversion
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
var Result = Ocr.Read(Input);
// Save result as an XHTML file
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
using (var Input = new OcrInput())
{
// Specify a title for the HTML and add the image for conversion
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
var Result = Ocr.Read(Input);
// Save result as an XHTML file
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu
Using Input = New OcrInput()
' Specify a title for the HTML and add the image for conversion
Input.Title = "Html Title"
Input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(Input)
' Save result as an XHTML file
Result.SaveAsHocrFile("results.html")
End Using
OCR تصویری افزونی فلٹر
ICROCR OC کارکردگی کو بہتر بنانے کے لئے OcrInput
آبجیکٹ کے لئے انوکھا فلٹر مہیا کرتا ہے۔
تصویری افزونیہ کوڈ کی مثال
او سی آر ان پٹ امیجز کو بہتر ، تیز تر او سی آر نتائج پیدا کرنے کیلئے اعلی معیار کا درجہ دیتا ہے۔
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
// Optimize input image for better OCR results
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
// Correct digital noise and skewing
Input.DeNoise(); // Fixes digital noise and poor scanning
Input.Deskew(); // Fixes rotation and perspective errors
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Urdu;
// Optimize input image for better OCR results
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
// Correct digital noise and skewing
Input.DeNoise(); // Fixes digital noise and poor scanning
Input.Deskew(); // Fixes rotation and perspective errors
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Urdu
' Optimize input image for better OCR results
Using Input = New OcrInput("LowQuality.jpeg")
' Correct digital noise and skewing
Input.DeNoise() ' Fixes digital noise and poor scanning
Input.Deskew() ' Fixes rotation and perspective errors
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR تصویری فلٹرز کی فہرست
او سی آر کی کارکردگی کو بڑھانے کے لئے ان پٹ فلٹرز میں جو آئرن او سی آر میں شامل ہیں شامل ہیں:
- OcrInput.Rotate (ڈبل ڈگری) - گھڑی کی سمت میں متعدد ڈگری کے ذریعہ تصاویر گھوماتا ہے ۔ مخالف گھڑی کے لwise ، منفی اعداد کا استعمال کریں۔
- OcrInput.Binarize () - یہ تصویری فلٹر ہر پکسل کو سیاہ یا سفید بنا دیتا ہے جس کی درمیانی زمین نہیں ہے۔ متن کے بہت کم اس کے برعکس پس منظر سے او سی آر کی کارکردگی کے معاملات میں بہتری آسکتی ہے۔
- OcrInput.ToGrayScale () - یہ تصویری فلٹر ہر پکسل کو گرے اسکیل کے سایہ میں بدل دیتا ہے۔ OCR کی درستگی کو بہتر بنانا نا ممکن ہے لیکن اس کی رفتار میں بہتری آسکتی ہے
- OcrInput.Contrast () - خود بخود اس کے برعکس بڑھاتا ہے۔ یہ فلٹر اکثر کم برعکس اسکینوں میں OCR کی رفتار اور درستگی کو بہتر بناتا ہے۔
- OcrInput.DeNoise () - ڈیجیٹل شور کو ہٹا دیتا ہے۔ یہ فلٹر صرف اس صورت میں استعمال ہونا چاہئے جہاں شور کی توقع ہے۔
- OcrInput.Invert () - ہر رنگ کو تبدیل کرتا ہے۔ مثال کے طور پر سفید سیاہ ہو جاتا ہے: سیاہ سفید ہو جاتا ہے.
- OcrInput.Dilate () - اعلی درجے کی شکلیں ۔ بازی ایک تصویر میں اشیاء کی حدود کو پکسلز کا اضافہ کر دیتی. ایروڈ کے مخالف
- OcrInput.Erode () - اعلی درجے کی شکلیں ۔ کٹاؤ آبجیکٹ کی حدود پر پکسلز کو ہٹاتا ہے
- OcrInput.Deskew () - کسی شبیہ کو گھماتا ہے تاکہ یہ صحیح راستہ ہو اور آرتھوگونل۔ یہ او سی آر کے لئے بہت مفید ہے کیونکہ اسککی اسکینوں کے لئے ٹیسریکٹ رواداری 5 ڈگری تک کم ہوسکتی ہے۔
- OcrInput.DeepCleanBackgroundNoise () - بھاری پس منظر کا شور مٹانا ۔ صرف اس صورت میں اس فلٹر کا استعمال کریں جب انتہائی دستاویز کے پس منظر میں شور معلوم ہوا ہو ، کیونکہ یہ فلٹر صاف دستاویزات کی او سی آر کی درستگی کو کم کرنے کا خطرہ بھی رکھے گا ، اور یہ بہت سی پی یو مہنگا ہے۔
- OcrInput.EnhanceResolution - کم معیار کی تصاویر کی ریزولوشن میں اضافہ۔ اس فلٹر کی اکثر ضرورت نہیں ہوتی ہے کیونکہ OcrInput.MinimumDPI اور OcrInput.TargetDPI خود بخود کم ریزولوشن ان پٹس کو پکڑ لے اور حل کرے گا۔
کلین بیک گراؤنڈنوائس۔ یہ ایک ایسی ترتیب ہے جو کچھ وقت طلب ہے۔ تاہم ، اس لائبریری کو ڈیجیٹل شبیہہ کے اندر خود بخود ڈیجیٹل شور ، کاغذ کے پھوڑے اور دیگر خرابیوں کو صاف کرنے کی اجازت دیتا ہے جو دوسری صورت میں اسے دیگر او سی آر لائبریریوں کے پڑھنے کے قابل نہیں بنا دیتا ہے۔
اینہنسکونسٹسٹ ایک ایسی ترتیب ہے جس کی وجہ سے آئرن او سی آر کسی بھی شبیہہ کے پس منظر کے خلاف متن کے تضاد کو خود بخود بڑھاتا ہے ، او سی آر کی درستگی میں اضافہ ہوتا ہے اور عام طور پر کارکردگی اور او سی آر کی رفتار میں اضافہ ہوتا ہے۔
اینہانس آرسولیوشن ایک ایسی ترتیب ہے جو خود کار طریقے سے کم ریزولوشن کی تصاویر (جو 275 ڈی پی آئی سے کم ہے) کا پتہ لگائے گی اور خود بخود شبیہہ کو اوپر لے جائے گی اور پھر تمام ٹیکسٹ کو تیز کردے گی تاکہ اسے او سی آر لائبریری کے ذریعہ بالکل پڑھا جاسکے۔ اگرچہ یہ آپریشن خود میں وقت طلب ہے ، لیکن عام طور پر یہ ایک شبیہہ پر OCR آپریشن کے لئے مجموعی طور پر وقت کو کم کرتا ہے۔
زبان آئرن او سی آر 22 بین الاقوامی زبان کے پیکوں کی حمایت کرتا ہے ، اور زبان کی ترتیب او سی آر آپریشن کے لئے لاگو ہونے والی ایک یا ایک سے زیادہ زبانوں کو منتخب کرنے کے ل. استعمال کی جاسکتی ہے۔
حکمت عملی آئرن OCR دو حکمت عملی کی حمایت کرتا ہے۔ ہم کسی دستاویز کی تیز اور کم درست اسکین کے لfor انتخاب کرسکتے ہیں ، یا ایک اعلی حکمت عملی کا استعمال کرسکتے ہیں جس میں الفاظ کے ایک دوسرے سے الفاظ کے اعدادوشمار کے تعلقات کو دیکھ کر خود بخود OCR متن کی درستگی کو بہتر بنانے کے لئے کچھ مصنوعی ذہانت کے ماڈل استعمال کیے جاتے ہیں۔ .
کلر اسپیس ایک ایسی ترتیب ہے جس کے تحت ہم گرے اسکیل یا رنگ میں OCR کا انتخاب کرسکتے ہیں۔ عام طور پر ، گرے اسکیل بہترین آپشن ہے۔ تاہم ، کبھی کبھی جب اسی طرح کی رنگت کے متن یا پس منظر ہوتے ہیں لیکن بہت مختلف رنگ ہوتے ہیں تو ، رنگ کی ایک مکمل رنگت بہتر نتائج فراہم کرے گی۔
وائٹ ٹیکسٹآن ڈارک بیک گراؤنڈز کا پتہ لگائیں۔ عام طور پر ، تمام او سی آر لائبریریاں سفید پس منظر پر سیاہ متن دیکھنے کی توقع کرتی ہیں۔ اس ترتیب سے آئرن او سی آر کو خود بخود منفی ، یا سفید متن والے تاریک صفحات کا پتہ لگانے اور انھیں پڑھنے کی اجازت دیتا ہے۔
ان پٹ امیج ٹائپ۔ یہ ترتیب ڈویلپر کو OCR لائبریری کی رہنمائی کرنے کی اجازت دیتی ہے کہ آیا یہ مکمل دستاویز یا اسکیپٹ ، جیسے اسکرین شاٹ کو دیکھ رہا ہے۔
روٹیٹ اینڈ سکرین ایک اعلی درجے کی ترتیب ہے جو آئرن او سی آر کو ان دستاویزات کو پڑھنے کی انوکھی صلاحیت کی اجازت دیتی ہے جو نہ صرف گھومائے جاتے ہیں ، لیکن شاید اس میں نقطہ نظر بھی ہوتا ہے ، جیسے متن کی دستاویزات کی تصاویر۔
ریڈ بارکوڈس ایک مفید خصوصیت ہے جو آئرن او سی آر کو صفحات پر خود بخود بار کوڈز اور کیو آر کوڈ پڑھنے کی اجازت دیتی ہے کیونکہ یہ متن کو بھی پڑھتا ہے ، بغیر کسی اضافی اضافے کا بوجھ۔
کلرڈیپتھ۔ اس ترتیب سے یہ طے ہوتا ہے کہ رنگ کی گہرائی کا تعین کرنے کے لئے OCR لائبریری فی پکسل کتنے بٹس استعمال کرے گی۔ رنگ کی اعلی گہرائی سے OCR کے معیار میں اضافہ ہوسکتا ہے ، لیکن OCR آپریشن کو مکمل ہونے میں درکار وقت میں بھی اضافہ ہوگا۔
126 زبان پیک
آئرن او سی آر 126 بین الاقوامی زبانوں کو زبان کے پیک کے ذریعہ سپورٹ کرتا ہے جو ڈی ایل ایل کے بطور تقسیم ہوتے ہیں ، جو اس ویب سائٹ سے ڈاؤنلوڈ کیے جاسکتے ہیں ، یا نیو گیٹ پیکیج مینیجر سے بھی ۔
زبانوں میں جرمن ، فرانسیسی ، انگریزی ، چینی ، جاپانی اور بہت کچھ شامل ہے۔ پاسپورٹ ایم آر زیڈ ، ایم آئی سی آر چیکس ، فنانشل ڈیٹا ، لائسنس پلیٹیں اور بہت ساری چیزوں کے لئے ماہر زبان کے پیک موجود ہیں۔ آپ کسی بھی ٹیسریکٹ ". ٹرینڈ ڈیٹا" فائل کو بھی استعمال کرسکتے ہیں - جس میں آپ خود بناتے ہیں۔
زبان کی مثال
OCR کی دوسری زبانیں استعمال کرنا۔
using IronOcr;
// Install the Arabic language pack via NuGet
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
// Use Arabic language for OCR
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Apply additional image filters if necessary
// Even if the input quality is low
// IronTesseract can read content where traditional Tesseract may fail.
var Result = Ocr.Read(input);
// Print is not ideal for Arabic on console. Instead, save to disk.
Result.SaveAsTextFile("arabic.txt");
}
using IronOcr;
// Install the Arabic language pack via NuGet
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
// Use Arabic language for OCR
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Apply additional image filters if necessary
// Even if the input quality is low
// IronTesseract can read content where traditional Tesseract may fail.
var Result = Ocr.Read(input);
// Print is not ideal for Arabic on console. Instead, save to disk.
Result.SaveAsTextFile("arabic.txt");
}
Imports IronOcr
' Install the Arabic language pack via NuGet
' PM> Install IronOcr.Languages.Arabic
Private Ocr = New IronTesseract()
' Use Arabic language for OCR
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Apply additional image filters if necessary
' Even if the input quality is low
' IronTesseract can read content where traditional Tesseract may fail.
Dim Result = Ocr.Read(input)
' Print is not ideal for Arabic on console. Instead, save to disk.
Result.SaveAsTextFile("arabic.txt")
End Using
زبان کی ایک سے زیادہ مثال
او سی آر کا ایک ہی وقت میں متعدد زبانیں استعمال کرنا بھی ممکن ہے۔ اس سے یونیکوڈ دستاویزات میں انگریزی زبان کا میٹا ڈیٹا اور یو آر ایل حاصل کرنے میں واقعی مدد مل سکتی ہے۔
using IronOcr;
// Install Chinese Simplified language pack via NuGet
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
// Set primary OCR language to Chinese Simplified
Ocr.Language = OcrLanguage.ChineseSimplified;
// Add Urdu as a secondary OCR language
Ocr.AddSecondaryLanguage(OcrLanguage.Urdu);
// Add images for multi-language OCR
using (var input = new OcrInput())
{
input.Add("multi-language.pdf");
var Result = Ocr.Read(input);
// Save the OCR result as a text file
Result.SaveAsTextFile("results.txt");
}
using IronOcr;
// Install Chinese Simplified language pack via NuGet
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
// Set primary OCR language to Chinese Simplified
Ocr.Language = OcrLanguage.ChineseSimplified;
// Add Urdu as a secondary OCR language
Ocr.AddSecondaryLanguage(OcrLanguage.Urdu);
// Add images for multi-language OCR
using (var input = new OcrInput())
{
input.Add("multi-language.pdf");
var Result = Ocr.Read(input);
// Save the OCR result as a text file
Result.SaveAsTextFile("results.txt");
}
Imports IronOcr
' Install Chinese Simplified language pack via NuGet
' PM> Install IronOcr.Languages.ChineseSimplified
Private Ocr = New IronTesseract()
' Set primary OCR language to Chinese Simplified
Ocr.Language = OcrLanguage.ChineseSimplified
' Add Urdu as a secondary OCR language
Ocr.AddSecondaryLanguage(OcrLanguage.Urdu)
' Add images for multi-language OCR
Using input = New OcrInput()
input.Add("multi-language.pdf")
Dim Result = Ocr.Read(input)
' Save the OCR result as a text file
Result.SaveAsTextFile("results.txt")
End Using
تفصیلی OCR نتائج آبجیکٹ
آئرن OCR ہر OCR آپریشن کے لئے OCR کا نتیجہ آبجیکٹ دیتا ہے۔ عام طور پر ، ڈویلپر صرف اس شے کی ٹیکسٹ پراپرٹی کو امیج سے ٹیکسٹ اسکین کرنے کے لئے استعمال کرتے ہیں۔ تاہم ، او سی آر کے نتائج ڈوم اس سے کہیں زیادہ ترقی یافتہ ہیں۔
using IronOcr;
using System.Drawing; // Required for extra drawing references
var Ocr = new IronTesseract();
// Set the language to Urdu for OCR
Ocr.Language = OcrLanguage.Urdu;
// Use advanced engine mode settings
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
// Enable barcode reading
Ocr.Configuration.ReadBarCodes = true;
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
// Accessing different details from the OCR result
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// An advanced, detailed API to explore for:
// - Pages, Blocks, Paragraphs, Lines, Words, Characters
// - Image Exporting, Font Coordinates, Statistical Data
}
using IronOcr;
using System.Drawing; // Required for extra drawing references
var Ocr = new IronTesseract();
// Set the language to Urdu for OCR
Ocr.Language = OcrLanguage.Urdu;
// Use advanced engine mode settings
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
// Enable barcode reading
Ocr.Configuration.ReadBarCodes = true;
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
// Accessing different details from the OCR result
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// An advanced, detailed API to explore for:
// - Pages, Blocks, Paragraphs, Lines, Words, Characters
// - Image Exporting, Font Coordinates, Statistical Data
}
Imports IronOcr
Imports System.Drawing ' Required for extra drawing references
Private Ocr = New IronTesseract()
' Set the language to Urdu for OCR
Ocr.Language = OcrLanguage.Urdu
' Use advanced engine mode settings
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
' Enable barcode reading
Ocr.Configuration.ReadBarCodes = True
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
' Accessing different details from the OCR result
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' An advanced, detailed API to explore for:
' - Pages, Blocks, Paragraphs, Lines, Words, Characters
' - Image Exporting, Font Coordinates, Statistical Data
End Using
کارکردگی
آئرن او سی آر باکس کے باہر کارکردگی کا مظاہرہ کرنے کی ضرورت نہیں ہے یا ان پٹ امیجز میں بہت زیادہ ترمیم کریں گے۔
رفتار تیز چل رہی ہے: آئرن او سی 2020 + 10 گنا زیادہ تیز ہے اور پچھلی تعمیرات سے 250 فیصد سے بھی کم غلطیاں کرتا ہے۔
اورجانیے
سی # ، وی بی ، ایف # ، یا کسی اور NET زبان میں OCR کے بارے میں مزید معلومات کے ل please ، براہ کرم ہمارے کمیونٹی ٹیوٹوریلز کو پڑھیں ، جس میں آئرن OCR کو کس طرح استعمال کیا جاسکتا ہے اس کی حقیقی دنیا میں مثال ملتی ہے اور ممکن ہے کہ اس سے بہتر طور پر کیسے فائدہ اٹھایا جاسکے۔ یہ لائبریری
.NET ڈویلپرز کے لئے ایک مکمل آبجیکٹ حوالہ بھی دستیاب ہے۔