پشتو OCR په C#او .NET کې

د دې سند نور نسخې:

IronOCR د C#سافټویر اجزا ده چې .NET کوډرانو ته اجازه ورکوي چې د عکسونو او PDF سندونو متن په 126 ژبه کې د پښتو په ګډون ولوستل شي.

دا د ټیسریکټ پرمختللی فورک دی ، چې په ځانګړي ډول د .NET پراختیا کونکو لپاره رامینځته شوی او په منظم ډول د ټیسریکټ انجنونه د دواړه سرعت او دقت لپاره ساتي.

د IronOcr.Languages.Pashto مینځپانګه

دا کڅوړه د NET لپاره د OCR 43 ژبې لري:

  • پښتو
  • پشتو بیست
  • پښتو فاسټ

ډاونلوډ

پښتو ژبه پیک [پښتو]
* Download as زپ
* Install with
https://www.nuget.org/packages/IronOcr.Languages.Pashto/'> نیوګیټ

لګول

لومړی شی چې موږ یې باید وکړو ستاسو د NET پروژې لپاره زموږ د پښتو OCR بسته نصب کړئ.

PM> Install-Package IronOCR.Languages.Pashto

کوډ مثال

دا C#کوډ مثال د عکس یا PDF سند څخه پښتو متن لوستل.

//PM> Install-Package IronOcr.Languages.Pashto
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput(@"images\Pashto.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Pashto
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput(@"images\Pashto.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Pashto
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using Input = New OcrInput("images\Pashto.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

ولې آئرن او سی آر غوره کړئ؟

اوسپنه OCR د نصب کولو اسانه ، بشپړ او ښه مستند شوی .NET سافټویر کتابتون دی.

د هرې بهرنۍ ویب خدماتو کارولو ، روان فیسونو یا په انټرنیټ کې محرم اسناد لیږلو پرته د 99.8 + + OCR درستتیا ترلاسه کولو لپاره IronOCR غوره کړئ.

ولې د C#پراختیا کونکي د وینیلا ټیسټریکټ غوره IronOCR غوره کوي:

  • د واحد DLL یا نوګټ په توګه نصب کړئ
  • د ټیسریکټ 5 ، 4 او 3 انجنونو لپاره د بکس څخه بهر شامل دي.
  • دقیقه .8 ٪ .. significantly د منظم ټیسریکټ د پام وړ پرمختګ کوي.
  • د اور لګولو سرعت او ګ Multi تریډیدینګ
  • MVC ، WebApp ، ډیسټاپ ، کنسول او سرور غوښتنلیکونه متوافق دي
  • هیڅ Exes یا C ++ کوډ نشته چې ورسره کار وکړي
  • د PDF بشپړ OCR ملاتړ
  • د OCR ترسره کولو لپاره نږدې هر یو عکس فایل یا PDF
  • بشپړ .NET کور ، معیاري او چوکاټ ملاتړ
  • په وینډوز ، ماک ، لینکس ، ازور ، ډاکر ، لیمبډا ، AWS کې ځای په ځای کول
  • بارکوډونه او د QR کوډونه ولولئ
  • XCR ته د OCR صادرول
  • د پلټنې وړ PDF سندونو ته OCR صادر کړئ
  • ملټيډریډنګ ملاتړ
  • 126 نړیوالې ژبې ټولې د نوګټ یا اوکرډاټا فایلونو له لارې اداره شوې
  • عکسونه ، همغږي ، احصایې او فونټونه لرې کړئ. نه یوازې متن.
  • په تجارتي او ملکيتي غوښتنلیکونو کې د ټیسریکټ OCR د توزیع لپاره کارول کیدی شي.

د اوسپنې OCR شین کیږي کله چې د ریښتیني نړۍ عکسونو او نیمګړتیاو اسنادو لکه عکسونو ، یا د ټیټ تحلیل سکینونو سره کار کولو سره کار کوي چې ممکن ډیجیټل شور یا نیمګړتیاوې ولري.

د NET پلیټ فارم لپاره نور وړیا OCR کتابتونونه داسې نور .net ټیسټریکټ APIs او ویب خدمتونه د دې ریښتینې نړۍ کارولو قضیو کې دومره ښه ترسره نه کوي.

OCR د 5 ازموینې سره - په C#کې کوډ ورکول پیل کړئ

لاندې د کوډ نمونه ښیې چې د C#یا VB .NET کارولو سره د عکس څخه متن لوستل څومره اسانه دي.

OneLiner

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

د هیلو نړۍ ترتیب کونکی

// PM> Install-Package IronOCR.Languages.Pashto
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... تاسو کولی شئ هر ډول عکسونه اضافه کړئ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Pashto
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... تاسو کولی شئ هر ډول عکسونه اضافه کړئ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Pashto
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

C#د پی ډی ایف او سي آر

ورته طریقه ورته ورته د هر PDF سند څخه د متن استخراج لپاره کارول کیدی شي.

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// موږ کولی شو OCR ته ځانګړي د پی ډی اف پا pageې نمبرونه هم وټاکو

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// د PDF هر پا pageې لپاره 1 پا .ه
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// موږ کولی شو OCR ته ځانګړي د پی ډی اف پا pageې نمبرونه هم وټاکو

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// د PDF هر پا pageې لپاره 1 پا .ه
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' موږ کولی شو OCR ته ځانګړي د پی ډی اف پا pageې نمبرونه هم وټاکو

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' د PDF هر پا pageې لپاره 1 پا .ه
End Using
VB   C#

د ملټي پیج TIFFs لپاره OCR

OCR لوستل د TIFF فایل ب formatه په شمول د ډیری پا pageو اسنادو. TIFF هم د لټون وړ متن سره په مستقیم ډول د پی ډی ایف فایل کې بدلیدلی شي.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

بارکوډونه او کیو آر

د اوسپنې OCR یوه ځانګړتیا دا ده چې دا کولی شي د اسنادو څخه بارکوډونه او QR کوډونه لوستل شي پداسې حال کې چې دا د متن لپاره سکین کوي. د OcrResult.OcrBarcode ټولګي مثالونه پراختیا کونکي ته د هر سکین شوي بارکوډ په اړه تفصيلي معلومات ورکوي.

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// د ډول او موقعیت ملکیتونه هم افشا شوي
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// د ډول او موقعیت ملکیتونه هم افشا شوي
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' د ډول او موقعیت ملکیتونه هم افشا شوي
Next Barcode
End Using
VB   C#

د عکسونو ځانګړو ساحو باندې OCR

د اوسپنې OCR ټولې سکینګ او لوستلو میتودونه د دې وړتیا چمتو کوي چې مشخص کړي د کومې پا pageې یا پا pagesو کومه برخه چې موږ ترې متن لوستل غواړو. دا خورا ګټور دی کله چې موږ معیاري ب formsو ته ګورو او کولی شو ډیر وخت وژغورو او موثریت ته وده ورکړو.

د فصل ساحو کارولو لپاره ، موږ به د System.Drawing ته د سیسټم حواله اضافه کولو ته اړتیا ولرو ترڅو موږ وکولی شو System.Drawing.Rectangle . System.Drawing.Rectangle اعتراض وکاروو.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ابعاد په px کې دي

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ابعاد په px کې دي

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' ابعاد په px کې دي

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

د ټیټ کیفیت سکینونو لپاره OCR

د اوسپنې OCR OcrInput ټولګی کولی شي سکینونه فکس کړي چې نورمال ټیسریکټ نشي لوستلی.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
Input.Deskew(); // دورې او لید اصلاح کوي
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
Input.Deskew(); // دورې او لید اصلاح کوي
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ډیجیټل شور او ضعیف سکینګ حلوي
Input.Deskew() ' دورې او لید اصلاح کوي
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

د پلټنې وړ PDF په توګه د OCR پایلې صادر کړئ

د کاپي کولو وړ ټکي سره پی ډی ایف ته عکس. د لټون انجنونو او ډیټابیس لخوا ترتیب کیدی شي.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

TIFF د پی ډی ایف تبادلې د لټون لپاره

د TIFF سند (یا د عکس فایلونو هرې ډلې) په مستقیم ډول د لټون وړ پی ډی ایف ته واړوئ کوم چې د انټرنټ ، ویب پا andې او ګوګل لټون انجنونو سره ترتیب کیدی شي.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

د OCR پایلې د HTML په توګه صادر کړئ

د OCR عکس د XHTML تبادلې ته.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

د OCR عکس افزونه فلټرونه

ICROCR د OCR فعالیت ښه کولو لپاره د OcrInput څیزونو لپاره ځانګړي فلټرونه چمتو کوي.

د عکس د تقویت کولو کوډ مثال

د OCR ان پټ عکسونه لوړ کیفیت رامینځته کوي ترڅو غوره ، ګړندي OCR پایلې رامینځته کړي.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
Input.Deskew(); // دورې او لید اصلاح کوي
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
Input.Deskew(); // دورې او لید اصلاح کوي
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ډیجیټل شور او ضعیف سکینګ حلوي
Input.Deskew() ' دورې او لید اصلاح کوي
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

د OCR عکس فلټرونو لیست

د OCR فعالیت مینځته کولو لپاره ننوت چاtersګر چې په IronOCR کې جوړ شوي په لاندې ډول دي:

  • OcrInput.Rotate (دوه درجې) - عکسونه د ساعت په اوږدو کې د یو شمیر درجو په واسطه ګرځي . د ساعت په مقابل کې ، منفي شمیرې وکاروئ.
  • OcrInput.Binarize () - د دې عکس فلټر هره پکسل تور یا سپین سپین پرته له مینځنۍ ځمکې سره. ممکن د OCR فعالیت فعالیتونو ته د متن خورا ټیټ برعکس شاليد ته وده ورکړي.
  • OcrInput.ToGrayScale () - د دې عکس فلټر هر پکسل د خړ رنګ سیوري بدلوي. د OCR درستتیا ته وده ورکولو لپاره امکان نلري مګر ممکن سرعت ښه کړي
  • OcrInput.Contrast () - په اتوماتيک ډول د مقابل زیاتوالی. دا فلټر اکثرا د ټیټ برعکس سکینونو کې د OCR سرعت او دقت درستوي.
  • OcrInput.DeNoise () - ډیجیټل شور لرې کوي. دا فلټر باید یوازې وکارول شي چیرې چې شور تمه کیږي.
  • OcrInput.Invert () - هر رنګ بدلوي. د مثال په توګه سپینه تور کیږي: تور سپین کیږي.
  • OcrInput.Dilate () - پرمختللی مورفولوژي. ډیلریشن په عکس کې د شیانو حدود ته پکسل اضافه کوي. د ایروډ مخالف
  • OcrInput.Erode () - پرمختللی مورفولوژي. Erosion د Dilate څيز boundariesOpposite پېکسل لرې
  • OcrInput.Deskew () - یو عکس ګرځوي نو دا سمه لاره او ارتوګونال دی. دا د OCR لپاره خورا ګټور دی ځکه چې د اسکایډ سکینونو لپاره د ټیسټریکټ زغم کولی شي تر 5 درجې پورې ټیټ وي.
  • OcrInput.DeepCleanBackgroundNoise () - د شاليد شالید د شور لرې کول. یوازې دا فلټر وکاروئ په هغه حالت کې چې د خورا ډیر سند لرونکي شالید شور پیژندل شوی وي ، ځکه چې دا فلټر به د پاکو اسنادو د OCR درستتیا کمولو خطر هم ولري ، او د CPU خورا ګران دی.
  • OcrInput.EnhanceResolution - د ټیټ کیفیت عکسونو حل لوړوي. دا فلټر اکثرا اړتیا نلري ځکه چې OcrInput.MinimumDPI او OcrInput.TargetDPI به په اوتومات ډول د ټیټ ریزولوشن انلاینونه حل او حل کړي.

کلین. دا یو سیټینګ دی چې یو څه وخت ته اړتیا لري؛ په هرصورت ، دا کتابتون ته اجازه ورکوي چې پخپله د ډیجیټل عکس کې ډیجیټل شور ، د کاغذ خنډونه ، او نور نیمګړتیاوې پاکې کړي کوم چې که نه نو دا د OCR نورو کتابتونونو لخوا د لوستلو توان نه لري.

اینهانس کانټراسټ یو ترتیب دی چې د اوسپنې OCR لامل کیږي په اتوماتيک ډول د عکس شالید پروړاندې د متن برعکس زیاتوالی ، د OCR دقت او په عمومي ډول د فعالیت او OCR سرعت زیاتوي.

EnhanceResolution یو ترتیب دی چې په اتوماتيک ډول به د ټیټ - ریزولوشن عکسونه ومومي (کوم چې د 275 dpi لاندې دي) او پخپله عکس پورته کوي او بیا ټول متن تیزوي نو دا د OCR کتابتون لخوا په سمه توګه لوستل کیدی شي. که څه هم دا عملیات پخپله د وخت مصرف کوي ، دا عموما په یو عکس کې د OCR عملیاتو لپاره عمومي وخت کموي.

د ژبې اوسپنې OCR د 22 نړیوالو ژبو کڅوړو ملاتړ کوي ، او د ژبې ترتیب کولی شي د OCR عملیاتو لپاره غوښتنه کولو لپاره د یوې یا ډیرو څو ژبو غوره کولو لپاره وکارول شي.

ستراتیژي د اوسپنې OCR دوه ستراتیژیو ملاتړ کوي. موږ ممکن د یادو سندونو ګړندي او لږ دقیق سکین لپاره لاړ شو ، یا پرمختللې تګلاره وکاروو چې د مصنوعي استخباراتي ماډلونو څخه کار واخلو په اوتومات ډول د OCR متن درستیت ته وده ورکوو په جمله کې د ټکو احصایوي اړیکو ته په کتو سره .

کلر سپیس یو تنظیم دی چې له دې لارې موږ کولی شو په ګریسي یا رنګ کې OCR غوره کړو. په عموم کې ، ګريکل غوره انتخاب دی. په هرصورت ، ځینې وختونه کله چې ورته ورته رنګ متنونه یا شالید شتون ولري مګر خورا مختلف رنګ ، د بشپړ رنګ رنګ ځای به غوره پایلې چمتو کړي.

ویکټوایټ ټیکټ ان بیک ډباکગ્રાઉન્ડونه ومومئ. عموما ، ټول OCR کتابتونونه تمه لري چې په سپین مخونو کې تور متن وګوري. دا ترتیب د اوسپنې OCR ته اجازه ورکوي په اوتومات ډول منفي ، یا تیاره پا pagesې د سپینې متن سره کشف کړي ، او ولولي.

ننوت عکس العمل. دا ترتیب ډویلګر ته اجازه ورکوي چې د OCR کتابتون ته لارښوونه وکړي چې ایا دا د بشپړ سند یا سنیپټ په لټه کې دی ، لکه د سکرین شاټ.

د RotateAndStraight یو پرمختللی ترتیب دی چې د اوسپنې OCR ته اجازه ورکوي د سندونو لوستلو لپاره ځانګړی وړتیا ورکړي چې نه یوازې داځل کیږي ، مګر شاید لید لرونکی وي ، لکه د متن سندونو عکسونه.

ریډ بارکوډونه یو ګټور ب featureه ده کوم چې د اوسپنې OCR ته اجازه ورکوي چې پخپله پا pagesو کې بارکوډونه او QR کوډونه ولولي ځکه چې دا متن هم لوستل کیږي ، پرته لدې چې د لوی اضافي بار اضافه کول.

رنګ. دا ترتیب ټاکي چې د رنګ ژورتیا مشخص کولو لپاره د OCR کتابتون به په هر پکسل کې څومره ټوټې وکاروي. د لوړ رنګ ژورالی ممکن د OCR کیفیت لوړ کړي ، مګر دا به د OCR عملیاتو بشپړولو لپاره اړین وخت هم ډیر کړي.

د ژبې ګksې

د اوسپنې OCR د ژبې کڅوړې له لارې 126 نړیوالو ژبو ملاتړ کوي کوم چې د DLLs په توګه توزیع شوي ، کوم چې له دې ویب پا fromې څخه ډاونلوډ کیدی شي ، یا هم د نیجیت پیکیج مدیر څخه .

په ژبو کې الماني ، فرانسوي ، انګلیسي ، چینایي ، جاپاني او نور ډیر څه شامل دي. د پاسپورټ MRZ ، MICR چیکونو ، مالي معلوماتو ، جواز پلیټونو او نورو ډیر څه لپاره د ژبې متخصص کڅوړې شتون لري. تاسو کولی شئ هر ډول ټیسټریکټ ". ټریډینټاټا" فایل هم وکاروئ - پشمول هغه څوک چې تاسو خپل ځان جوړ کړی.

د ژبې مثال

د OCR نورې ژبې کارول.

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// د اړتیا په صورت کې د عکس فلټرونه اضافه کړئ
// پدې حالت کې ، حتی د فکر ان پټ خورا ټیټ کیفیت دی
// د اوسپنې ټیسټ کولی شي هغه څه ولولي چې دودیز ټیسټریک نشي کولی.

var Result = Ocr.Read(input);

// کنسول په اسانۍ سره په وینډوز کې عربي نه شي چاپولی.
// راځئ چې پرځای یې ډیسک ته خوندي کړو.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// د اړتیا په صورت کې د عکس فلټرونه اضافه کړئ
// پدې حالت کې ، حتی د فکر ان پټ خورا ټیټ کیفیت دی
// د اوسپنې ټیسټ کولی شي هغه څه ولولي چې دودیز ټیسټریک نشي کولی.

var Result = Ocr.Read(input);

// کنسول په اسانۍ سره په وینډوز کې عربي نه شي چاپولی.
// راځئ چې پرځای یې ډیسک ته خوندي کړو.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' د اړتیا په صورت کې د عکس فلټرونه اضافه کړئ
' پدې حالت کې ، حتی د فکر ان پټ خورا ټیټ کیفیت دی
' د اوسپنې ټیسټ کولی شي هغه څه ولولي چې دودیز ټیسټریک نشي کولی.

Dim Result = Ocr.Read(input)

' کنسول په اسانۍ سره په وینډوز کې عربي نه شي چاپولی.
' راځئ چې پرځای یې ډیسک ته خوندي کړو.
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

د ژبې ډیری بیلګه

دا په ورته وخت کې د ګ languagesو ژبو کارول OCR ته هم امکان لري. دا کولی شي واقعیا د انیکوډ سندونو کې د انګلیسي ژبې میټاټاټا او url ترلاسه کولو کې مرسته وکړي.

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Pashto);

// موږ کولی شو هره ژبه وژغورو

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Pashto);

// موږ کولی شو هره ژبه وژغورو

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Pashto)

' موږ کولی شو هره ژبه وژغورو

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

د OCR تفصيلي پایلې

اوسپنه OCR د هرې OCR عملیاتو لپاره د OCR پایلې توکي بیرته راولي. عموما ، پراختیا کونکي یوازې د دې څیز متن ملکیت کاروي ترڅو له عکس څخه سکین ترلاسه کړي. په هرصورت ، د OCR پایلې DOM د دې په پرتله خورا پرمختللی دی.

using IronOcr;
using System.Drawing; //د اسمبلۍ حواله اضافه کړئ

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //مهم!

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// د پراخه ، تفصيلي API موندلو لپاره دلته سپړنه وکړئ:
// - پا Pagesې ، بلاکونه ، پارافوفونه ، لاینونه ، ټکي ، چارسونه
// - د عکس صادرول ، د فونټ همغږي کول ، احصایوي معلومات
}
using IronOcr;
using System.Drawing; //د اسمبلۍ حواله اضافه کړئ

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //مهم!

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// د پراخه ، تفصيلي API موندلو لپاره دلته سپړنه وکړئ:
// - پا Pagesې ، بلاکونه ، پارافوفونه ، لاینونه ، ټکي ، چارسونه
// - د عکس صادرول ، د فونټ همغږي کول ، احصایوي معلومات
}
Imports IronOcr
Imports System.Drawing 'د اسمبلۍ حواله اضافه کړئ

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'مهم!

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' د پراخه ، تفصيلي API موندلو لپاره دلته سپړنه وکړئ:
' - پا Pagesې ، بلاکونه ، پارافوفونه ، لاینونه ، ټکي ، چارسونه
' - د عکس صادرول ، د فونټ همغږي کول ، احصایوي معلومات
End Using
VB   C#

کړنه

IronOCR د بکس څخه کار کوي د اړتیا وړ فعالیت سره ، اړتیا نلري یا په کلکه سره د ننوتلو عکسونه بدل کړئ.

سرعت تیښته ده: IronOcr.2020 + تر 10 چنده پورې ګړندی دی او د تیرو جوړښتونو په پرتله 250 few لږ غلطي کوي.

نور زده کړئ

په C#، VB ، F # ، یا کوم بل نورو .NET ژبه کې د OCR په اړه نور معلومات زده کولو لپاره ، مهرباني وکړئ زموږ د ټولنې ښوونې ولولئ ، کوم چې د نړۍ اوسني مثالونه وړاندې کوي چې څنګه د اوسپنې OCR کارول کیدی شي او ممکن د غوره توضیح کولو څرنګوالي ته توضیحات وښیې. دا کتابتون.

د .NET پراختیا کونکو لپاره د بشپړ اعتراض حواله هم شتون لري.