پشتو OCR په C#او .NET کې
د دې سند نور نسخې:
IronOCR د C#سافټویر اجزا ده چې .NET کوډرانو ته اجازه ورکوي چې د عکسونو او PDF سندونو متن په 126 ژبه کې د پښتو په ګډون ولوستل شي.
دا د ټیسریکټ پرمختللی فورک دی ، چې په ځانګړي ډول د .NET پراختیا کونکو لپاره رامینځته شوی او په منظم ډول د ټیسریکټ انجنونه د دواړه سرعت او دقت لپاره ساتي.
د IronOcr.Languages.Pashto مینځپانګه
دا کڅوړه د NET لپاره د OCR 43 ژبې لري:
- پښتو
- پشتو بیست
- پښتو فاسټ
ډاونلوډ
پښتو ژبه پیک [پښتو]
* Download as زپ
* Install with https://www.nuget.org/packages/IronOcr.Languages.Pashto/'> نیوګیټ
لګول
لومړی شی چې موږ یې باید وکړو ستاسو د NET پروژې لپاره زموږ د پښتو OCR بسته نصب کړئ.
PM> Install-Package IronOCR.Languages.Pashto
کوډ مثال
دا C#کوډ مثال د عکس یا PDF سند څخه پښتو متن لوستل.
//PM> Install-Package IronOcr.Languages.Pashto
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput(@"images\Pashto.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Pashto
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput(@"images\Pashto.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Pashto
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using Input = New OcrInput("images\Pashto.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
ولې آئرن او سی آر غوره کړئ؟
اوسپنه OCR د نصب کولو اسانه ، بشپړ او ښه مستند شوی .NET سافټویر کتابتون دی.
د هرې بهرنۍ ویب خدماتو کارولو ، روان فیسونو یا په انټرنیټ کې محرم اسناد لیږلو پرته د 99.8 + + OCR درستتیا ترلاسه کولو لپاره IronOCR غوره کړئ.
ولې د C#پراختیا کونکي د وینیلا ټیسټریکټ غوره IronOCR غوره کوي:
- د واحد DLL یا نوګټ په توګه نصب کړئ
- د ټیسریکټ 5 ، 4 او 3 انجنونو لپاره د بکس څخه بهر شامل دي.
- دقیقه .8 ٪ .. significantly د منظم ټیسریکټ د پام وړ پرمختګ کوي.
- د اور لګولو سرعت او ګ Multi تریډیدینګ
- MVC ، WebApp ، ډیسټاپ ، کنسول او سرور غوښتنلیکونه متوافق دي
- هیڅ Exes یا C ++ کوډ نشته چې ورسره کار وکړي
- د PDF بشپړ OCR ملاتړ
- د OCR ترسره کولو لپاره نږدې هر یو عکس فایل یا PDF
- بشپړ .NET کور ، معیاري او چوکاټ ملاتړ
- په وینډوز ، ماک ، لینکس ، ازور ، ډاکر ، لیمبډا ، AWS کې ځای په ځای کول
- بارکوډونه او د QR کوډونه ولولئ
- XCR ته د OCR صادرول
- د پلټنې وړ PDF سندونو ته OCR صادر کړئ
- ملټيډریډنګ ملاتړ
- 126 نړیوالې ژبې ټولې د نوګټ یا اوکرډاټا فایلونو له لارې اداره شوې
- عکسونه ، همغږي ، احصایې او فونټونه لرې کړئ. نه یوازې متن.
- په تجارتي او ملکيتي غوښتنلیکونو کې د ټیسریکټ OCR د توزیع لپاره کارول کیدی شي.
د اوسپنې OCR شین کیږي کله چې د ریښتیني نړۍ عکسونو او نیمګړتیاو اسنادو لکه عکسونو ، یا د ټیټ تحلیل سکینونو سره کار کولو سره کار کوي چې ممکن ډیجیټل شور یا نیمګړتیاوې ولري.
د NET پلیټ فارم لپاره نور وړیا OCR کتابتونونه داسې نور .net ټیسټریکټ APIs او ویب خدمتونه د دې ریښتینې نړۍ کارولو قضیو کې دومره ښه ترسره نه کوي.
OCR د 5 ازموینې سره - په C#کې کوډ ورکول پیل کړئ
لاندې د کوډ نمونه ښیې چې د C#یا VB .NET کارولو سره د عکس څخه متن لوستل څومره اسانه دي.
OneLiner
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
د هیلو نړۍ ترتیب کونکی
// PM> Install-Package IronOCR.Languages.Pashto
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... تاسو کولی شئ هر ډول عکسونه اضافه کړئ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Pashto
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... تاسو کولی شئ هر ډول عکسونه اضافه کړئ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Pashto
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
C#د پی ډی ایف او سي آر
ورته طریقه ورته ورته د هر PDF سند څخه د متن استخراج لپاره کارول کیدی شي.
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// موږ کولی شو OCR ته ځانګړي د پی ډی اف پا pageې نمبرونه هم وټاکو
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// د PDF هر پا pageې لپاره 1 پا .ه
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// موږ کولی شو OCR ته ځانګړي د پی ډی اف پا pageې نمبرونه هم وټاکو
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// د PDF هر پا pageې لپاره 1 پا .ه
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' موږ کولی شو OCR ته ځانګړي د پی ډی اف پا pageې نمبرونه هم وټاکو
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' د PDF هر پا pageې لپاره 1 پا .ه
End Using
د ملټي پیج TIFFs لپاره OCR
OCR لوستل د TIFF فایل ب formatه په شمول د ډیری پا pageو اسنادو. TIFF هم د لټون وړ متن سره په مستقیم ډول د پی ډی ایف فایل کې بدلیدلی شي.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
بارکوډونه او کیو آر
د اوسپنې OCR یوه ځانګړتیا دا ده چې دا کولی شي د اسنادو څخه بارکوډونه او QR کوډونه لوستل شي پداسې حال کې چې دا د متن لپاره سکین کوي. د OcrResult.OcrBarcode
ټولګي مثالونه پراختیا کونکي ته د هر سکین شوي بارکوډ په اړه تفصيلي معلومات ورکوي.
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// د ډول او موقعیت ملکیتونه هم افشا شوي
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// د ډول او موقعیت ملکیتونه هم افشا شوي
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' د ډول او موقعیت ملکیتونه هم افشا شوي
Next Barcode
End Using
د عکسونو ځانګړو ساحو باندې OCR
د اوسپنې OCR ټولې سکینګ او لوستلو میتودونه د دې وړتیا چمتو کوي چې مشخص کړي د کومې پا pageې یا پا pagesو کومه برخه چې موږ ترې متن لوستل غواړو. دا خورا ګټور دی کله چې موږ معیاري ب formsو ته ګورو او کولی شو ډیر وخت وژغورو او موثریت ته وده ورکړو.
د فصل ساحو کارولو لپاره ، موږ به د System.Drawing
ته د سیسټم حواله اضافه کولو ته اړتیا ولرو ترڅو موږ وکولی شو System.Drawing.Rectangle
. System.Drawing.Rectangle
اعتراض وکاروو.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ابعاد په px کې دي
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ابعاد په px کې دي
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' ابعاد په px کې دي
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
د ټیټ کیفیت سکینونو لپاره OCR
د اوسپنې OCR OcrInput
ټولګی کولی شي سکینونه فکس کړي چې نورمال ټیسریکټ نشي لوستلی.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
Input.Deskew(); // دورې او لید اصلاح کوي
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
Input.Deskew(); // دورې او لید اصلاح کوي
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ډیجیټل شور او ضعیف سکینګ حلوي
Input.Deskew() ' دورې او لید اصلاح کوي
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
د پلټنې وړ PDF په توګه د OCR پایلې صادر کړئ
د کاپي کولو وړ ټکي سره پی ډی ایف ته عکس. د لټون انجنونو او ډیټابیس لخوا ترتیب کیدی شي.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")
Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
TIFF د پی ډی ایف تبادلې د لټون لپاره
د TIFF سند (یا د عکس فایلونو هرې ډلې) په مستقیم ډول د لټون وړ پی ډی ایف ته واړوئ کوم چې د انټرنټ ، ویب پا andې او ګوګل لټون انجنونو سره ترتیب کیدی شي.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
د OCR پایلې د HTML په توګه صادر کړئ
د OCR عکس د XHTML تبادلې ته.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
د OCR عکس افزونه فلټرونه
ICROCR د OCR فعالیت ښه کولو لپاره د OcrInput
څیزونو لپاره ځانګړي فلټرونه چمتو کوي.
د عکس د تقویت کولو کوډ مثال
د OCR ان پټ عکسونه لوړ کیفیت رامینځته کوي ترڅو غوره ، ګړندي OCR پایلې رامینځته کړي.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
Input.Deskew(); // دورې او لید اصلاح کوي
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
Input.Deskew(); // دورې او لید اصلاح کوي
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ډیجیټل شور او ضعیف سکینګ حلوي
Input.Deskew() ' دورې او لید اصلاح کوي
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
د OCR عکس فلټرونو لیست
د OCR فعالیت مینځته کولو لپاره ننوت چاtersګر چې په IronOCR کې جوړ شوي په لاندې ډول دي:
- OcrInput.Rotate (دوه درجې) - عکسونه د ساعت په اوږدو کې د یو شمیر درجو په واسطه ګرځي . د ساعت په مقابل کې ، منفي شمیرې وکاروئ.
- OcrInput.Binarize () - د دې عکس فلټر هره پکسل تور یا سپین سپین پرته له مینځنۍ ځمکې سره. ممکن د OCR فعالیت فعالیتونو ته د متن خورا ټیټ برعکس شاليد ته وده ورکړي.
- OcrInput.ToGrayScale () - د دې عکس فلټر هر پکسل د خړ رنګ سیوري بدلوي. د OCR درستتیا ته وده ورکولو لپاره امکان نلري مګر ممکن سرعت ښه کړي
- OcrInput.Contrast () - په اتوماتيک ډول د مقابل زیاتوالی. دا فلټر اکثرا د ټیټ برعکس سکینونو کې د OCR سرعت او دقت درستوي.
- OcrInput.DeNoise () - ډیجیټل شور لرې کوي. دا فلټر باید یوازې وکارول شي چیرې چې شور تمه کیږي.
- OcrInput.Invert () - هر رنګ بدلوي. د مثال په توګه سپینه تور کیږي: تور سپین کیږي.
- OcrInput.Dilate () - پرمختللی مورفولوژي. ډیلریشن په عکس کې د شیانو حدود ته پکسل اضافه کوي. د ایروډ مخالف
- OcrInput.Erode () - پرمختللی مورفولوژي. Erosion د Dilate څيز boundariesOpposite پېکسل لرې
- OcrInput.Deskew () - یو عکس ګرځوي نو دا سمه لاره او ارتوګونال دی. دا د OCR لپاره خورا ګټور دی ځکه چې د اسکایډ سکینونو لپاره د ټیسټریکټ زغم کولی شي تر 5 درجې پورې ټیټ وي.
- OcrInput.DeepCleanBackgroundNoise () - د شاليد شالید د شور لرې کول. یوازې دا فلټر وکاروئ په هغه حالت کې چې د خورا ډیر سند لرونکي شالید شور پیژندل شوی وي ، ځکه چې دا فلټر به د پاکو اسنادو د OCR درستتیا کمولو خطر هم ولري ، او د CPU خورا ګران دی.
- OcrInput.EnhanceResolution - د ټیټ کیفیت عکسونو حل لوړوي. دا فلټر اکثرا اړتیا نلري ځکه چې OcrInput.MinimumDPI او OcrInput.TargetDPI به په اوتومات ډول د ټیټ ریزولوشن انلاینونه حل او حل کړي.
کلین. دا یو سیټینګ دی چې یو څه وخت ته اړتیا لري؛ په هرصورت ، دا کتابتون ته اجازه ورکوي چې پخپله د ډیجیټل عکس کې ډیجیټل شور ، د کاغذ خنډونه ، او نور نیمګړتیاوې پاکې کړي کوم چې که نه نو دا د OCR نورو کتابتونونو لخوا د لوستلو توان نه لري.
اینهانس کانټراسټ یو ترتیب دی چې د اوسپنې OCR لامل کیږي په اتوماتيک ډول د عکس شالید پروړاندې د متن برعکس زیاتوالی ، د OCR دقت او په عمومي ډول د فعالیت او OCR سرعت زیاتوي.
EnhanceResolution یو ترتیب دی چې په اتوماتيک ډول به د ټیټ - ریزولوشن عکسونه ومومي (کوم چې د 275 dpi لاندې دي) او پخپله عکس پورته کوي او بیا ټول متن تیزوي نو دا د OCR کتابتون لخوا په سمه توګه لوستل کیدی شي. که څه هم دا عملیات پخپله د وخت مصرف کوي ، دا عموما په یو عکس کې د OCR عملیاتو لپاره عمومي وخت کموي.
د ژبې اوسپنې OCR د 22 نړیوالو ژبو کڅوړو ملاتړ کوي ، او د ژبې ترتیب کولی شي د OCR عملیاتو لپاره غوښتنه کولو لپاره د یوې یا ډیرو څو ژبو غوره کولو لپاره وکارول شي.
ستراتیژي د اوسپنې OCR دوه ستراتیژیو ملاتړ کوي. موږ ممکن د یادو سندونو ګړندي او لږ دقیق سکین لپاره لاړ شو ، یا پرمختللې تګلاره وکاروو چې د مصنوعي استخباراتي ماډلونو څخه کار واخلو په اوتومات ډول د OCR متن درستیت ته وده ورکوو په جمله کې د ټکو احصایوي اړیکو ته په کتو سره .
کلر سپیس یو تنظیم دی چې له دې لارې موږ کولی شو په ګریسي یا رنګ کې OCR غوره کړو. په عموم کې ، ګريکل غوره انتخاب دی. په هرصورت ، ځینې وختونه کله چې ورته ورته رنګ متنونه یا شالید شتون ولري مګر خورا مختلف رنګ ، د بشپړ رنګ رنګ ځای به غوره پایلې چمتو کړي.
ویکټوایټ ټیکټ ان بیک ډباکગ્રાઉન્ડونه ومومئ. عموما ، ټول OCR کتابتونونه تمه لري چې په سپین مخونو کې تور متن وګوري. دا ترتیب د اوسپنې OCR ته اجازه ورکوي په اوتومات ډول منفي ، یا تیاره پا pagesې د سپینې متن سره کشف کړي ، او ولولي.
ننوت عکس العمل. دا ترتیب ډویلګر ته اجازه ورکوي چې د OCR کتابتون ته لارښوونه وکړي چې ایا دا د بشپړ سند یا سنیپټ په لټه کې دی ، لکه د سکرین شاټ.
د RotateAndStraight یو پرمختللی ترتیب دی چې د اوسپنې OCR ته اجازه ورکوي د سندونو لوستلو لپاره ځانګړی وړتیا ورکړي چې نه یوازې داځل کیږي ، مګر شاید لید لرونکی وي ، لکه د متن سندونو عکسونه.
ریډ بارکوډونه یو ګټور ب featureه ده کوم چې د اوسپنې OCR ته اجازه ورکوي چې پخپله پا pagesو کې بارکوډونه او QR کوډونه ولولي ځکه چې دا متن هم لوستل کیږي ، پرته لدې چې د لوی اضافي بار اضافه کول.
رنګ. دا ترتیب ټاکي چې د رنګ ژورتیا مشخص کولو لپاره د OCR کتابتون به په هر پکسل کې څومره ټوټې وکاروي. د لوړ رنګ ژورالی ممکن د OCR کیفیت لوړ کړي ، مګر دا به د OCR عملیاتو بشپړولو لپاره اړین وخت هم ډیر کړي.
د ژبې ګksې
د اوسپنې OCR د ژبې کڅوړې له لارې 126 نړیوالو ژبو ملاتړ کوي کوم چې د DLLs په توګه توزیع شوي ، کوم چې له دې ویب پا fromې څخه ډاونلوډ کیدی شي ، یا هم د نیجیت پیکیج مدیر څخه .
په ژبو کې الماني ، فرانسوي ، انګلیسي ، چینایي ، جاپاني او نور ډیر څه شامل دي. د پاسپورټ MRZ ، MICR چیکونو ، مالي معلوماتو ، جواز پلیټونو او نورو ډیر څه لپاره د ژبې متخصص کڅوړې شتون لري. تاسو کولی شئ هر ډول ټیسټریکټ ". ټریډینټاټا" فایل هم وکاروئ - پشمول هغه څوک چې تاسو خپل ځان جوړ کړی.
د ژبې مثال
د OCR نورې ژبې کارول.
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// د اړتیا په صورت کې د عکس فلټرونه اضافه کړئ
// پدې حالت کې ، حتی د فکر ان پټ خورا ټیټ کیفیت دی
// د اوسپنې ټیسټ کولی شي هغه څه ولولي چې دودیز ټیسټریک نشي کولی.
var Result = Ocr.Read(input);
// کنسول په اسانۍ سره په وینډوز کې عربي نه شي چاپولی.
// راځئ چې پرځای یې ډیسک ته خوندي کړو.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// د اړتیا په صورت کې د عکس فلټرونه اضافه کړئ
// پدې حالت کې ، حتی د فکر ان پټ خورا ټیټ کیفیت دی
// د اوسپنې ټیسټ کولی شي هغه څه ولولي چې دودیز ټیسټریک نشي کولی.
var Result = Ocr.Read(input);
// کنسول په اسانۍ سره په وینډوز کې عربي نه شي چاپولی.
// راځئ چې پرځای یې ډیسک ته خوندي کړو.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' د اړتیا په صورت کې د عکس فلټرونه اضافه کړئ
' پدې حالت کې ، حتی د فکر ان پټ خورا ټیټ کیفیت دی
' د اوسپنې ټیسټ کولی شي هغه څه ولولي چې دودیز ټیسټریک نشي کولی.
Dim Result = Ocr.Read(input)
' کنسول په اسانۍ سره په وینډوز کې عربي نه شي چاپولی.
' راځئ چې پرځای یې ډیسک ته خوندي کړو.
Result.SaveAsTextFile("arabic.txt")
End Using
د ژبې ډیری بیلګه
دا په ورته وخت کې د ګ languagesو ژبو کارول OCR ته هم امکان لري. دا کولی شي واقعیا د انیکوډ سندونو کې د انګلیسي ژبې میټاټاټا او url ترلاسه کولو کې مرسته وکړي.
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Pashto);
// موږ کولی شو هره ژبه وژغورو
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Pashto);
// موږ کولی شو هره ژبه وژغورو
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Pashto)
' موږ کولی شو هره ژبه وژغورو
Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
د OCR تفصيلي پایلې
اوسپنه OCR د هرې OCR عملیاتو لپاره د OCR پایلې توکي بیرته راولي. عموما ، پراختیا کونکي یوازې د دې څیز متن ملکیت کاروي ترڅو له عکس څخه سکین ترلاسه کړي. په هرصورت ، د OCR پایلې DOM د دې په پرتله خورا پرمختللی دی.
using IronOcr;
using System.Drawing; //د اسمبلۍ حواله اضافه کړئ
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //مهم!
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// د پراخه ، تفصيلي API موندلو لپاره دلته سپړنه وکړئ:
// - پا Pagesې ، بلاکونه ، پارافوفونه ، لاینونه ، ټکي ، چارسونه
// - د عکس صادرول ، د فونټ همغږي کول ، احصایوي معلومات
}
using IronOcr;
using System.Drawing; //د اسمبلۍ حواله اضافه کړئ
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Pashto;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //مهم!
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// د پراخه ، تفصيلي API موندلو لپاره دلته سپړنه وکړئ:
// - پا Pagesې ، بلاکونه ، پارافوفونه ، لاینونه ، ټکي ، چارسونه
// - د عکس صادرول ، د فونټ همغږي کول ، احصایوي معلومات
}
Imports IronOcr
Imports System.Drawing 'د اسمبلۍ حواله اضافه کړئ
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Pashto
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'مهم!
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' د پراخه ، تفصيلي API موندلو لپاره دلته سپړنه وکړئ:
' - پا Pagesې ، بلاکونه ، پارافوفونه ، لاینونه ، ټکي ، چارسونه
' - د عکس صادرول ، د فونټ همغږي کول ، احصایوي معلومات
End Using
کړنه
IronOCR د بکس څخه کار کوي د اړتیا وړ فعالیت سره ، اړتیا نلري یا په کلکه سره د ننوتلو عکسونه بدل کړئ.
سرعت تیښته ده: IronOcr.2020 + تر 10 چنده پورې ګړندی دی او د تیرو جوړښتونو په پرتله 250 few لږ غلطي کوي.
نور زده کړئ
په C#، VB ، F # ، یا کوم بل نورو .NET ژبه کې د OCR په اړه نور معلومات زده کولو لپاره ، مهرباني وکړئ زموږ د ټولنې ښوونې ولولئ ، کوم چې د نړۍ اوسني مثالونه وړاندې کوي چې څنګه د اوسپنې OCR کارول کیدی شي او ممکن د غوره توضیح کولو څرنګوالي ته توضیحات وښیې. دا کتابتون.
د .NET پراختیا کونکو لپاره د بشپړ اعتراض حواله هم شتون لري.