Body Content:

پشتو OCR په C#او .NET کې

د دې سند نور نسخې:

IronOCR د C#سافټویر اجزا ده چې .NET کوډرانو ته اجازه ورکوي چې د عکسونو او PDF سندونو متن په 126 ژبه کې د پښتو په ګډون ولوستل شي.

دا د ټیسریکټ پرمختللی فورک دی ، چې په ځانګړي ډول د .NET پراختیا کونکو لپاره رامینځته شوی او په منظم ډول د ټیسریکټ انجنونه د دواړه سرعت او دقت لپاره ساتي.

د IronOcr.Languages.Pashto مینځپانګه

دا کڅوړه د NET لپاره د OCR 43 ژبې لري:

  • پښتو
  • پشتو بیست
  • پښتو فاسټ

ډاونلوډ

پښتو ژبه پیک [پښتو]
* Download as زپ
* Install with
https://www.nuget.org/packages/IronOcr.Languages.Pashto/'> نیوګیټ

لګول

لومړی شی چې موږ یې باید وکړو ستاسو د NET پروژې لپاره زموږ د پښتو OCR بسته نصب کړئ.

PM> Install-Package IronOCR.Languages.Pashto

کوډ مثال

دا C#کوډ مثال د عکس یا PDF سند څخه پښتو متن لوستل.

// Install the IronOCR Pashto language package via NuGet
// PM> Install-Package IronOcr.Languages.Pashto

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Pashto
Ocr.Language = OcrLanguage.Pashto;

// Read Pashto text from an image
using (var Input = new OcrInput(@"images\Pashto.png"))
{
    // Perform OCR and get the result
    var Result = Ocr.Read(Input);

    // Get the extracted text
    var AllText = Result.Text;
}
// Install the IronOCR Pashto language package via NuGet
// PM> Install-Package IronOcr.Languages.Pashto

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Pashto
Ocr.Language = OcrLanguage.Pashto;

// Read Pashto text from an image
using (var Input = new OcrInput(@"images\Pashto.png"))
{
    // Perform OCR and get the result
    var Result = Ocr.Read(Input);

    // Get the extracted text
    var AllText = Result.Text;
}
' Install the IronOCR Pashto language package via NuGet
' PM> Install-Package IronOcr.Languages.Pashto

Imports IronOcr

Private Ocr = New IronTesseract()
' Set the OCR language to Pashto
Ocr.Language = OcrLanguage.Pashto

' Read Pashto text from an image
Using Input = New OcrInput("images\Pashto.png")
	' Perform OCR and get the result
	Dim Result = Ocr.Read(Input)

	' Get the extracted text
	Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel

ولې آئرن او سی آر غوره کړئ؟

اوسپنه OCR د نصب کولو اسانه ، بشپړ او ښه مستند شوی .NET سافټویر کتابتون دی.

د هرې بهرنۍ ویب خدماتو کارولو ، روان فیسونو یا په انټرنیټ کې محرم اسناد لیږلو پرته د 99.8 + + OCR درستتیا ترلاسه کولو لپاره IronOCR غوره کړئ.

ولې د C#پراختیا کونکي د وینیلا ټیسټریکټ غوره IronOCR غوره کوي:

  • د واحد DLL یا نوګټ په توګه نصب کړئ
  • د ټیسریکټ 5 ، 4 او 3 انجنونو لپاره د بکس څخه بهر شامل دي.
  • دقه .8 ٪ .. significantly د منظم ټیسریکټ د پام وړ پرمختګ کوي.
  • د اور لګولو سرعت او ګ Multi تریډیدینګ
  • MVC ، WebApp ، ډیسټاپ ، کنسول او سرور غوښتنلیکونه متوافق دي
  • هیڅ Exes یا C ++ کوډ نشته چې ورسره کار وکړي
  • د PDF بشپړ OCR ملاتړ
  • د OCR ترسره کولو لپاره نږدې هر یو عکس فایل یا PDF
  • بشپړ .NET کور ، معیاري او چوکاټ ملاتړ
  • په وینډوز ، ماک ، لینکس ، ازور ، ډاکر ، لیمبډا ، AWS کې ځای په ځای کول
  • بارکوډونه او د QR کوډونه ولولئ
  • XCR ته د OCR صادرول
  • د پلټنې وړ PDF سندونو ته OCR صادر کړئ
  • ملټيډریډنګ ملاتړ
  • 126 نړیوالې ژبې ټولې د نوګټ یا اوکرډاټا فایلونو له لارې اداره شوې
  • عکسونه ، همغږي ، احصایې او فونټونه لرې کړئ. نه یوازې متن.
  • په تجارتي او ملکيتي غوښتنلیکونو کې د ټیسریکټ OCR د توزیع لپاره کارول کیدی شي.

د اوسپنې OCR شین کیږي کله چې د ریښتیني نړۍ عکسونو او نیمګړتیاو اسنادو لکه عکسونو ، یا د ټیټ تحلیل سکینونو سره کار کولو سره کار کوي چې ممکن ډیجیټل شور یا نیمګړتیاوې ولري.

د NET پلیټ فارم لپاره نور وړیا OCR کتابتونونه داسې نور .net ټیسټریکټ APIs او ویب خدمتونه د دې ریښتینې نړۍ کارونې قضیو کې دومره ښه ترسره نه کوي.

OCR د 5 ازموینې سره - په C#کې کوډ ورکول پیل کړئ

لاندې د کوډ نمونه ښیې چې د C#یا VB .NET کارولو سره د عکس څخه متن لوستل څومره اسانه دي.

OneLiner

// Instantly read text from an image with one line of code
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
// Instantly read text from an image with one line of code
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
' Instantly read text from an image with one line of code
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
$vbLabelText   $csharpLabel

د هیلو نړۍ ترتیب کونکی

// Install the IronOCR Pashto language package via NuGet
// PM> Install-Package IronOCR.Languages.Pashto

using IronOcr;

var Ocr = new IronTesseract();
// Set language to Pashto
Ocr.Language = OcrLanguage.Pashto;

// Create OCR input instance and add an image for processing
using (var Input = new OcrInput())
{
    Input.AddImage("images/sample.jpeg");
    //... تاسو کولی شئ هر ډول عکسونه اضافه کړئ

    var Result = Ocr.Read(Input);

    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
// Install the IronOCR Pashto language package via NuGet
// PM> Install-Package IronOCR.Languages.Pashto

using IronOcr;

var Ocr = new IronTesseract();
// Set language to Pashto
Ocr.Language = OcrLanguage.Pashto;

// Create OCR input instance and add an image for processing
using (var Input = new OcrInput())
{
    Input.AddImage("images/sample.jpeg");
    //... تاسو کولی شئ هر ډول عکسونه اضافه کړئ

    var Result = Ocr.Read(Input);

    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
' Install the IronOCR Pashto language package via NuGet
' PM> Install-Package IronOCR.Languages.Pashto

Imports IronOcr

Private Ocr = New IronTesseract()
' Set language to Pashto
Ocr.Language = OcrLanguage.Pashto

' Create OCR input instance and add an image for processing
Using Input = New OcrInput()
	Input.AddImage("images/sample.jpeg")
	'... تاسو کولی شئ هر ډول عکسونه اضافه کړئ

	Dim Result = Ocr.Read(Input)

	' Output the extracted text to console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

C#د پی ډی ایف او سي آر

ورته طریقه ورته ورته د هر PDF سند څخه د متن استخراج لپاره کارول کیدی شي.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var input = new OcrInput())
{
    // Add a PDF file for OCR processing. Password is optional
    input.AddPdf("example.pdf", "password");
    // موږ کولی شو OCR ته ځانګړي د پی ډی اف پا pageې نمبرونه هم وټاکو

    var Result = Ocr.Read(input);

    // Print the text and number of pages identified
    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages");
    // د PDF هر پا pageې لپاره 1 پا .ه
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var input = new OcrInput())
{
    // Add a PDF file for OCR processing. Password is optional
    input.AddPdf("example.pdf", "password");
    // موږ کولی شو OCR ته ځانګړي د پی ډی اف پا pageې نمبرونه هم وټاکو

    var Result = Ocr.Read(input);

    // Print the text and number of pages identified
    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages");
    // د PDF هر پا pageې لپاره 1 پا .ه
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using input = New OcrInput()
	' Add a PDF file for OCR processing. Password is optional
	input.AddPdf("example.pdf", "password")
	' موږ کولی شو OCR ته ځانګړي د پی ډی اف پا pageې نمبرونه هم وټاکو

	Dim Result = Ocr.Read(input)

	' Print the text and number of pages identified
	Console.WriteLine(Result.Text)
	Console.WriteLine($"{Result.Pages.Count()} Pages")
	' د PDF هر پا pageې لپاره 1 پا .ه
End Using
$vbLabelText   $csharpLabel

د ملټي پیج TIFFs لپاره OCR

OCR لوستل د TIFF فایل ب formatه په شمول د ډیری پا pageو اسنادو. TIFF هم د لټون وړ متن سره په مستقیم ډول د پی ډی ایف فایل کې بدلیدلی شي.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    // Add multi-page TIFF for OCR processing
    input.AddMultiFrameTiff("multi-frame.tiff");
    var Result = Ocr.Read(Input);
    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    // Add multi-page TIFF for OCR processing
    input.AddMultiFrameTiff("multi-frame.tiff");
    var Result = Ocr.Read(Input);
    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
	' Add multi-page TIFF for OCR processing
	input.AddMultiFrameTiff("multi-frame.tiff")
	Dim Result = Ocr.Read(Input)
	' Output the extracted text to console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

بارکوډونه او کیو آر

د اوسپنې OCR یوه ځانګړتیا دا ده چې دا کولی شي د اسنادو څخه بارکوډونه او QR کوډونه لوستل شي پداسې حال کې چې دا د متن لپاره سکین کوي. د OcrResult.OcrBarcode ټولګي مثالونه پراختیا کونکي ته د هر سکین شوي بارکوډ په اړه تفصيلي معلومات ورکوي.

using IronOcr;

var Ocr = new IronTesseract();
// Enable reading of barcodes
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
    // Add an image containing barcodes
    input.AddImage("img/Barcode.png");
    var Result = Ocr.Read(input);

    // Iterate over found barcodes and output their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // د ډول او موقعیت ملکیتونه هم افشا شوي
    }
}
using IronOcr;

var Ocr = new IronTesseract();
// Enable reading of barcodes
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
    // Add an image containing barcodes
    input.AddImage("img/Barcode.png");
    var Result = Ocr.Read(input);

    // Iterate over found barcodes and output their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // د ډول او موقعیت ملکیتونه هم افشا شوي
    }
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Enable reading of barcodes
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
	' Add an image containing barcodes
	input.AddImage("img/Barcode.png")
	Dim Result = Ocr.Read(input)

	' Iterate over found barcodes and output their values
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
		' د ډول او موقعیت ملکیتونه هم افشا شوي
	Next Barcode
End Using
$vbLabelText   $csharpLabel

د عکسونو ځانګړو ساحو باندې OCR

د اوسپنې OCR ټولې سکینګ او لوستلو میتودونه د دې وړتیا چمتو کوي چې مشخص کړي د کومې پا pageې یا پا pagesو کومه برخه چې موږ ترې متن لوستل غواړو. دا خورا ګټور دی کله چې موږ معیاري ب formsو ته ګورو او کولی شو ډیر وخت وژغورو او موثریت ته وده ورکړو.

د فصل ساحو کارولو لپاره ، موږ به د System.Drawing ته د سیسټم حواله اضافه کولو ته اړتیا ولرو ترڅو موږ وکولی شو System.Drawing.Rectangle خطي استعمال کړو.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    // Define the area to perform OCR on, using rectangle dimensions
    var ContentArea = new System.Drawing.Rectangle() 
    { 
        X = 215, Y = 1250, Height = 280, Width = 1335 
    };
    // ابعاد په px کې دي

    // Add the specific cropped area from an image
    Input.Add("document.png", ContentArea);

    var Result = Ocr.Read(Input);

    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    // Define the area to perform OCR on, using rectangle dimensions
    var ContentArea = new System.Drawing.Rectangle() 
    { 
        X = 215, Y = 1250, Height = 280, Width = 1335 
    };
    // ابعاد په px کې دي

    // Add the specific cropped area from an image
    Input.Add("document.png", ContentArea);

    var Result = Ocr.Read(Input);

    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
	' Define the area to perform OCR on, using rectangle dimensions
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	' ابعاد په px کې دي

	' Add the specific cropped area from an image
	Input.Add("document.png", ContentArea)

	Dim Result = Ocr.Read(Input)

	' Output the extracted text to console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

د ټیټ کیفیت سکینونو لپاره OCR

د اوسپنې OCR OcrInput ټولګی کولی شي سکینونه فکس کړي چې نورمال ټیسریکټ نشي لوستلی.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    // Apply enhancements to the input to improve OCR accuracy
    Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
    Input.Deskew(); // دورې او لید اصلاح کوي
    var Result = Ocr.Read(Input);
    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    // Apply enhancements to the input to improve OCR accuracy
    Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
    Input.Deskew(); // دورې او لید اصلاح کوي
    var Result = Ocr.Read(Input);
    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
	' Apply enhancements to the input to improve OCR accuracy
	Input.DeNoise() ' ډیجیټل شور او ضعیف سکینګ حلوي
	Input.Deskew() ' دورې او لید اصلاح کوي
	Dim Result = Ocr.Read(Input)
	' Output the extracted text to console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

د پلټنې وړ PDF په توګه د OCR پایلې صادر کړئ

د کاپي کولو وړ ټکي سره پی ډی ایف ته عکس. د لټون انجنونو او ډیټابیس لخوا ترتیب کیدی شي.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    Input.Title = "Quarterly Report";
    Input.AddImage("image1.jpeg");
    Input.AddImage("image2.png");
    Input.AddImage("image3.gif");

    var Result = Ocr.Read(input);
    // Save the OCR output as a searchable PDF
    Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    Input.Title = "Quarterly Report";
    Input.AddImage("image1.jpeg");
    Input.AddImage("image2.png");
    Input.AddImage("image3.gif");

    var Result = Ocr.Read(input);
    // Save the OCR output as a searchable PDF
    Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
	Input.Title = "Quarterly Report"
	Input.AddImage("image1.jpeg")
	Input.AddImage("image2.png")
	Input.AddImage("image3.gif")

	Dim Result = Ocr.Read(input)
	' Save the OCR output as a searchable PDF
	Result.SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

TIFF د پی ډی ایف تبادلې د لټون لپاره

د TIFF سند (یا د عکس فایلونو هرې ډلې) په مستقیم ډول د لټون وړ پی ډی ایف ته واړوئ کوم چې د انټرنټ ، ویب پا andې او ګوګل لټون انجنونو سره ترتیب کیدی شي.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    // Add multiframe TIFF for OCR processing
    input.AddMultiFrameTiff("example.tiff");
    var Result = Ocr.Read(input);
    // Save the OCR output as a searchable PDF
    Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    // Add multiframe TIFF for OCR processing
    input.AddMultiFrameTiff("example.tiff");
    var Result = Ocr.Read(input);
    // Save the OCR output as a searchable PDF
    Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
	' Add multiframe TIFF for OCR processing
	input.AddMultiFrameTiff("example.tiff")
	Dim Result = Ocr.Read(input)
	' Save the OCR output as a searchable PDF
	Result.SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

د OCR پایلې د HTML په توګه صادر کړئ

د OCR عکس د XHTML تبادلې ته.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    Input.Title = "Html Title";
    Input.AddImage("image1.jpeg");
    var Result = Ocr.Read(input);
    // Save the OCR output as an HTML file
    Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    Input.Title = "Html Title";
    Input.AddImage("image1.jpeg");
    var Result = Ocr.Read(input);
    // Save the OCR output as an HTML file
    Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
	Input.Title = "Html Title"
	Input.AddImage("image1.jpeg")
	Dim Result = Ocr.Read(input)
	' Save the OCR output as an HTML file
	Result.SaveAsHocrFile("results.html")
End Using
$vbLabelText   $csharpLabel

د OCR عکس افزونه فلټرونه

ICROCR د OCR فعالیت ښه کولو لپاره د OcrInput څیزونو لپاره ځانګړي فلټرونه چمتو کوي.

د عکس د تقویت کولو کوډ مثال

د OCR ان پټ عکسونه لوړ کیفیت رامینځته کوي ترڅو غوره ، ګړندي OCR پایلې رامینځته کړي.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    // Apply enhancements to the input
    Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
    Input.Deskew(); // دورې او لید اصلاح کوي
    var Result = Ocr.Read(Input);
    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    // Apply enhancements to the input
    Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
    Input.Deskew(); // دورې او لید اصلاح کوي
    var Result = Ocr.Read(Input);
    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput("LowQuality.jpeg")
	' Apply enhancements to the input
	Input.DeNoise() ' ډیجیټل شور او ضعیف سکینګ حلوي
	Input.Deskew() ' دورې او لید اصلاح کوي
	Dim Result = Ocr.Read(Input)
	' Output the extracted text to console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

د OCR عکس فلټرونو لیست

د OCR فعالیت مینځته کولو لپاره ننوت چاtersګر چې په IronOCR کې جوړ شوي په لاندې ډول دي:

  • OcrInput.Rotate (دوه درجې) - عکسونه د ساعت په اوږدو کې د یو شمیر درجو په واسطه ګرځي . د ساعت په مقابل کې ، منفي شمیرې وکاروئ.
  • OcrInput.Binarize () - د دې عکس فلټر هره پکسل تور یا سپین سپین پرته له مینځنۍ ځمکې سره. ممکن د OCR فعالیت فعالیتونو ته د متن خورا ټیټ برعکس شاليد ته وده ورکړي.
  • OcrInput.ToGrayScale () - د دې عکس فلټر هر پکسل د خړ رنګ سیوري بدلوي. د OCR درستتیا ته وده ورکولو لپاره امکان نلري مګر ممکن سرعت ښه کړي
  • OcrInput.Contrast () - په اتوماتيک ډول د مقابل زیاتوالی. دا فلټر اکثرا د ټیټ برعکس سکینونو کې د OCR سرعت او دقت درستوي.
  • OcrInput.DeNoise () - ډیجیټل شور لرې کوي. دا فلټر باید یوازې وکارول شي چیرې چې شور تمه کیږي.
  • OcrInput.Invert () - هر رنګ بدلوي. د مثال په توګه سپینه تور کیږي: تور سپین کیږي.
  • OcrInput.Dilate () - پرمختللی مورفولوژي. ډیلریشن په عکس کې د شیانو حدود ته پکسل اضافه کوي. د ایروډ مخالف
  • OcrInput.Erode () - پرمختللی مورفولوژي. Erosion د Dilate څيز boundariesOpposite پېکسل لرې
  • OcrInput.Deskew () - یو عکس ګرځوي نو دا سمه لاره او ارتوګونال دی. دا د OCR لپاره خورا ګټور دی ځکه چې د اسکایډ سکینونو لپاره د ټیسټریکټ زغم کولی شي تر 5 درجې پورې ټیټ وي.
  • OcrInput.DeepCleanBackgroundNoise () - د شاليد شالید د شور لرې کول. یوازې دا فلټر وکاروئ په هغه حالت کې چې د خورا ډیر سند لرونکي شالید شور پیژندل شوی وي ، ځکه چې دا فلټر به د پاکو اسنادو د OCR درستتیا کمولو خطر هم ولري ، او د CPU خورا ګران دی.
  • OcrInput.EnhanceResolution - د ټیټ کیفیت عکسونو حل لوړوي. دا فلټر اکثرا اړتیا نلري ځکه چې OcrInput.MinimumDPI او OcrInput.TargetDPI به په اوتومات ډول د ټیټ ریزولوشن انلاینونه حل او حل کړي.

کلین. دا یو سیټینګ دی چې یو څه وخت ته اړتیا لري؛ په هرصورت ، دا کتابتون ته اجازه ورکوي چې پخپله د ډیجیټل عکس کې ډیجیټل شور ، د کاغذ خنډونه ، او نور نیمګړتیاوې پاکې کړي کوم چې که نه نو دا د OCR نورو کتابتونونو لخوا د لوستلو توان نه لري.

اینهانس کانټراسټ یو ترتیب دی چې د اوسپنې OCR لامل کیږي په اتوماتيک ډول د عکس شالید پروړاندې د متن برعکس زیاتوالی ، د OCR دقت او په عمومي ډول د فعالیت او OCR سرعت زیاتوي.

EnhanceResolution یو ترتیب دی چې په اتوماتيک ډول به د ټیټ - ریزولوشن عکسونه ومومي (کوم چې د 275 dpi لاندې دي) او پخپله عکس پورته کوي او بیا ټول متن تیزوي نو دا د OCR کتابتون لخوا په سمه توګه لوستل کیدی شي. که څه هم دا عملیات پخپله د وخت مصرف کوي ، دا عموما په یو عکس کې د OCR عملیاتو لپاره عمومي وخت کموي.

د ژبې اوسپنې OCR د 22 نړیوالو ژبو کڅوړو ملاتړ کوي ، او د ژبې ترتیب کولی شي د OCR عملیاتو لپاره غوښتنه کولو لپاره د یوې یا ډیرو څو ژبو غوره کولو لپاره وکارول شي.

ستراتیژي د اوسپنې OCR دوه ستراتیژیو ملاتړ کوي. موږ ممکن د یادو سندونو ګړندي او لږ دقیق سکین لپاره لاړ شو ، یا پرمختللې تګلاره وکاروو چې د مصنوعي استخباراتي ماډلونو څخه کار واخلو په اوتومات ډول د OCR متن درستیت ته وده ورکوو په جمله کې د ټکو احصایوي اړیکو ته په کتو سره .

کلر سپیس یو تنظیم دی چې له دې لارې موږ کولی شو په ګریسي یا رنګ کې OCR غوره وکړو. په عموم کې ، ګريکل غوره انتخاب دی. په هرصورت ، ځینې وختونه کله چې ورته ورته رنګ متنونه یا شالید شتون ولري مګر خورا مختلف رنګ ، د بشپړ رنګ رنګ ځای به غوره پایلې چمتو کړي.

ویکټوایټ ټیکټ ان بیک ډباکګراؤنډونه ومومئ. عموما ، ټول OCR کتابتونونه تمه لري چې په سپین مخونو کې تور متن وګوري. دا ترتیب د اوسپنې OCR ته اجازه ورکوي په اوتومات ډول منفي ، یا تیاره پا pagesې د سپینې متن سره کشف کړي ، او ولولي.

ننوت عکس العمل. دا ترتیب ډویلګر ته اجازه ورکوي چې د OCR کتابتون ته لارښوونه وکړي چې ایا دا د بشپړ سند یا سنیپټ په لټه کې دی ، لکه د سکرین شاټ.

د RotateAndStraight یو پرمختللی ترتیب دی چې د اوسپنې OCR ته اجازه ورکوي د سندونو لوستلو لپاره ځانګړی وړتیا ورکړي چې نه یوازې داځل کیږي ، مګر شاید لید لرونکی وي ، لکه د متن سندونو عکسونه.

ریډ بارکوډونه یو ګټور ب featureه ده کوم چې د اوسپنې OCR ته اجازه ورکوي چې پخپله پا pagesو کې بارکوډونه او QR کوډونه ولولي ځکه چې دا متن هم لوستل کیږي ، پرته لدې چې د لوی اضافي بار اضافه کول.

رنګ. دا ترتیب ټاکي چې د رنګ ژورتیا مشخص کولو لپاره د OCR کتابتون به په هر پکسل کې څومره ټوټې وکاروي. د لوړ رنګ ژورالی ممکن د OCR کیفیت لوړ کړي ، مګر دا به د OCR عملیاتو بشپړولو لپاره اړین وخت هم ډیر کړي.

د ژبې ګksې

د اوسپنې OCR د ژبې کڅوړې له لارې 126 نړیوالو ژبو ملاتړ کوي کوم چې د DLLs په توګه توزیع شوي ، کوم چې له دې ویب پا fromې څخه ډاونلوډ کیدی شي ، یا هم د نیجیت پیکیج مدیر څخه .

په ژبو کې الماني ، فرانسوي ، انګلیسي ، چینایي ، جاپاني او نور ډیر څه شامل دي. د پاسپورټ MRZ ، MICR چیکونو ، مالي معلوماتو ، جواز پلیټونو او نورو ډیر څه لپاره د ژبې متخصص کڅوړې شتون لري. تاسو کولی شئ هر ډول ټیسټریکټ ". ټریډینټاټا" فایل هم وکاروئ - پشمول هغه څوک چې تاسو خپل ځان جوړ کړی.

د ژبې مثال

د OCR نورې ژبې کارول.

// Install the IronOCR Arabic language package via NuGet
// PM> Install IronOcr.Languages.Arabic

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Arabic
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
    input.AddImage("img/arabic.gif");
    // Add image filters if necessary
    // In this case, even with low-quality input
    // Iron Tesseract can read what traditional Tesseract cannot.

    var Result = Ocr.Read(input);

    // Console cannot easily print Arabic in Windows.
    // Let's save to disk instead.
    Result.SaveAsTextFile("arabic.txt");
}
// Install the IronOCR Arabic language package via NuGet
// PM> Install IronOcr.Languages.Arabic

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Arabic
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
    input.AddImage("img/arabic.gif");
    // Add image filters if necessary
    // In this case, even with low-quality input
    // Iron Tesseract can read what traditional Tesseract cannot.

    var Result = Ocr.Read(input);

    // Console cannot easily print Arabic in Windows.
    // Let's save to disk instead.
    Result.SaveAsTextFile("arabic.txt");
}
' Install the IronOCR Arabic language package via NuGet
' PM> Install IronOcr.Languages.Arabic

Imports IronOcr

Private Ocr = New IronTesseract()
' Set OCR language to Arabic
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
	input.AddImage("img/arabic.gif")
	' Add image filters if necessary
	' In this case, even with low-quality input
	' Iron Tesseract can read what traditional Tesseract cannot.

	Dim Result = Ocr.Read(input)

	' Console cannot easily print Arabic in Windows.
	' Let's save to disk instead.
	Result.SaveAsTextFile("arabic.txt")
End Using
$vbLabelText   $csharpLabel

د ژبې ډیری بیلګه

دا په ورته وخت کې د ګ languagesو ژبو کارول OCR ته هم امکان لري. دا کولی شي واقعیا د انیکوډ سندونو کې د انګلیسي ژبې میټاټاټا او url ترلاسه کولو کې مرسته وکړي.

// Install the IronOCR ChineseSimplified language package via NuGet
// PM> Install IronOcr.Languages.ChineseSimplified

using IronOcr;

var Ocr = new IronTesseract();
// Set primary language to Simplified Chinese
Ocr.Language = OcrLanguage.ChineseSimplified;

// Add a secondary language, in this case, Pashto
Ocr.AddSecondaryLanguage(OcrLanguage.Pashto);

// Add input PDF and perform OCR
using (var input = new OcrInput())
{
    input.Add("multi-language.pdf");
    var Result = Ocr.Read(input);
    // Save OCR result to a text file
    Result.SaveAsTextFile("results.txt");
}
// Install the IronOCR ChineseSimplified language package via NuGet
// PM> Install IronOcr.Languages.ChineseSimplified

using IronOcr;

var Ocr = new IronTesseract();
// Set primary language to Simplified Chinese
Ocr.Language = OcrLanguage.ChineseSimplified;

// Add a secondary language, in this case, Pashto
Ocr.AddSecondaryLanguage(OcrLanguage.Pashto);

// Add input PDF and perform OCR
using (var input = new OcrInput())
{
    input.Add("multi-language.pdf");
    var Result = Ocr.Read(input);
    // Save OCR result to a text file
    Result.SaveAsTextFile("results.txt");
}
' Install the IronOCR ChineseSimplified language package via NuGet
' PM> Install IronOcr.Languages.ChineseSimplified

Imports IronOcr

Private Ocr = New IronTesseract()
' Set primary language to Simplified Chinese
Ocr.Language = OcrLanguage.ChineseSimplified

' Add a secondary language, in this case, Pashto
Ocr.AddSecondaryLanguage(OcrLanguage.Pashto)

' Add input PDF and perform OCR
Using input = New OcrInput()
	input.Add("multi-language.pdf")
	Dim Result = Ocr.Read(input)
	' Save OCR result to a text file
	Result.SaveAsTextFile("results.txt")
End Using
$vbLabelText   $csharpLabel

د OCR تفصيلي پایلې

اوسپنه OCR د هرې OCR عملیاتو لپاره د OCR پایلې توکي بیرته راولي. عموما ، پراختیا کونکي یوازې د دې څیز متن ملکیت کاروي ترڅو له عکس څخه سکین ترلاسه کړي. په هرصورت ، د OCR پایلې DOM د دې په پرتله خورا پرمختللی دی.

using IronOcr;
using System.Drawing; // د اسمبلۍ حواله اضافه کړئ

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;

// Enable reading of barcodes
Ocr.Configuration.ReadBarCodes = true;

using (var Input = new OcrInput(@"images\sample.tiff"))
{
    OcrResult Result = Ocr.Read(Input);
    var Pages = Result.Pages;
    var Words = Pages[0].Words;
    var Barcodes = Result.Barcodes;

    // د پراخه ، تفصيلي API موندلو لپاره دلته سپړنه وکړئ:
    // - پا Pagesې ، بلاکونه ، پارافوفونه ، لاینونه ، ټکي ، چارسونه
    // - د عکس صادرول ، د فونټ همغږي کول ، احصایوي معلومات
}
using IronOcr;
using System.Drawing; // د اسمبلۍ حواله اضافه کړئ

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;

// Enable reading of barcodes
Ocr.Configuration.ReadBarCodes = true;

using (var Input = new OcrInput(@"images\sample.tiff"))
{
    OcrResult Result = Ocr.Read(Input);
    var Pages = Result.Pages;
    var Words = Pages[0].Words;
    var Barcodes = Result.Barcodes;

    // د پراخه ، تفصيلي API موندلو لپاره دلته سپړنه وکړئ:
    // - پا Pagesې ، بلاکونه ، پارافوفونه ، لاینونه ، ټکي ، چارسونه
    // - د عکس صادرول ، د فونټ همغږي کول ، احصایوي معلومات
}
Imports IronOcr
Imports System.Drawing ' د اسمبلۍ حواله اضافه کړئ

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm

' Enable reading of barcodes
Ocr.Configuration.ReadBarCodes = True

Using Input = New OcrInput("images\sample.tiff")
	Dim Result As OcrResult = Ocr.Read(Input)
	Dim Pages = Result.Pages
	Dim Words = Pages(0).Words
	Dim Barcodes = Result.Barcodes

	' د پراخه ، تفصيلي API موندلو لپاره دلته سپړنه وکړئ:
	' - پا Pagesې ، بلاکونه ، پارافوفونه ، لاینونه ، ټکي ، چارسونه
	' - د عکس صادرول ، د فونټ همغږي کول ، احصایوي معلومات
End Using
$vbLabelText   $csharpLabel

کړنه

IronOCR د بکس څخه کار کوي د اړتیا وړ فعالیت سره ، اړتیا نلري یا په کلکه سره د ننوتلو عکسونه بدل کړئ.

سرعت تیښته ده: IronOcr.2020 + تر 10 چنده پورې ګړندی دی او د تیرو جوړښتونو په پرتله 250 fewer لږ غلطي کوي.

نور زده کړئ

په C#، VB ، F # ، یا کوم بل نورو .NET ژبه کې د OCR په اړه نور معلومات زده کولو لپاره ، مهرباني وکړئ زموږ د ټولنې ښوونې ولولئ ، کوم چې د نړۍ اوسني مثالونه وړاندې کوي چې څنګه د اوسپنې OCR کارول کیدی شي او ممکن د غوره توضیح کولو څرنګوالي ته توضیحات وښیې. دا کتابتون.

د .NET پراختیا کونکو لپاره د بشپړ اعتراض حواله هم شتون لري.