پشتو OCR په C#او .NET کې

Body Content:

د دې سند نور نسخې:

IronOCR د C#سافټویر اجزا ده چې .NET کوډرانو ته اجازه ورکوي چې د عکسونو او PDF سندونو متن په 126 ژبه کې د پښتو په ګډون ولوستل شي.

دا د ټیسریکټ پرمختللی فورک دی، چې په ځانګړي ډول د .NET پراختیا کونکو لپاره رامینځته شوی او په منظم ډول د ټیسریکټ انجنونه د دواړه سرعت او دقت لپاره ساتي.

د IronOcr.Languages.Pashto مینځپانګه

دا کڅوړه د NET لپاره د OCR 43 ژبې لري:

  • پښتو
  • پشتو بیست
  • پښتو فاسټ

ډاونلوډ

پښتو ژبه پیک [پښتو]
* Download as زپ
* Install with
https://www.nuget.org/packages/IronOcr.Languages.Pashto/'> نیوګیټ

لګول

لومړی شی چې موږ یې باید وکړو ستاسو د NET پروژې لپاره زموږ د پښتو OCR بسته نصب کړئ.

PM> Install-Package IronOcr.Languages.Pashto

کوډ مثال

دا C#کوډ مثال د عکس یا PDF سند څخه پښتو متن لوستل.

// Install the IronOCR Pashto language package via NuGet
// PM> Install-Package IronOcr.Languages.Pashto

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Pashto
Ocr.Language = OcrLanguage.Pashto;

// Read Pashto text from an image
using (var Input = new OcrInput(@"images\Pashto.png"))
{
    // Perform OCR and get the result
    var Result = Ocr.Read(Input);

    // Get the extracted text
    var AllText = Result.Text;
}
// Install the IronOCR Pashto language package via NuGet
// PM> Install-Package IronOcr.Languages.Pashto

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Pashto
Ocr.Language = OcrLanguage.Pashto;

// Read Pashto text from an image
using (var Input = new OcrInput(@"images\Pashto.png"))
{
    // Perform OCR and get the result
    var Result = Ocr.Read(Input);

    // Get the extracted text
    var AllText = Result.Text;
}
' Install the IronOCR Pashto language package via NuGet
' PM> Install-Package IronOcr.Languages.Pashto

Imports IronOcr

Private Ocr = New IronTesseract()
' Set the OCR language to Pashto
Ocr.Language = OcrLanguage.Pashto

' Read Pashto text from an image
Using Input = New OcrInput("images\Pashto.png")
	' Perform OCR and get the result
	Dim Result = Ocr.Read(Input)

	' Get the extracted text
	Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel

ولې آئرن او سی آر غوره کړئ؟

اوسپنه OCR د نصب کولو اسانه، بشپړ او ښه مستند شوی .NET سافټویر کتابتون دی.

د هرې بهرنۍ ویب خدماتو کارولو، روان فیسونو یا په انټرنیټ کې محرم اسناد لیږلو پرته د 99.8 + + OCR درستتیا ترلاسه کولو لپاره IronOCR غوره کړئ.

ولې د C#پراختیا کونکي د وینیلا ټیسټریکټ غوره IronOCR غوره کوي:

  • د واحد DLL یا نوګټ په توګه نصب کړئ
  • د ټیسریکټ 5، 4 او 3 انجنونو لپاره د بکس څخه بهر شامل دي.
  • دقه .8 ٪ .. significantly د منظم ټیسریکټ د پام وړ پرمختګ کوي.
  • د اور لګولو سرعت او ګ Multi تریډیدینګ
  • MVC، WebApp، ډیسټاپ، کنسول او سرور غوښتنلیکونه متوافق دي
  • هیڅ Exes یا C ++ کوډ نشته چې ورسره کار وکړي
  • د PDF بشپړ OCR ملاتړ
  • د OCR ترسره کولو لپاره نږدې هر یو عکس فایل یا PDF
  • بشپړ .NET کور، معیاري او چوکاټ ملاتړ
  • په وینډوز، ماک، لینکس، ازور، ډاکر، لیمبډا، AWS کې ځای په ځای کول
  • بارکوډونه او د QR کوډونه ولولئ
  • XCR ته د OCR صادرول
  • د پلټنې وړ PDF سندونو ته OCR صادر کړئ
  • ملټيډریډنګ ملاتړ
  • 126 نړیوالې ژبې ټولې د نوګټ یا اوکرډاټا فایلونو له لارې اداره شوې
  • عکسونه، همغږي، احصایې او فونټونه لرې کړئ. نه یوازې متن.
  • په تجارتي او ملکيتي غوښتنلیکونو کې د ټیسریکټ OCR د توزیع لپاره کارول کیدی شي.

د اوسپنې OCR شین کیږي کله چې د ریښتیني نړۍ عکسونو او نیمګړتیاو اسنادو لکه عکسونو، یا د ټیټ تحلیل سکینونو سره کار کولو سره کار کوي چې ممکن ډیجیټل شور یا نیمګړتیاوې ولري.

د NET پلیټ فارم لپاره نور وړیا OCR کتابتونونه داسې نور .NET ټیسټریکټ APIs او ویب خدمتونه د دې ریښتینې نړۍ کارونې قضیو کې دومره ښه ترسره نه کوي.

OCR د 5 ازموینې سره - په C#کې کوډ ورکول پیل کړئ

لاندې د کوډ نمونه ښیې چې د C#یا VB .NET کارولو سره د عکس څخه متن لوستل څومره اسانه دي.

OneLiner

// Instantly read text from an image with one line of code
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
// Instantly read text from an image with one line of code
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
' Instantly read text from an image with one line of code
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
$vbLabelText   $csharpLabel

د هیلو نړۍ ترتیب کونکی

// Install the IronOCR Pashto language package via NuGet
// PM> Install-Package IronOcr.Languages.Pashto

using IronOcr;

var Ocr = new IronTesseract();
// Set language to Pashto
Ocr.Language = OcrLanguage.Pashto;

// Create OCR input instance and add an image for processing
using (var Input = new OcrInput())
{
    Input.AddImage("images/sample.jpeg");
    //... تاسو کولی شئ هر ډول عکسونه اضافه کړئ

    var Result = Ocr.Read(Input);

    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
// Install the IronOCR Pashto language package via NuGet
// PM> Install-Package IronOcr.Languages.Pashto

using IronOcr;

var Ocr = new IronTesseract();
// Set language to Pashto
Ocr.Language = OcrLanguage.Pashto;

// Create OCR input instance and add an image for processing
using (var Input = new OcrInput())
{
    Input.AddImage("images/sample.jpeg");
    //... تاسو کولی شئ هر ډول عکسونه اضافه کړئ

    var Result = Ocr.Read(Input);

    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
Imports IronOcr

' Install the IronOCR Pashto language package via NuGet
' PM> Install-Package IronOcr.Languages.Pashto

Dim Ocr As New IronTesseract()
' Set language to Pashto
Ocr.Language = OcrLanguage.Pashto

' Create OCR input instance and add an image for processing
Using Input As New OcrInput()
    Input.AddImage("images/sample.jpeg")
    '... تاسو کولی شئ هر ډول عکسونه اضافه کړئ

    Dim Result = Ocr.Read(Input)

    ' Output the extracted text to console
    Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

C#د پی ډی ایف او سي آر

ورته طریقه ورته ورته د هر PDF سند څخه د متن استخراج لپاره کارول کیدی شي.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var input = new OcrInput())
{
    // Add a PDF file for OCR processing. Password is optional
    input.AddPdf("example.pdf", "password");
    // موږ کولی شو OCR ته ځانګړي د پی ډی اف پا pageې نمبرونه هم وټاکو

    var Result = Ocr.Read(input);

    // Print the text and number of pages identified
    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages");
    // د PDF هر پا pageې لپاره 1 پا .ه
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var input = new OcrInput())
{
    // Add a PDF file for OCR processing. Password is optional
    input.AddPdf("example.pdf", "password");
    // موږ کولی شو OCR ته ځانګړي د پی ډی اف پا pageې نمبرونه هم وټاکو

    var Result = Ocr.Read(input);

    // Print the text and number of pages identified
    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages");
    // د PDF هر پا pageې لپاره 1 پا .ه
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using input = New OcrInput()
	' Add a PDF file for OCR processing. Password is optional
	input.AddPdf("example.pdf", "password")
	' موږ کولی شو OCR ته ځانګړي د پی ډی اف پا pageې نمبرونه هم وټاکو

	Dim Result = Ocr.Read(input)

	' Print the text and number of pages identified
	Console.WriteLine(Result.Text)
	Console.WriteLine($"{Result.Pages.Count()} Pages")
	' د PDF هر پا pageې لپاره 1 پا .ه
End Using
$vbLabelText   $csharpLabel

د ملټي پیج TIFFs لپاره OCR

OCR لوستل د TIFF فایل ب formatه په شمول د ډیری پا pageو اسنادو. TIFF هم د لټون وړ متن سره په مستقیم ډول د پی ډی ایف فایل کې بدلیدلی شي.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    // Add multi-page TIFF for OCR processing
    input.AddMultiFrameTiff("multi-frame.tiff");
    var Result = Ocr.Read(Input);
    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    // Add multi-page TIFF for OCR processing
    input.AddMultiFrameTiff("multi-frame.tiff");
    var Result = Ocr.Read(Input);
    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
	' Add multi-page TIFF for OCR processing
	input.AddMultiFrameTiff("multi-frame.tiff")
	Dim Result = Ocr.Read(Input)
	' Output the extracted text to console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

بارکوډونه او کیو آر

د اوسپنې OCR یوه ځانګړتیا دا ده چې دا کولی شي د اسنادو څخه بارکوډونه او QR کوډونه لوستل شي پداسې حال کې چې دا د متن لپاره سکین کوي. د OcrResult.OcrBarcode ټولګي مثالونه پراختیا کونکي ته د هر سکین شوي بارکوډ په اړه تفصيلي معلومات ورکوي.

using IronOcr;

var Ocr = new IronTesseract();
// Enable reading of barcodes
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
    // Add an image containing barcodes
    input.AddImage("img/Barcode.png");
    var Result = Ocr.Read(input);

    // Iterate over found barcodes and output their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // د ډول او موقعیت ملکیتونه هم افشا شوي
    }
}
using IronOcr;

var Ocr = new IronTesseract();
// Enable reading of barcodes
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
    // Add an image containing barcodes
    input.AddImage("img/Barcode.png");
    var Result = Ocr.Read(input);

    // Iterate over found barcodes and output their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // د ډول او موقعیت ملکیتونه هم افشا شوي
    }
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Enable reading of barcodes
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
	' Add an image containing barcodes
	input.AddImage("img/Barcode.png")
	Dim Result = Ocr.Read(input)

	' Iterate over found barcodes and output their values
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
		' د ډول او موقعیت ملکیتونه هم افشا شوي
	Next Barcode
End Using
$vbLabelText   $csharpLabel

د عکسونو ځانګړو ساحو باندې OCR

د اوسپنې OCR ټولې سکینګ او لوستلو میتودونه د دې وړتیا چمتو کوي چې مشخص کړي د کومې پا pageې یا پا pagesو کومه برخه چې موږ ترې متن لوستل غواړو. دا خورا ګټور دی کله چې موږ معیاري ب formsو ته ګورو او کولی شو ډیر وخت وژغورو او موثریت ته وده ورکړو.

د فصل ساحو کارولو لپاره، موږ به د System.Drawing ته د سیسټم حواله اضافه کولو ته اړتیا ولرو ترڅو موږ وکولی شو System.Drawing.Rectangle خطي استعمال کړو.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    // Define the area to perform OCR on, using rectangle dimensions
    var ContentArea = new System.Drawing.Rectangle() 
    { 
        X = 215, Y = 1250, Height = 280, Width = 1335 
    };
    // ابعاد په px کې دي

    // Add the specific cropped area from an image
    Input.Add("document.png", ContentArea);

    var Result = Ocr.Read(Input);

    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    // Define the area to perform OCR on, using rectangle dimensions
    var ContentArea = new System.Drawing.Rectangle() 
    { 
        X = 215, Y = 1250, Height = 280, Width = 1335 
    };
    // ابعاد په px کې دي

    // Add the specific cropped area from an image
    Input.Add("document.png", ContentArea);

    var Result = Ocr.Read(Input);

    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
	' Define the area to perform OCR on, using rectangle dimensions
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	' ابعاد په px کې دي

	' Add the specific cropped area from an image
	Input.Add("document.png", ContentArea)

	Dim Result = Ocr.Read(Input)

	' Output the extracted text to console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

د ټیټ کیفیت سکینونو لپاره OCR

د اوسپنې OCR OcrInput ټولګی کولی شي سکینونه فکس کړي چې نورمال ټیسریکټ نشي لوستلی.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    // Apply enhancements to the input to improve OCR accuracy
    Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
    Input.Deskew(); // دورې او لید اصلاح کوي
    var Result = Ocr.Read(Input);
    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    // Apply enhancements to the input to improve OCR accuracy
    Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
    Input.Deskew(); // دورې او لید اصلاح کوي
    var Result = Ocr.Read(Input);
    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
	' Apply enhancements to the input to improve OCR accuracy
	Input.DeNoise() ' ډیجیټل شور او ضعیف سکینګ حلوي
	Input.Deskew() ' دورې او لید اصلاح کوي
	Dim Result = Ocr.Read(Input)
	' Output the extracted text to console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

د پلټنې وړ PDF په توګه د OCR پایلې صادر کړئ

د کاپي کولو وړ ټکي سره پی ډی ایف ته عکس. د لټون انجنونو او ډیټابیس لخوا ترتیب کیدی شي.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    Input.Title = "Quarterly Report";
    Input.AddImage("image1.jpeg");
    Input.AddImage("image2.png");
    Input.AddImage("image3.gif");

    var Result = Ocr.Read(input);
    // Save the OCR output as a searchable PDF
    Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    Input.Title = "Quarterly Report";
    Input.AddImage("image1.jpeg");
    Input.AddImage("image2.png");
    Input.AddImage("image3.gif");

    var Result = Ocr.Read(input);
    // Save the OCR output as a searchable PDF
    Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
	Input.Title = "Quarterly Report"
	Input.AddImage("image1.jpeg")
	Input.AddImage("image2.png")
	Input.AddImage("image3.gif")

	Dim Result = Ocr.Read(input)
	' Save the OCR output as a searchable PDF
	Result.SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

TIFF د پی ډی ایف تبادلې د لټون لپاره

د TIFF سند (یا د عکس فایلونو هرې ډلې) په مستقیم ډول د لټون وړ پی ډی ایف ته واړوئ کوم چې د انټرنټ، ویب پا andې او ګوګل لټون انجنونو سره ترتیب کیدی شي.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    // Add multiframe TIFF for OCR processing
    input.AddMultiFrameTiff("example.tiff");
    var Result = Ocr.Read(input);
    // Save the OCR output as a searchable PDF
    Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    // Add multiframe TIFF for OCR processing
    input.AddMultiFrameTiff("example.tiff");
    var Result = Ocr.Read(input);
    // Save the OCR output as a searchable PDF
    Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
	' Add multiframe TIFF for OCR processing
	input.AddMultiFrameTiff("example.tiff")
	Dim Result = Ocr.Read(input)
	' Save the OCR output as a searchable PDF
	Result.SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

د OCR پایلې د HTML په توګه صادر کړئ

د OCR عکس د XHTML تبادلې ته.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    Input.Title = "Html Title";
    Input.AddImage("image1.jpeg");
    var Result = Ocr.Read(input);
    // Save the OCR output as an HTML file
    Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput())
{
    Input.Title = "Html Title";
    Input.AddImage("image1.jpeg");
    var Result = Ocr.Read(input);
    // Save the OCR output as an HTML file
    Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput()
	Input.Title = "Html Title"
	Input.AddImage("image1.jpeg")
	Dim Result = Ocr.Read(input)
	' Save the OCR output as an HTML file
	Result.SaveAsHocrFile("results.html")
End Using
$vbLabelText   $csharpLabel

د OCR عکس افزونه فلټرونه

ICROCR د OCR فعالیت ښه کولو لپاره د OcrInput څیزونو لپاره ځانګړي فلټرونه چمتو کوي.

د عکس د تقویت کولو کوډ مثال

د OCR ان پټ عکسونه لوړ کیفیت رامینځته کوي ترڅو غوره، ګړندي OCR پایلې رامینځته کړي.

using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    // Apply enhancements to the input
    Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
    Input.Deskew(); // دورې او لید اصلاح کوي
    var Result = Ocr.Read(Input);
    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    // Apply enhancements to the input
    Input.DeNoise(); // ډیجیټل شور او ضعیف سکینګ حلوي
    Input.Deskew(); // دورې او لید اصلاح کوي
    var Result = Ocr.Read(Input);
    // Output the extracted text to console
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto

Using Input = New OcrInput("LowQuality.jpeg")
	' Apply enhancements to the input
	Input.DeNoise() ' ډیجیټل شور او ضعیف سکینګ حلوي
	Input.Deskew() ' دورې او لید اصلاح کوي
	Dim Result = Ocr.Read(Input)
	' Output the extracted text to console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

د OCR عکس فلټرونو لیست

د OCR فعالیت مینځته کولو لپاره ننوت چاtersګر چې په IronOCR کې جوړ شوي په لاندې ډول دي:

  • OcrInput.Rotate (دوه درجې) - عکسونه د ساعت په اوږدو کې د یو شمیر درجو په واسطه ګرځي. د ساعت په مقابل کې، منفي شمیرې وکاروئ.
  • OcrInput.Binarize () - د دې عکس فلټر هره پکسل تور یا سپین سپین پرته له مینځنۍ ځمکې سره. ممکن د OCR فعالیت فعالیتونو ته د متن خورا ټیټ برعکس شاليد ته وده ورکړي.
  • OcrInput.ToGrayScale () - د دې عکس فلټر هر پکسل د خړ رنګ سیوري بدلوي. د OCR درستتیا ته وده ورکولو لپاره امکان نلري مګر ممکن سرعت ښه کړي
  • OcrInput.Contrast () - په اتوماتيک ډول د مقابل زیاتوالی. دا فلټر اکثرا د ټیټ برعکس سکینونو کې د OCR سرعت او دقت درستوي.
  • OcrInput.DeNoise () - ډیجیټل شور لرې کوي. دا فلټر باید یوازې وکارول شي چیرې چې شور تمه کیږي.
  • OcrInput.Invert () - هر رنګ بدلوي. د مثال په توګه سپینه تور کیږي: تور سپین کیږي.
  • OcrInput.Dilate () - پرمختللی مورفولوژي. ډیلریشن په عکس کې د شیانو حدود ته پکسل اضافه کوي. د ایروډ مخالف
  • OcrInput.Erode () - پرمختللی مورفولوژي. Erosion د Dilate څيز boundariesOpposite پېکسل لرې
  • OcrInput.Deskew () - یو عکس ګرځوي نو دا سمه لاره او ارتوګونال دی. دا د OCR لپاره خورا ګټور دی ځکه چې د اسکایډ سکینونو لپاره د ټیسټریکټ زغم کولی شي تر 5 درجې پورې ټیټ وي.
  • OcrInput.DeepCleanBackgroundNoise () - د شاليد شالید د شور لرې کول. یوازې دا فلټر وکاروئ په هغه حالت کې چې د خورا ډیر سند لرونکي شالید شور پیژندل شوی وي، ځکه چې دا فلټر به د پاکو اسنادو د OCR درستتیا کمولو خطر هم ولري، او د CPU خورا ګران دی.
  • OcrInput.EnhanceResolution - د ټیټ کیفیت عکسونو حل لوړوي. دا فلټر اکثرا اړتیا نلري ځکه چې OcrInput.MinimumDPI او OcrInput.TargetDPI به په اوتومات ډول د ټیټ ریزولوشن انلاینونه حل او حل کړي.

کلین. دا یو سیټینګ دی چې یو څه وخت ته اړتیا لري؛ په هرصورت، دا کتابتون ته اجازه ورکوي چې پخپله د ډیجیټل عکس کې ډیجیټل شور، د کاغذ خنډونه، او نور نیمګړتیاوې پاکې کړي کوم چې که نه نو دا د OCR نورو کتابتونونو لخوا د لوستلو توان نه لري.

اینهانس کانټراسټ یو ترتیب دی چې د اوسپنې OCR لامل کیږي په اتوماتيک ډول د عکس شالید پروړاندې د متن برعکس زیاتوالی، د OCR دقت او په عمومي ډول د فعالیت او OCR سرعت زیاتوي.

EnhanceResolution یو ترتیب دی چې په اتوماتيک ډول به د ټیټ - ریزولوشن عکسونه ومومي (کوم چې د 275 dpi لاندې دي) او پخپله عکس پورته کوي او بیا ټول متن تیزوي نو دا د OCR کتابتون لخوا په سمه توګه لوستل کیدی شي. که څه هم دا عملیات پخپله د وخت مصرف کوي، دا عموما په یو عکس کې د OCR عملیاتو لپاره عمومي وخت کموي.

د ژبې اوسپنې OCR د 22 نړیوالو ژبو کڅوړو ملاتړ کوي، او د ژبې ترتیب کولی شي د OCR عملیاتو لپاره غوښتنه کولو لپاره د یوې یا ډیرو څو ژبو غوره کولو لپاره وکارول شي.

ستراتیژي د اوسپنې OCR دوه ستراتیژیو ملاتړ کوي. موږ ممکن د یادو سندونو ګړندي او لږ دقیق سکین لپاره لاړ شو، یا پرمختللې تګلاره وکاروو چې د مصنوعي استخباراتي ماډلونو څخه کار واخلو په اوتومات ډول د OCR متن درستیت ته وده ورکوو په جمله کې د ټکو احصایوي اړیکو ته په کتو سره.

کلر سپیس یو تنظیم دی چې له دې لارې موږ کولی شو په ګریسي یا رنګ کې OCR غوره وکړو. په عموم کې، ګريکل غوره انتخاب دی. په هرصورت، ځینې وختونه کله چې ورته ورته رنګ متنونه یا شالید شتون ولري مګر خورا مختلف رنګ، د بشپړ رنګ رنګ ځای به غوره پایلې چمتو کړي.

ویکټوایټ ټیکټ ان بیک ډباکګراؤنډونه ومومئ. عموما، ټول OCR کتابتونونه تمه لري چې په سپین مخونو کې تور متن وګوري. دا ترتیب د اوسپنې OCR ته اجازه ورکوي په اوتومات ډول منفي، یا تیاره پا pagesې د سپینې متن سره کشف کړي، او ولولي.

ننوت عکس العمل. دا ترتیب ډویلګر ته اجازه ورکوي چې د OCR کتابتون ته لارښوونه وکړي چې ایا دا د بشپړ سند یا سنیپټ په لټه کې دی، لکه د سکرین شاټ.

د RotateAndStraight یو پرمختللی ترتیب دی چې د اوسپنې OCR ته اجازه ورکوي د سندونو لوستلو لپاره ځانګړی وړتیا ورکړي چې نه یوازې داځل کیږي، مګر شاید لید لرونکی وي، لکه د متن سندونو عکسونه.

ریډ بارکوډونه یو ګټور ب featureه ده کوم چې د اوسپنې OCR ته اجازه ورکوي چې پخپله پا pagesو کې بارکوډونه او QR کوډونه ولولي ځکه چې دا متن هم لوستل کیږي، پرته لدې چې د لوی اضافي بار اضافه کول.

رنګ. دا ترتیب ټاکي چې د رنګ ژورتیا مشخص کولو لپاره د OCR کتابتون به په هر پکسل کې څومره ټوټې وکاروي. د لوړ رنګ ژورالی ممکن د OCR کیفیت لوړ کړي، مګر دا به د OCR عملیاتو بشپړولو لپاره اړین وخت هم ډیر کړي.

د ژبې ګksې

د اوسپنې OCR د ژبې کڅوړې له لارې 126 نړیوالو ژبو ملاتړ کوي کوم چې د DLLs په توګه توزیع شوي، کوم چې له دې ویب پا fromې څخه ډاونلوډ کیدی شي، یا هم د نیجیت پیکیج مدیر څخه.

په ژبو کې الماني، فرانسوي، انګلیسي، چینایي، جاپاني او نور ډیر څه شامل دي. د پاسپورټ MRZ، MICR چیکونو، مالي معلوماتو، جواز پلیټونو او نورو ډیر څه لپاره د ژبې متخصص کڅوړې شتون لري. تاسو کولی شئ هر ډول ټیسټریکټ ". ټریډینټاټا" فایل هم وکاروئ - پشمول هغه څوک چې تاسو خپل ځان جوړ کړی.

د ژبې مثال

د OCR نورې ژبې کارول.

// Install the IronOCR Arabic language package via NuGet
// PM> Install IronOcr.Languages.Arabic

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Arabic
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
    input.AddImage("img/arabic.gif");
    // Add image filters if necessary
    // In this case, even with low-quality input
    // Iron Tesseract can read what traditional Tesseract cannot.

    var Result = Ocr.Read(input);

    // Console cannot easily print Arabic in Windows.
    // Let's save to disk instead.
    Result.SaveAsTextFile("arabic.txt");
}
// Install the IronOCR Arabic language package via NuGet
// PM> Install IronOcr.Languages.Arabic

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Arabic
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
    input.AddImage("img/arabic.gif");
    // Add image filters if necessary
    // In this case, even with low-quality input
    // Iron Tesseract can read what traditional Tesseract cannot.

    var Result = Ocr.Read(input);

    // Console cannot easily print Arabic in Windows.
    // Let's save to disk instead.
    Result.SaveAsTextFile("arabic.txt");
}
' Install the IronOCR Arabic language package via NuGet
' PM> Install IronOcr.Languages.Arabic

Imports IronOcr

Private Ocr = New IronTesseract()
' Set OCR language to Arabic
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
	input.AddImage("img/arabic.gif")
	' Add image filters if necessary
	' In this case, even with low-quality input
	' Iron Tesseract can read what traditional Tesseract cannot.

	Dim Result = Ocr.Read(input)

	' Console cannot easily print Arabic in Windows.
	' Let's save to disk instead.
	Result.SaveAsTextFile("arabic.txt")
End Using
$vbLabelText   $csharpLabel

د ژبې ډیری بیلګه

دا په ورته وخت کې د ګ languagesو ژبو کارول OCR ته هم امکان لري. دا کولی شي واقعیا د انیکوډ سندونو کې د انګلیسي ژبې میټاټاټا او url ترلاسه کولو کې مرسته وکړي.

// Install the IronOCR ChineseSimplified language package via NuGet
// PM> Install IronOcr.Languages.ChineseSimplified

using IronOcr;

var Ocr = new IronTesseract();
// Set primary language to Simplified Chinese
Ocr.Language = OcrLanguage.ChineseSimplified;

// Add a secondary language, in this case, Pashto
Ocr.AddSecondaryLanguage(OcrLanguage.Pashto);

// Add input PDF and perform OCR
using (var input = new OcrInput())
{
    input.Add("multi-language.pdf");
    var Result = Ocr.Read(input);
    // Save OCR result to a text file
    Result.SaveAsTextFile("results.txt");
}
// Install the IronOCR ChineseSimplified language package via NuGet
// PM> Install IronOcr.Languages.ChineseSimplified

using IronOcr;

var Ocr = new IronTesseract();
// Set primary language to Simplified Chinese
Ocr.Language = OcrLanguage.ChineseSimplified;

// Add a secondary language, in this case, Pashto
Ocr.AddSecondaryLanguage(OcrLanguage.Pashto);

// Add input PDF and perform OCR
using (var input = new OcrInput())
{
    input.Add("multi-language.pdf");
    var Result = Ocr.Read(input);
    // Save OCR result to a text file
    Result.SaveAsTextFile("results.txt");
}
' Install the IronOCR ChineseSimplified language package via NuGet
' PM> Install IronOcr.Languages.ChineseSimplified

Imports IronOcr

Private Ocr = New IronTesseract()
' Set primary language to Simplified Chinese
Ocr.Language = OcrLanguage.ChineseSimplified

' Add a secondary language, in this case, Pashto
Ocr.AddSecondaryLanguage(OcrLanguage.Pashto)

' Add input PDF and perform OCR
Using input = New OcrInput()
	input.Add("multi-language.pdf")
	Dim Result = Ocr.Read(input)
	' Save OCR result to a text file
	Result.SaveAsTextFile("results.txt")
End Using
$vbLabelText   $csharpLabel

د OCR تفصيلي پایلې

اوسپنه OCR د هرې OCR عملیاتو لپاره د OCR پایلې توکي بیرته راولي. عموما، پراختیا کونکي یوازې د دې څیز متن ملکیت کاروي ترڅو له عکس څخه سکین ترلاسه کړي. په هرصورت، د OCR پایلې DOM د دې په پرتله خورا پرمختللی دی.

using IronOcr;
using System.Drawing; // د اسمبلۍ حواله اضافه کړئ

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;

// Enable reading of barcodes
Ocr.Configuration.ReadBarCodes = true;

using (var Input = new OcrInput(@"images\sample.tiff"))
{
    OcrResult Result = Ocr.Read(Input);
    var Pages = Result.Pages;
    var Words = Pages[0].Words;
    var Barcodes = Result.Barcodes;

    // د پراخه ، تفصيلي API موندلو لپاره دلته سپړنه وکړئ:
    // - پا Pagesې ، بلاکونه ، پارافوفونه ، لاینونه ، ټکي ، چارسونه
    // - د عکس صادرول ، د فونټ همغږي کول ، احصایوي معلومات
}
using IronOcr;
using System.Drawing; // د اسمبلۍ حواله اضافه کړئ

var Ocr = new IronTesseract();
// Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;

// Enable reading of barcodes
Ocr.Configuration.ReadBarCodes = true;

using (var Input = new OcrInput(@"images\sample.tiff"))
{
    OcrResult Result = Ocr.Read(Input);
    var Pages = Result.Pages;
    var Words = Pages[0].Words;
    var Barcodes = Result.Barcodes;

    // د پراخه ، تفصيلي API موندلو لپاره دلته سپړنه وکړئ:
    // - پا Pagesې ، بلاکونه ، پارافوفونه ، لاینونه ، ټکي ، چارسونه
    // - د عکس صادرول ، د فونټ همغږي کول ، احصایوي معلومات
}
Imports IronOcr
Imports System.Drawing ' د اسمبلۍ حواله اضافه کړئ

Private Ocr = New IronTesseract()
' Set language for OCR as Pashto
Ocr.Language = OcrLanguage.Pashto
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm

' Enable reading of barcodes
Ocr.Configuration.ReadBarCodes = True

Using Input = New OcrInput("images\sample.tiff")
	Dim Result As OcrResult = Ocr.Read(Input)
	Dim Pages = Result.Pages
	Dim Words = Pages(0).Words
	Dim Barcodes = Result.Barcodes

	' د پراخه ، تفصيلي API موندلو لپاره دلته سپړنه وکړئ:
	' - پا Pagesې ، بلاکونه ، پارافوفونه ، لاینونه ، ټکي ، چارسونه
	' - د عکس صادرول ، د فونټ همغږي کول ، احصایوي معلومات
End Using
$vbLabelText   $csharpLabel

کړنه

IronOCR د بکس څخه کار کوي د اړتیا وړ فعالیت سره، اړتیا نلري یا په کلکه سره د ننوتلو عکسونه بدل کړئ.

سرعت تیښته ده: IronOCR.2020 + تر 10 چنده پورې ګړندی دی او د تیرو جوړښتونو په پرتله 250 fewer لږ غلطي کوي.

نور زده کړئ

په C#، VB، F #، یا کوم بل نورو .NET ژبه کې د OCR په اړه نور معلومات زده کولو لپاره، مهرباني وکړئ زموږ د ټولنې ښوونې ولولئ، کوم چې د نړۍ اوسني مثالونه وړاندې کوي چې څنګه د اوسپنې OCR کارول کیدی شي او ممکن د غوره توضیح کولو څرنګوالي ته توضیحات وښیې. دا کتابتون.

د .NET پراختیا کونکو لپاره د بشپړ اعتراض حواله هم شتون لري.