C#र .NET मा नेपाली OCR

यस कागजातको अन्य संस्करणहरू:

IronOCR एक C#सफ्टवेयर घटक हो। NET कोडरहरूलाई छवि सहित १२ PDF भाषामा पीडीएफ कागजातहरू पाठ पढ्न मद्दत पुर्‍याउँछ।

यो Tesseract को उन्नत फोर्क हो, विशेष गरी NET विकासकर्ताहरूको लागि निर्मित हो र वेग र सटीकता दुबै अन्य टेस्क्रैट इन्जिनहरूलाई नियमित रूपमा प्रदर्शन गर्दछ।

IronOcr.Languages.Nepali का सामग्रीहरू

यस प्याकेजमा .NET को लागी O 43 OCR भाषाहरू छन्।

  • नेपाली
  • नेपाली बेस्ट
  • नेपाली फास्ट

डाउनलोड गर्नुहोस्

नेपाली भाषा प्याक [नेपाली]
* Download as Zip
* Install with as
https://www.nuget.org/packages/IronOcr.Languages.Nepali/'> नुगेट

स्थापना

हामीले गर्नुपर्ने पहिलो कुरा तपाईको नेपाली नेट OCR प्याकेज तपाईको NET प्रोजेक्टमा स्थापना गर्नु हो।

PM> Install-Package IronOCR.Languages.Nepali

कोड उदाहरण

यो C#कोड उदाहरणले छवि वा PDF कागजातबाट नेपाली पाठ पढ्छ।

//PM> Install-Package IronOcr.Languages.Nepali
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;
using (var Input = new OcrInput(@"images\Nepali.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Nepali
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;
using (var Input = new OcrInput(@"images\Nepali.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Nepali
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Nepali
Using Input = New OcrInput("images\Nepali.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

IronOCR किन छनौट गर्नुहुन्छ?

फलाम ओसीआर एक स्थापना गर्न सजिलो, पूर्ण र राम्रो दस्तावेज। नेट सफ्टवेयर लाइब्रेरी हो।

कुनै बाह्य वेब सेवाहरू प्रयोग नगरी, fees 99..8 % OCR शुद्धता प्राप्त गर्न IronOCR छनौट गर्नुहोस्, चलिरहेको फीस वा इन्टरनेटमा गोप्य कागजातहरू पठाउँदैन।

किन C#विकासकर्ताहरूले भेनिला Tesseract मा IronOCR छनौट गर्छन्:

  • एकल DLL वा न्यूगेटको रूपमा स्थापना गर्नुहोस्
  • Tesseract for, and र Eng ईन्जिनहरूका लागि बक्स बाहिर।
  • शुद्धता .8 99..8% ले नियमित टेस्क्र्याक्टलाई आउटपर्मर्स गर्दछ।
  • ब्लेजि Spe स्पीड र मल्टि थ्रेडि।
  • MVC, वेब अनुप्रयोग, डेस्कटप, कन्सोल र सर्भर अनुप्रयोग संगत
  • काम गर्न Exes वा C ++ कोड छैन
  • पूर्ण PDF OCR समर्थन
  • लगभग कुनै पनि छवि फाइल वा PDF मा OCR प्रदर्शन गर्न
  • पूर्ण। नेट कोर, मानक र फ्रेमवर्क समर्थन
  • विन्डोज, म्याक, लिनक्स, Azure, डकर, Lambda, AWS मा डिप्लोय गर्नुहोस्
  • बारकोड र QR कोडहरू पढ्नुहोस्
  • XCR को रूपमा OCR निर्यात गर्नुहोस्
  • खोजी गर्न योग्य पीडीएफ कागजातहरूमा ओसीआर निर्यात गर्नुहोस्
  • मल्टिथ्रेडि support समर्थन
  • १२6 अन्तर्राष्ट्रिय भाषाहरू सबै न्युगेट वा ओक्रडाटा फाइलहरू मार्फत प्रबन्धित गरियो
  • छविहरू, निर्देशांकहरू, तथ्या .्कहरू र फन्टहरू निकाल्नुहोस्। केवल पाठ मात्र होईन।
  • वाणिज्यिक र स्वामित्व अनुप्रयोगहरू भित्र Tesseract OCR पुनः वितरित गर्न प्रयोग गर्न सकिन्छ।

लौह OCR चम्किन्छ जब वास्तविक विश्व छविहरू र त्रुटिपूर्ण कागजातहरू जस्तै फोटोग्राफहरू, वा कम रिजोलुसनको स्क्यानमा जुन डिजिटल आवाज वा अपूर्णताहरूको साथ काम गर्दछ।

.NET प्लेटफर्मको लागि अन्य नि: शुल्क ओसीआर पुस्तकालयहरू त्यस्ता अन्य। नेट टेसरेक्ट एपीआईहरू र वेब सेवाहरूले यी वास्तविक विश्व प्रयोगको केसहरूमा यति राम्रो प्रदर्शन गर्दैनन्।

Tesseract 5 को साथ OCR - C#मा कोडिंग सुरु गर्नुहोस्

तलको कोड नमूनाले C#वा VB .NET प्रयोग गरेर छविबाट पाठ पढ्न कति सजिलो छ भनेर देखाउँदछ।

OneLiner

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

हेलो वर्ल्ड विन्यास योग्य

// PM> Install-Package IronOCR.Languages.Nepali
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... तपाईं छविहरूको कुनै संख्या थप्न सक्नुहुन्छ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Nepali
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... तपाईं छविहरूको कुनै संख्या थप्न सक्नुहुन्छ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Nepali
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Nepali
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

C#PDF OCR

समान दृष्टिकोण कुनै पनि पीडीएफ कागजातबाट पाठ निकाल्न समान रूपमा प्रयोग गर्न सकिन्छ।

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// हामी विशिष्ट पीडीएफ पृष्ठ नम्बरहरू OCR मा चयन गर्न सक्दछौं

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// १ पृष्ठ पीडीएफ को प्रत्येक पृष्ठ को लागी
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// हामी विशिष्ट पीडीएफ पृष्ठ नम्बरहरू OCR मा चयन गर्न सक्दछौं

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// १ पृष्ठ पीडीएफ को प्रत्येक पृष्ठ को लागी
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Nepali
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' हामी विशिष्ट पीडीएफ पृष्ठ नम्बरहरू OCR मा चयन गर्न सक्दछौं

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' १ पृष्ठ पीडीएफ को प्रत्येक पृष्ठ को लागी
End Using
VB   C#

मल्टीपेज TIFF का लागि OCR

OCR पढाई TIFF फाईल ढाँचा बहु पृष्ठ कागजात सहित। TIFF खोज्न योग्य पाठको साथ सिधा पिडिएफ फाइलमा पनि रूपान्तरण गर्न सकिन्छ।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Nepali

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

बारकोड र QR

आइरन ओसीआरको एक विशिष्ट विशेषता यो हो कि यसले कागजातहरूबाट बारकोडहरू र क्यूआर कोडहरू पढ्न सक्दछ जब यो पाठको लागि स्क्यान हुँदैछ। OcrResult.OcrBarcode कक्षा को उदाहरणहरु हरेक स्क्यान गरिएको बारकोडको बारेमा विस्तृत जानकारी विकासकर्तालाई दिन्छ।

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// प्रकार र स्थान गुणहरू पनि उजागर गरियो
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// प्रकार र स्थान गुणहरू पनि उजागर गरियो
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' प्रकार र स्थान गुणहरू पनि उजागर गरियो
Next Barcode
End Using
VB   C#

छविहरूको विशिष्ट क्षेत्रहरूमा OCR

सबै आइरन ओसीआरको स्क्यानि and र पढ्ने विधिहरूले पृष्ठ वा कुन पृष्ठबाट हामी पाठ पढ्न चाहन्छौं भन्ने ठ्याक्कै निर्दिष्ट गर्ने क्षमता प्रदान गर्दछ। यो धेरै उपयोगी छ जब हामी मानकीकृत फारमहरू हेर्दैछौं र धेरै समय बचत गर्न र दक्षता सुधार गर्न सक्दछौं।

क्रप क्षेत्रहरू प्रयोग गर्न, हामीले प्रणाली सन्दर्भमा प्रणाली सन्दर्भ थप्नु पर्छ। System.Drawing ताकि हामी System.Drawing.Rectangle वस्तु प्रयोग गर्न सक्दछौं।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// आयाम px मा छन्

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// आयाम px मा छन्

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Nepali

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' आयाम px मा छन्

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR कम गुणवत्ता स्क्यानका लागि

फलामका OCR OcrInput वर्ग सामान्य Tesseract पढ्न नसक्ने स्क्यानहरू फिक्स गर्न सक्दछ।

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // डिजिटल ध्वनि र गरीब स्क्यानिंग फिक्स गर्दछ
Input.Deskew(); // रोटेशन र परिप्रेक्ष्य फिक्स गर्दछ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // डिजिटल ध्वनि र गरीब स्क्यानिंग फिक्स गर्दछ
Input.Deskew(); // रोटेशन र परिप्रेक्ष्य फिक्स गर्दछ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Nepali

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' डिजिटल ध्वनि र गरीब स्क्यानिंग फिक्स गर्दछ
Input.Deskew() ' रोटेशन र परिप्रेक्ष्य फिक्स गर्दछ
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR परिणामहरू खोजी योग्य PDF को रूपमा निर्यात गर्नुहोस्

प्रतिलिपि योग्य पाठ स्ट्रि withको साथ PDF मा छवि। खोज इन्जिन र डाटाबेस द्वारा अनुक्रमित गर्न सकिन्छ।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Nepali

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

TIFF खोज्न योग्य PDF रूपान्तरणमा

TIFF कागजात (वा छवि फाईलहरूको कुनै समूह) सिधै खोज्न योग्य पीडीएफमा रूपान्तरण गर्नुहोस् जुन इन्ट्रानेट, वेबसाइट र गुगल खोजी इञ्जिनहरू द्वारा अनुक्रमणिका गर्न सकिन्छ।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Nepali

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

HTML को रूपमा OCR परिणामहरू निर्यात गर्नुहोस्

XCR HTML रूपान्तरणमा OCR छवि।

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Nepali
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

OCR छवि संवर्द्धन फिल्टर

ICROCR ले OCR प्रदर्शन सुधार गर्न OcrInput वस्तुहरूको लागि अनुपम फिल्टरहरू प्रदान गर्दछ।

छवि संवर्धन कोड उदाहरण

OCR इनपुट छविहरू उच्च गुणवत्तामा छिटो OCR परिणामहरू उत्पादन गर्दछ।

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // डिजिटल ध्वनि र गरीब स्क्यानिंग फिक्स गर्दछ
Input.Deskew(); // रोटेशन र परिप्रेक्ष्य फिक्स गर्दछ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // डिजिटल ध्वनि र गरीब स्क्यानिंग फिक्स गर्दछ
Input.Deskew(); // रोटेशन र परिप्रेक्ष्य फिक्स गर्दछ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Nepali

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' डिजिटल ध्वनि र गरीब स्क्यानिंग फिक्स गर्दछ
Input.Deskew() ' रोटेशन र परिप्रेक्ष्य फिक्स गर्दछ
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR छवि फिल्टरहरूको सूची

ICROCR मा निर्मित ओसीआर प्रदर्शन बृद्धि गर्न इनपुट फिल्टरहरूले समावेश गर्दछ:

  • OcrInput.Rotate (डबल डिग्री) - छविहरू घडीको दिशामा डिग्रीको एक नम्बर द्वारा घुमाउँदछ। एन्टी-क्लकवाइजको लागि, नकारात्मक संख्या प्रयोग गर्नुहोस्।
  • OcrInput.Binarize () - यो छवि फिल्टर मध्य पिक्सेलको साथ प्रत्येक पिक्सेल कालो वा सेतो गर्दछ। पृष्ठभूमिमा पाठको एकदम कम कन्ट्रास्टको OCR प्रदर्शन केसहरू सुधार गर्न सक्दछ।
  • OcrInput.ToGrayScale () - यस छवि फिल्टरले प्रत्येक पिक्सेललाई ग्रेस्केलको छायामा परिणत गर्दछ। OCR सटीकता सुधार गर्न असम्भव तर गतिको सुधार हुन सक्छ
  • OcrInput.Contrast () - स्वतः कन्ट्रास्ट बढाउँदछ । यस फिल्टरले अक्सर कम कन्ट्रास्ट स्क्यानहरूमा OCR गति र शुद्धता सुधार गर्दछ।
  • OcrInput.DeNoise () - डिजिटल आवाज हटाउँछ। यो फिल्टर मात्र प्रयोग गर्नुपर्नेछ जहाँ हल्लाको आशा गरिन्छ।
  • OcrInput.Invert () - हरेक र In उल्टाउछ । उदाहरणका लागि सेतो कालो हुन्छ: कालो सेतो हुन्छ।
  • OcrInput.Dilate () - उन्नत मोर्फोलजीडिलेसनले छविमा वस्तुहरूको सीमामा पिक्सलहरू थपेको छ । ईरोडको विपरित
  • OcrInput.Erode () - उन्नत मोर्फोलजीइरोसनले वस्तुको सीमामा पिक्सल हटाउँदछ
  • OcrInput.Deskew () - तस्विर घुमाउँदछ ताकि यो सहि तरीकाले माथि र अर्थोगोनल हो। यो ओसीआरको लागि धेरै उपयोगी छ किनकि स्केन स्क्यानहरूको लागि Tesseract सहिष्णुता degrees डिग्री जति कम हुन सक्छ।
  • OcrInput.DeepCleanBackgroundNoise () - भारी पृष्ठभूमि आवाज हटाउने। केवल यो फिल्टर प्रयोग गर्नुहोस् यदि चरम कागजात पृष्ठभूमि शोर ज्ञात छ, किनकि यस फिल्टरले सफा कागजातहरूको ओसीआर शुद्धतालाई पनि कम गर्ने जोखिममा पार्छ, र धेरै सीपीयू महँगो छ।
  • OcrInput.EnhanceResolution - कम गुणवत्ता छविहरूको रिजोलुसन विस्तार गर्दछ। यस फिल्टर प्राय: आवश्यक पर्दैन किनकि OcrInput.MINimumDPIOcrInput.TargetDPI स्वचालित रूपमा कम रिजोलुसन इनपुटहरू समात्छ र समाधान गर्दछ।

क्लीनब्याकग्राउंडनोईस। यो एक सेटिंग हो जुन केहि समय उपभोक्ता हो; जे होस्, यसले पुस्तकालयलाई स्वचालित रूपमा डिजिटल आवाज, कागज crumples, र एक डिजिटल छवि भित्र अन्य अपूर्णताहरू सफा गर्न अनुमति दिन्छ जुन अन्य OCR लाइब्रेरीहरू पढ्न असक्षमको रूपमा प्रस्तुत गर्दछ।

एन्हान्ससन्ट्रास्ट एक सेटिंग हो जसले आइरन ओसीआरलाई स्वचालित रूपमा छविको पृष्ठभूमि बिरुद्द पाठको विरोधाभास बढाउँदछ, ओसीआरको शुद्धता बढाउँदछ र सामान्यतया प्रदर्शन र ओसीआरको गति बढाउँदछ।

EnhanceResolution एक सेटिंग हो जसले स्वचालित तवरले कम रिजोलुसन छविहरू पत्ता लगाउँदछ (जुन २ d5 dpi अन्तर्गत हुन्छ) र स्वचालित रूपमा छवि अपस्केल गर्दछ र त्यसपछि सबै पाठलाई तीक्ष्ण गर्दछ ताकि यसलाई पूर्ण रूपमा OCR लाइब्रेरी द्वारा पढ्न सकिन्छ। यद्यपि यो अपरेशन आफैंमा समय खपत हुने छ, यसले सामान्यतया छविमा OCR अपरेशनको लागि समग्र समय घटाउँछ।

भाषा आइरन ओसीआरले २२ अन्तर्राष्ट्रिय भाषा प्याकहरू समर्थन गर्दछ, र भाषा सेटिंग्स एक वा अधिक एकाधिक भाषाहरू चयन गर्न ओसीआर अपरेशनको लागि प्रयोग गर्न सकिन्छ।

रणनीति आयरन OCR ले दुई रणनीतिहरू समर्थन गर्दछ। हामी या त कागजातको छिटो र कम सटीक स्क्यानको लागि जान सक्छौं, वा एक उन्नत रणनीति प्रयोग गर्न सक्छौं जसले केही कृत्रिम बुद्धिमत्ता मोडलहरू प्रयोग गर्दछ स्वचालित रूपमा ओसीआर पाठको शुद्धतालाई सुधार गर्नका लागि वाक्यमा एक अर्कामा शब्दहरूको सांख्यिकीय सम्बन्धलाई हेरेर। ।

कलरस्पेस एक सेटिंग हो जहाँ हामी ग्रेस्केल वा रंगमा OCR लाई छनौट गर्न सक्छौं। सामान्यतया, ग्रेस्केल उत्तम विकल्प हो। जे होस्, कहिलेकाँही जब त्यहाँ पाठहरू वा समान रंगको पृष्ठभूमि हुन्छ तर धेरै भिन्न रंग, पूर्ण र color रंग ठाउँले राम्रो परिणाम प्रदान गर्दछ।

WWiteiteTextOnDarkBackgrounds पत्ता लगाउनुहोस्। सामान्यतया, सबै OCR पुस्तकालयहरू सेतो पृष्ठभूमिमा कालो पाठ हेर्न अपेक्षा गर्दछ। यो सेटिले फलामको OCR लाई स्वचालित रूपमा नकारात्मक, वा सेतो पाठको साथ कालो पृष्ठहरू पत्ता लगाउन र यसलाई पढ्न अनुमति दिन्छ।

InputImageType। यस सेटिले विकासकर्तालाई OCR लाइब्रेरी मार्गनिर्देशन गर्न अनुमति दिन्छ कि यो एक पूर्ण कागजात वा स्निपेट हेर्दै छ कि जस्तो स्क्रिनसटको रूपमा।

RotateAndStraight एक उन्नत सेटिंग हो जसले आइरन OCR लाई अद्वितीय क्षमता कागजातहरू पढ्न अनुमति दिन्छ जुन केवल घुमाइएको छैन, तर सम्भव परिप्रेक्ष्यमा जस्तै पाठ कागजातहरूको फोटोग्राफहरू।

रिडबोर्कोड्स एक उपयोगी सुविधा हो जसले आइरन ओसीआरलाई स्वचालित रूपमा पृष्ठमा बारकोडहरू र क्यूआर कोडहरू पढ्न अनुमति दिन्छ किनकि यसले ठूलो अतिरिक्त समयको बोझ थप नगरीकन पाठ पनि पढ्छ।

कलर डिप्थ। यस सेटिले निर्धारित गर्दछ कि पिक्सेल प्रति पिक्सेल कति बिट्स ओसीआर लाइब्रेरीले र aको गहराई निर्धारित गर्न प्रयोग गर्दछ। एक उच्च र depth गहिराईले ओसीआर गुणस्तर बढाउन सक्छ, तर ओसीआर कार्य पूरा हुन आवश्यक समय बृद्धि गर्दछ।

१२6 भाषा प्याक

आइरन ओसीआरले १२6 अन्तर्राष्ट्रिय भाषाहरू भाषा प्याकहरू मार्फत समर्थन गर्दछ जुन DLLs को रूपमा वितरित गरिएको छ, जुन यस वेबसाइटबाट डाउनलोड गर्न सकिन्छ, वा नुजेट प्याकेज प्रबन्धकबाट पनि

भाषाहरूमा जर्मन, फ्रान्सेली, अंग्रेजी, चिनियाँ, जापानीज र अन्य धेरै समावेश छन्। पासपोर्ट एमआरजेड, एमआईसीआर चेकहरू, वित्तीय डेटा, लाइसेन्स प्लेटहरू र अधिक धेरैको लागि विशेषज्ञ भाषा प्याकहरू अवस्थित छन्। तपाईं कुनै पनि परीक्षेपण ".रेन्डडाटा" फाइल पनि प्रयोग गर्न सक्नुहुनेछ - जसमा तपाईंले आफैं सिर्जना गर्नुभयो।

भाषा उदाहरण

अन्य OCR भाषाहरू प्रयोग गर्दै।

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// यदि आवश्यक भएमा छवि फिल्टरहरू थप्नुहोस्
// यस अवस्थामा, सोचे पनि इनपुट धेरै कम गुणवत्ता हो
// आइरनट्रसेक्टले पढ्न सक्दछ जुन परम्परागत टेसेट्र्याक्टले सक्दैन।

var Result = Ocr.Read(input);

// कन्सोलले विन्डोजमा सजीलै अरबी प्रिन्ट गर्न सक्दैन।
// यसको सट्टा डिस्कमा बचत गरौं।
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// यदि आवश्यक भएमा छवि फिल्टरहरू थप्नुहोस्
// यस अवस्थामा, सोचे पनि इनपुट धेरै कम गुणवत्ता हो
// आइरनट्रसेक्टले पढ्न सक्दछ जुन परम्परागत टेसेट्र्याक्टले सक्दैन।

var Result = Ocr.Read(input);

// कन्सोलले विन्डोजमा सजीलै अरबी प्रिन्ट गर्न सक्दैन।
// यसको सट्टा डिस्कमा बचत गरौं।
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' यदि आवश्यक भएमा छवि फिल्टरहरू थप्नुहोस्
' यस अवस्थामा, सोचे पनि इनपुट धेरै कम गुणवत्ता हो
' आइरनट्रसेक्टले पढ्न सक्दछ जुन परम्परागत टेसेट्र्याक्टले सक्दैन।

Dim Result = Ocr.Read(input)

' कन्सोलले विन्डोजमा सजीलै अरबी प्रिन्ट गर्न सक्दैन।
' यसको सट्टा डिस्कमा बचत गरौं।
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

बहु भाषा उदाहरण

यो पनि सम्भव छ OCR एकै समयमा धेरै भाषाहरू प्रयोग गरेर। यसले युनिकोड कागजातहरूमा अंग्रेजी भाषा मेटाडेटा र युआरएलहरू लिन मद्दत गर्दछ।

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Nepali);

// हामी कुनै पनि भाषा थप्न सक्छौं

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Nepali);

// हामी कुनै पनि भाषा थप्न सक्छौं

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Nepali)

' हामी कुनै पनि भाषा थप्न सक्छौं

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

विस्तृत OCR परिणाम वस्तुहरू

फलामको OCR ले प्रत्येक OCR अपरेशनको लागि OCR परिणाम वस्तु फिर्ता गर्दछ। सामान्यतया, विकासकर्ताहरूले छविबाट पाठ स्क्यान गर्न केवल यो वस्तुको पाठ गुण प्रयोग गर्दछन्। जे होस्, OCR नतीजा DOM यो भन्दा धेरै उन्नत छ।

using IronOcr;
using System.Drawing; //असेंबली सन्दर्भ थप्नुहोस्

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //महत्त्वपूर्ण!

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// यहाँ एक विशाल, विस्तृत एपीआई खोज्नको लागि अन्वेषण गर्नुहोस्:
// - पृष्ठहरू, ब्लाकहरू, प्याराफाफहरू, लाइनहरू, शब्दहरू, वर्णहरू
// - छवि निर्यात, फन्ट कोऑर्डिनेट, सांख्यिकीय डाटा
}
using IronOcr;
using System.Drawing; //असेंबली सन्दर्भ थप्नुहोस्

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Nepali;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //महत्त्वपूर्ण!

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// यहाँ एक विशाल, विस्तृत एपीआई खोज्नको लागि अन्वेषण गर्नुहोस्:
// - पृष्ठहरू, ब्लाकहरू, प्याराफाफहरू, लाइनहरू, शब्दहरू, वर्णहरू
// - छवि निर्यात, फन्ट कोऑर्डिनेट, सांख्यिकीय डाटा
}
Imports IronOcr
Imports System.Drawing 'असेंबली सन्दर्भ थप्नुहोस्

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Nepali
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'महत्त्वपूर्ण!

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' यहाँ एक विशाल, विस्तृत एपीआई खोज्नको लागि अन्वेषण गर्नुहोस्:
' - पृष्ठहरू, ब्लाकहरू, प्याराफाफहरू, लाइनहरू, शब्दहरू, वर्णहरू
' - छवि निर्यात, फन्ट कोऑर्डिनेट, सांख्यिकीय डाटा
End Using
VB   C#

प्रदर्शन

IronOCR ले बाकसको बाहिर कार्य गर्दछ कार्य सम्पादन ट्युन गर्न वा भारी इनपुट छविहरू परिमार्जन गर्न आवश्यक पर्दैन।

स्पीड ब्लिजिंग हो: IronOcr.2020 + १० पटकसम्म छिटो छ र अघिल्लो निर्माणहरूले भन्दा २ %०% कम त्रुटिहरू बनाउँदछ।

थप सिक

O # को बारेमा अधिक जान्न C #, VB, F #, वा कुनै अर्को .नेट भाषामा, कृपया हाम्रो समुदाय ट्यूटोरियलहरू पढ्नुहोस् , जसले कसरी आइरन OCR प्रयोग गर्न सकिन्छ र कसरी उत्तम प्रयोग गर्ने भन्ने बारीकता देखाउन सक्छ भन्ने वास्तविक विश्व उदाहरणहरू दिन्छ। यो पुस्तकालय

.NET विकासकर्ताहरूको लागि पूर्ण वस्तु सन्दर्भ पनि उपलब्ध छ।