አማርኛ OCR በ C#እና.NET

ሌሎች የዚህ ሰነድ ስሪቶች

IronOCR .NET ኮደሮች አማርኛን ጨምሮ በ 126 ቋንቋ ከምስሎች እና ከፒዲኤፍ ሰነዶች ላይ ጽሑፍን እንዲያነቡ የሚያስችል የ C#ሶፍትዌር አካል ነው ፡፡

ለ ‹NET ›ገንቢዎች ብቻ የተገነባ እና ከሌሎች የቴሴራክት ሞተሮችን በመደበኛነት በፍጥነት እና በትክክለኝነት የላቀ የ‹ ቴስራክት ›ሹካ ነው ፡፡

የ IronOcr.Languages ይዘት አማርኛ

ይህ ፓኬጅ ለ ‹NET ›46 OCR ቋንቋዎችን ይNል ፡፡

  • አማርኛ
  • አማራነት ምርጥ
  • አማራነት

አውርድ

የአማርኛ ቋንቋ ጥቅል [አማርኛ]
* Download as ዚፕ
* Install with as
https://www.nuget.org/packages/IronOcr.Languages.Amharic/'> ኑጌት

ጭነት

እኛ ማድረግ ያለብን የመጀመሪያ ነገር የእኛን የአማርኛ ኦ.ሲ.አር. ፓኬጅ በእርስዎ .NET ፕሮጀክት ላይ መጫን ነው ፡

PM> Install-Package IronOCR.Languages.Amharic

የኮድ ምሳሌ

ይህ የ C#ኮድ ምሳሌ የአማርኛ ጽሑፍን ከምስል ወይም ከፒዲኤፍ ሰነድ ያነባል ፡፡

//PM> Install-Package IronOcr.Languages.Amharic
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;
using (var Input = new OcrInput(@"images\Amharic.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Amharic
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;
using (var Input = new OcrInput(@"images\Amharic.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Amharic
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Amharic
Using Input = New OcrInput("images\Amharic.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

IronOCR ን ለምን ይመርጣሉ?

ብረት OCR ለመጫን ቀላል ፣ የተሟላ እና በጥሩ ሁኔታ የተረጋገጠ የ NET ሶፍትዌር ቤተ-መጽሐፍት ነው።

ምንም የውጭ የድር አገልግሎቶችን ሳይጠቀሙ ፣ ቀጣይ ክፍያዎችን ወይም ምስጢራዊ ሰነዶችን በኢንተርኔት ሳይልኩ 99.8% + OCR ትክክለኛነትን ለማሳካት

IronOCR ን ይምረጡ።

Ch ገንቢዎች ከቫኒላ Tesseract በላይ IronOCR ን ለምን ይመርጣሉ

  • እንደ ነጠላ DLL ወይም NuGet ይጫኑ
  • ለሳሴራክት 5 ፣ 4 እና 3 ሞተሮችን ከሳጥኑ ውስጥ ያካትታል።
  • ትክክለኝነት 99.8% ከመደበኛ ቴስራክት ጉልህ በሆነ መልኩ ይበልጣል ፡፡
  • የሚነድ ፍጥነት እና ባለብዙ ንባብ
  • MVC ፣ WebApp ፣ ዴስክቶፕ ፣ ኮንሶል & amp; የአገልጋይ መተግበሪያ ተኳሃኝ
  • ከ ጋር ለመስራት ምንም Exes ወይም C ++ ኮድ
  • ሙሉ ፒዲኤፍ OCR ድጋፍ
  • OCR ን ከሞላ ጎደል ማንኛውንም የምስል ፋይል ወይም ፒዲኤፍ ለማከናወንሙሉ። የተጣራ ኮር ፣ መደበኛ እና FrameWork ድጋፍበዊንዶውስ ፣ ማክ ፣ ሊኑክስ ፣ አዙሬ ፣ ዶከር ፣ ላምብዳ ፣ ኤኤስኤስ ላይ ማሰማራት
  • የአሞሌ ኮዶች እና የ QR ኮዶችን ያንብቡ
  • OCR ን ወደ XHTML ይላኩለመፈለግ የፒ.ዲ.ኤፍ. ሰነዶች ኦ.ሲ.አር.ን ይላኩየብዙ ማነበብ ድጋፍ
  • 126 ዓለም አቀፍ ቋንቋዎች ሁሉ በኑጂ ወይም በኦክራዳታ ፋይሎች በኩል ይተዳደራሉ
  • ምስሎችን ፣ መጋጠሚያዎችን ፣ ስታቲስቲክሶችን እና ቅርጸ-ቁምፊዎችን ያውጡ። ጽሑፍ ብቻ አይደለም።
  • በ ‹የንግድ› ውስጥ የ “Tesseract OCR” ን እንደገና ለማሰራጨት ሊያገለግል ይችላል & amp ;; የባለቤትነት ማመልከቻዎች

ከእውነተኛው የዓለም ምስሎች እና እንደ ፎቶግራፎች ካሉ ፍፁም ያልሆኑ ሰነዶች ወይም ዲጂታል ጫጫታ ወይም ጉድለቶች ሊኖሩ ከሚችሉ ዝቅተኛ ጥራት ያላቸው ቅኝቶች ጋር ሲሰራ የብረት ኦ.ሲ.አር. ሌሎች እንደዚህ በደንብ በእነዚህ በእውነተኛው ዓለም አጠቃቀም ጉዳዮች ላይ።

OCR ከሴሴክራክት 5 ጋር - በ C & num; Code ውስጥ ኮድ መስጠት ይጀምሩ

ከዚህ በታች ያለው የኮድ ናሙና C#ወይም VB .NET ን በመጠቀም ከምስል ጽሑፍ ለማንበብ ምን ያህል ቀላል እንደሆነ ያሳያል ፡፡

OneLiner

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

ሊዋቀር የሚችል ሰላም ዓለም

// PM> Install-Package IronOCR.Languages.Amharic
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... ማንኛውንም የምስሎች ብዛት ማከል ይችላሉ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Amharic
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... ማንኛውንም የምስሎች ብዛት ማከል ይችላሉ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Amharic
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Amharic
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

ሐ # ፒዲኤፍ OCR

ተመሳሳይ አቀራረብ በተመሳሳይ መንገድ ከማንኛውም የፒዲኤፍ ሰነድ ጽሑፍ ለማውጣት ሊያገለግል ይችላል።

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// እንዲሁም የተወሰኑ የፒ.ዲ.ኤፍ. ገጽ ቁጥሮችን ወደ OCR መምረጥ እንችላለን

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// ለእያንዳንዱ ገጽ የፒ.ዲ.ኤፍ. ገጽ 1 ገጽ
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// እንዲሁም የተወሰኑ የፒ.ዲ.ኤፍ. ገጽ ቁጥሮችን ወደ OCR መምረጥ እንችላለን

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// ለእያንዳንዱ ገጽ የፒ.ዲ.ኤፍ. ገጽ 1 ገጽ
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Amharic
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' እንዲሁም የተወሰኑ የፒ.ዲ.ኤፍ. ገጽ ቁጥሮችን ወደ OCR መምረጥ እንችላለን

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' ለእያንዳንዱ ገጽ የፒ.ዲ.ኤፍ. ገጽ 1 ገጽ
End Using
VB   C#

OCR ለ ‹MultiPage TIFFs›

ብዙ ገጽ ሰነዶችን ጨምሮ የ OCR ንባብ TIFF ፋይል ቅርጸት። እንዲሁም TIFF ከሚፈለግ ጽሑፍ ጋር በቀጥታ ወደ ፒዲኤፍ ፋይል ሊቀየር ይችላል።

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;

using (var Input = new OcrInput()){
    input.AddMultiFrameTiff("multi - frame.tiff");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;

using (var Input = new OcrInput()){
    input.AddMultiFrameTiff("multi - frame.tiff");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Amharic

Using Input = New OcrInput()
	input.AddMultiFrameTiff("multi - frame.tiff")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

ባርኮዶች እና QR

የብረት OCR ልዩ ገጽታ ጽሑፍን በሚቃኝበት ጊዜ የአሞሌ ኮዶች እና የ QR ኮዶችን ከሰነዶች ማንበብ ይችላል ፡፡ የ ‹ኮድ› OcrResult.OcrBarcode ክፍሎች ለያንዳንዱ ገንቢ ስካን ኮድ ኮድ ለገንቢው ዝርዝር መረጃ ይሰጣሉ ፡፡

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
    input.AddImage("img/Barcode.png");
    var Result = Ocr.Read(input);
    foreach (var Barcode in Result.Barcodes)
    {
    Console.WriteLine(Barcode.Value);
    // የአይነት እና የአካባቢ ባህሪዎች እንዲሁ ተጋለጡ
    }
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
    input.AddImage("img/Barcode.png");
    var Result = Ocr.Read(input);
    foreach (var Barcode in Result.Barcodes)
    {
    Console.WriteLine(Barcode.Value);
    // የአይነት እና የአካባቢ ባህሪዎች እንዲሁ ተጋለጡ
    }
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
	input.AddImage("img/Barcode.png")
	Dim Result = Ocr.Read(input)
	For Each Barcode In Result.Barcodes
	Console.WriteLine(Barcode.Value)
	' የአይነት እና የአካባቢ ባህሪዎች እንዲሁ ተጋለጡ
	Next Barcode
End Using
VB   C#

በተወሰኑ ምስሎች ምስሎች ላይ OCR

ሁሉም የብረት OCR ን የመቃኘት እና የማንበብ ዘዴዎች ጽሑፍን ለማንበብ እንደፈለግን የትኛውን ገጽ ወይም ገጾች በትክክል ለማንበብ ችሎታን ይሰጣሉ። ደረጃቸውን የጠበቁ ቅጾችን ስንመለከት ይህ በጣም ጠቃሚ ነው እናም በጣም ብዙ ጊዜን ለመቆጠብ እና ውጤታማነትን ለማሻሻል ይችላል።

የሰብል ክልሎችን ለመጠቀም የ ‹ኮድ› ስርዓት.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280,
Width = 1335 };
// ልኬቶች በፒክሰል ውስጥ ናቸው

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280,
Width = 1335 };
// ልኬቶች በፒክሰል ውስጥ ናቸው

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Amharic

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' ልኬቶች በፒክሰል ውስጥ ናቸው

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR ለዝቅተኛ ጥራት ቅኝቶች

የብረት OCR OcrInput ክፍል መደበኛ ቴሴራክት ሊያነበው የማይችላቸውን ቅኝቶች ማስተካከል ይችላል።

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // የዲጂታል ጫጫታ እና ደካማ ቅኝት ያስተካክላል
Input.Deskew(); // መሽከርከርን እና አመለካከትን ያስተካክላል
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // የዲጂታል ጫጫታ እና ደካማ ቅኝት ያስተካክላል
Input.Deskew(); // መሽከርከርን እና አመለካከትን ያስተካክላል
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Amharic

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' የዲጂታል ጫጫታ እና ደካማ ቅኝት ያስተካክላል
Input.Deskew() ' መሽከርከርን እና አመለካከትን ያስተካክላል
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

እንደ ፍለጋ ፒዲኤፍ የ OCR ውጤቶችን ይላኩ

ከሚታተሙ የጽሑፍ ሕብረቁምፊዎች ጋር ወደ ፒዲኤፍ ምስል። በፍለጋ ሞተሮች እና በመረጃ ቋቶች መረጃ ጠቋሚ ማድረግ ይቻላል።

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Amharic

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

ሊፈለግ ወደ ፒዲኤፍ ልወጣ TIFF

በኢንተርኔት ፣ በድር ጣቢያ እና በ google የፍለጋ ሞተሮች ሊመዘገብ በሚችል ሊፈለግ ወደሚችል ፒዲኤፍ በቀጥታ የ TIFF ሰነድ (ወይም ማንኛውንም የምስል ፋይሎች ቡድን) አይመልሱ ፡፡

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Amharic

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

የኦ.ሲ.አር.ሲ ውጤቶችን እንደ ኤችቲኤምኤል ይላኩ

OCR ምስል ወደ XHTML ልወጣ።

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Amharic
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

የ OCR ምስል ማሻሻያ ማጣሪያዎች

የኦ.ሲ.አር.ሲ አፈፃፀም ለማሻሻል OcrInputOcrInput ዕቃዎች ልዩ ማጣሪያዎችን ይሰጣል ፡

የምስል ማሻሻያ ኮድ ምሳሌ

የተሻሉ እና ፈጣን የኦ.ሲ.አር. ውጤቶችን ለማምረት የ OCR ግቤት ምስሎችን ከፍ ያለ ጥራት እንዲኖራቸው ያደርጋል ፡፡

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // የዲጂታል ጫጫታ እና ደካማ ቅኝት ያስተካክላል
Input.Deskew(); // መሽከርከርን እና አመለካከትን ያስተካክላል
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // የዲጂታል ጫጫታ እና ደካማ ቅኝት ያስተካክላል
Input.Deskew(); // መሽከርከርን እና አመለካከትን ያስተካክላል
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Amharic

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' የዲጂታል ጫጫታ እና ደካማ ቅኝት ያስተካክላል
Input.Deskew() ' መሽከርከርን እና አመለካከትን ያስተካክላል
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

የ OCR ምስል ማጣሪያዎች ዝርዝር

በ IronOCR ውስጥ የተገነቡትን የ OCR አፈፃፀም ለማሳደግ የግብዓት ማጣሪያዎች የሚከተሉትን ያካትታሉ

  • OcrInput.Rotate (ድርብ ዲግሪዎች) - ምስሎችን በሰዓት አቅጣጫ በበርካታ ዲግሪዎች ያሽከረክራል ። ለፀረ-ሰዓት አቅጣጫ ፣ አሉታዊ ቁጥሮችን ይጠቀሙ።
  • OcrInput.Binarize () - ይህ የምስል ማጣሪያ እያንዳንዱን ፒክሰል ጥቁር ወይም ነጭን ያለ መካከለኛ መሬት ይለውጣል ፡ ከጽሑፍ እና ከበስተጀርባ በጣም ዝቅተኛ የንፅፅር OCR አፈፃፀም ጉዳዮችን ሊያሻሽል ይችላል ፡፡
  • OcrInput.ToGrayScale () - ይህ የምስል ማጣሪያ እያንዳንዱን ፒክሰል ወደ ግራጫማ ጥላ ይቀይረዋል ። የ OCR ትክክለኝነትን ለማሻሻል የማይመስል ነገር ግን ፍጥነትን ሊያሻሽል ይችላል
  • OcrInput.Contrast () - ንፅፅርን በራስ-ሰር ይጨምራል። ይህ ማጣሪያ ብዙውን ጊዜ በዝቅተኛ ንፅፅር ቅኝቶች ውስጥ የ OCR ፍጥነት እና ትክክለኝነትን ያሻሽላል።
  • OcrInput.DeNoise () - ዲጂታል ጫጫታ ያስወግዳል። ይህ ማጣሪያ ጫጫታ በሚጠበቅበት ቦታ ብቻ ጥቅም ላይ መዋል አለበት ፡፡
  • OcrInput.Invert () - እያንዳንዱን ቀለም ይገለብጣል ፡ Eg White ጥቁር ይሆናል ጥቁር ነጭ ይሆናል ፡፡
  • OcrInput.Dilate () - የላቀ ሥነ- መለኮትመፍረስ በምስል ውስጥ ባሉ ነገሮች ድንበር ላይ ፒክስሎችን ይጨምራል ፡ የኢሮድ ተቃራኒ
  • OcrInput.Erode () - የላቀ ሥነ- መለኮትመሸርሸር በእቃ ድንበሮች ላይ ፒክሴሎችን ያስወግዳል የዲላቴ ተቃራኒ
  • OcrInput.Deskew () - ምስልን ያሽከረክራል ስለሆነም ትክክለኛው መንገድ ወደ ላይ እና orthogonal ነው። ይህ ለ “OCR” በጣም ጠቃሚ ነው ፣ ምክንያቱም ለተሰነጣጠሉ ቅኝቶች Tesseract መቻቻል እስከ 5 ዲግሪዎች ዝቅተኛ ሊሆን ይችላል።
  • OcrInput.DeepCleanBackgroundNoise () - ከባድ የጀርባ ጫጫታ ማስወገድ። እጅግ በጣም የሰነድ ዳራ ጫጫታ ቢታወቅ ይህንን ማጣሪያ ብቻ ይጠቀሙ ፣ ምክንያቱም ይህ ማጣሪያ የ OCR ንፁህ ሰነዶችን ትክክለኛነት የመቀነስ አደጋም አለው ፣ እና በጣም ሲፒዩ ውድ ነው።
  • OcrInput.EnhanceRololution - አነስተኛ ጥራት ያላቸውን ምስሎች ጥራት ያሻሽላል ፡ ይህ ማጣሪያ ብዙውን ጊዜ አያስፈልገውም ምክንያቱም OcrInput.MinimumDPI እና OcrInput.TargetDPI ዝቅተኛ ጥራት ያላቸው ግብዓቶችን በራስ-ሰር ይይዝና ይፈታል

CleanBackgroundNoise. ይህ በተወሰነ ጊዜ የሚወስድ ቅንብር ነው; ሆኖም ቤተ-መፃህፍት በዲጂታል ምስል ውስጥ የዲጂታል ጫጫታ ፣ የወረቀት ብስባሽ እና ሌሎች ጉድለቶችን በራስ-ሰር እንዲያጸዱ ያስችላቸዋል ፣ ይህም በሌሎች የኦ.ሲ.አር.-ቤተ-መጽሐፍት የማንበብ አቅም የለውም ፡፡

EnhanceContrast ብረት OCR በራስ-ሰር ከምስል ጀርባ ጋር የፅሁፍ ንፅፅርን እንዲጨምር የሚያደርግ ፣ የኦ.ሲ.አር.ን ትክክለኛነት በመጨመር እና በአጠቃላይ አፈፃፀምን እና የኦ.ሲ.አር.

EnhanceResolution በዝቅተኛ ጥራት ያላቸውን ምስሎች (ከ 275 ዲፒአይ በታች የሆኑ) በራስ-ሰር ፈልጎ የሚያገኝ እና ምስሉን በራስ-ሰር ከፍ የሚያደርግ እና ከዚያም በኦ.ሲ.አር. ቤተመፃህፍት በትክክል ሊነበብ የሚችል ጽሑፍን ሁሉ አፅንዖት ይሰጣል ፡ ምንም እንኳን ይህ ክዋኔ በራሱ ጊዜ የሚወስድ ቢሆንም ፣ በአጠቃላይ በምስል ላይ ለ “OCR” ሥራ አጠቃላይ ጊዜን ይቀንሰዋል ፡፡

የቋንቋ ብረት ኦ.ሲ.አር. 22 ዓለም አቀፍ የቋንቋ ጥቅሎችን ይደግፋል ፣ እና የቋንቋ ቅንብር ለኦ.ሲ.አር. ኦፕሬሽን የሚተገበሩ አንድ ወይም ከዚያ በላይ ቋንቋዎችን ለመምረጥ ሊያገለግል ይችላል ፡

ስትራቴጂ ብረት ብረት ኦ.ሲ.አር. ሁለት ስልቶችን ይደግፋል ፡ እኛ ለፈጣን እና ለትክክለኛው የሰነድ ፍተሻ ለመሄድ መምረጥ ወይም የቃላት አኃዛዊ ግንኙነቶችን በአረፍተ-ነገር በመመልከት በራስ-ሰር የኦ.ሲ.አር. ጽሑፍን ትክክለኛነት ለማሻሻል አንዳንድ ሰው ሰራሽ የማሰብ ችሎታ ሞዴሎችን የሚጠቀም የላቀ ስትራቴጂን ልንጠቀም እንችላለን ፡፡ .

ColorSpace በግራጫ ወይም በቀለም ወደ OCR መምረጥ የምንችልበት ቅንብር ነው ፡ በአጠቃላይ ፣ ግራጫው ምርጥ አማራጭ ነው ፡፡ ሆኖም ፣ አንዳንድ ጊዜ ተመሳሳይ ቀለም ያላቸው ግን በጣም የተለያየ ቀለም ያላቸው ጽሑፎች ወይም ዳራዎች ሲኖሩ ባለሙሉ ቀለም ቀለም ቦታ የተሻለ ውጤት ያስገኛል ፡፡

WhiteTextOnDarkBackgrounds ን ይፈልጉ። በአጠቃላይ ሁሉም የ OCR ቤተመፃህፍት በነጭ ዳራዎች ላይ ጥቁር ጽሑፍን ለማየት ይጠብቃሉ ፡፡ ይህ ቅንብር የብረት ኦ.ሲ.አር. (ኦ.ሲ.አር.) አሉታዊ ነገሮችን በራስ-ሰር ወይም በነጭ ጽሑፍ ጨለማ ገጾችን ፈልጎ እንዲያነብ ያስችላቸዋል ፡፡

የግብዓት ምስል ዓይነት. ይህ ቅንብር ገንቢው የ OCR ቤተ መፃህፍትን እንደ ሙሉ ቅጽበታዊ ገጽ እይታ ሙሉ ሰነድን ወይም ቅንጥቦችን እየተመለከተ ስለመሆኑ እንዲመራው ያስችለዋል።

RotateAndStraighten ብረት OCR የሚሽከረከሩ ብቻ ሳይሆን ምናልባትም እንደ የጽሑፍ ሰነዶች ፎቶግራፎች ያሉ አመለካከቶችን የያዙ ሰነዶችን የማንበብ ልዩ ችሎታን የሚፈቅድ የላቀ ቅንብር ነው ፡

አንብብ ባርኮዶች ትልቅ ተጨማሪ የጊዜ ጭነት ሳይጨምሩ ብረት ኦ.ሲ.አር. (OCR) እንዲሁ ጽሑፍን በሚያነብበት ጊዜ የአሞሌ ኮዶች እና የ QR ኮዶችን በራስ-ሰር እንዲያነብ የሚያስችል ጠቃሚ ባህሪ ነው ፡

ColorDepth ይህ ቅንብር የአንድ ቀለም ጥልቀት ለማወቅ የ OCR ቤተመፃህፍት በፒክሰል ምን ያህል ቢት እንደሚጠቀሙ ይወስናል ፡፡ ከፍ ያለ የቀለም ጥልቀት የ OCR ጥራትን ሊጨምር ይችላል ፣ ግን ለ OCR ሥራው ለማጠናቀቅ የሚያስፈልገውን ጊዜም ይጨምራል።

126 የቋንቋ ጥቅሎች

ብረት ኦ.ሲ.አር. (አር.ሲ.አር.) 126 ዓለም አቀፍ ቋንቋዎችን እንደ DLLs በተሰራጩ የቋንቋ ጥቅሎች በኩል ይደግፋል ፣ ከዚህ ድር ጣቢያ ማውረድ ይችላል ፣ እንዲሁም ከ NuGet ጥቅል ሥራ አስኪያጅ

ቋንቋዎች ጀርመንኛ ፣ ፈረንሳይኛ ፣ እንግሊዝኛ ፣ ቻይንኛ ፣ ጃፓኖች እና ሌሎችንም ያካትታሉ ፡፡ የልዩ ባለሙያ ቋንቋ ጥቅሎች ለፓስፖርት MRZ ፣ ለ MICR ቼኮች ፣ ለፋይናንስ መረጃዎች ፣ ለፈቃድ ሰሌዳዎች እና ለሌሎችም ብዙ ናቸው ፡፡ እንዲሁም ማንኛውንም “tesseract” .traineddata ”ፋይልን መጠቀም ይችላሉ - እርስዎ እራስዎ የሚፈጥሯቸውን ጨምሮ።

የቋንቋ ምሳሌ

ሌሎች የኦ.ሲ.አር.ር. ቋንቋዎችን በመጠቀም ፡፡

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// ካስፈለገ የምስል ማጣሪያዎችን ያክሉ
// በዚህ ሁኔታ ፣ የአስተሳሰብ ግብዓት እንኳን በጣም ዝቅተኛ ጥራት ያለው ነው
// IronTesseract ተለምዷዊ ቴሴራክ የማይችለውን ማንበብ ይችላል ፡፡

var Result = Ocr.Read(input);

// ኮንሶል አረብኛን በዊንዶውስ በቀላሉ ማተም አይችልም።
// በምትኩ ወደ ዲስክ እንቆጠብ ፡፡
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// ካስፈለገ የምስል ማጣሪያዎችን ያክሉ
// በዚህ ሁኔታ ፣ የአስተሳሰብ ግብዓት እንኳን በጣም ዝቅተኛ ጥራት ያለው ነው
// IronTesseract ተለምዷዊ ቴሴራክ የማይችለውን ማንበብ ይችላል ፡፡

var Result = Ocr.Read(input);

// ኮንሶል አረብኛን በዊንዶውስ በቀላሉ ማተም አይችልም።
// በምትኩ ወደ ዲስክ እንቆጠብ ፡፡
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' ካስፈለገ የምስል ማጣሪያዎችን ያክሉ
' በዚህ ሁኔታ ፣ የአስተሳሰብ ግብዓት እንኳን በጣም ዝቅተኛ ጥራት ያለው ነው
' IronTesseract ተለምዷዊ ቴሴራክ የማይችለውን ማንበብ ይችላል ፡፡

Dim Result = Ocr.Read(input)

' ኮንሶል አረብኛን በዊንዶውስ በቀላሉ ማተም አይችልም።
' በምትኩ ወደ ዲስክ እንቆጠብ ፡፡
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

የብዙ ቋንቋ ምሳሌ

በተመሳሳይ ጊዜ በርካታ ቋንቋዎችን በመጠቀም ለ OCR እንዲሁ ይቻላል ፡፡ ይህ በእውነቱ የእንግሊዝኛ ቋንቋ ዲበ ውሂብ እና ዩ.አር.ኤል በዩኒኮድ ሰነዶች ውስጥ ለማግኘት ይረዳል ፡፡

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Amharic);

// ማንኛውንም ቋንቋዎች ማከል እንችላለን

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Amharic);

// ማንኛውንም ቋንቋዎች ማከል እንችላለን

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Amharic)

' ማንኛውንም ቋንቋዎች ማከል እንችላለን

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

ዝርዝር ዝርዝር የ “OCR” ውጤቶች ነገሮች

ብረት OCR ለእያንዳንዱ የኦ.ሲ.አር.ኦ.ኦ.ኦ.ኦ.ኦ.ሲ. ውጤት ውጤትን ይመልሳል ፡፡ በአጠቃላይ ገንቢዎች ጽሑፉን ከምስሉ እንዲቃኝ ለማድረግ የዚህን ነገር የጽሑፍ ንብረት ብቻ ይጠቀማሉ ፡፡ ሆኖም ፣ የ OCR ውጤቶች DOM ከዚህ እጅግ የላቀ ነው።

using IronOcr;
using System.Drawing; //የጉባ Assembly ማጣቀሻ ያክሉ

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //አስፈላጊ

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// ግዙፍ ፣ ዝርዝር ኤ.ፒ.አይ. ለማግኘት እዚህ ያስሱ
// - ገጾች ፣ ብሎኮች ፣ ፓራፋፎች ፣ መስመሮች ፣ ቃላት ፣ ቻርስ
// - የምስል ወደ ውጭ መላክ ፣ ቅርጸ-ቁምፊዎች መጋጠሚያዎች ፣ ስታቲስቲካዊ መረጃዎች
}
using IronOcr;
using System.Drawing; //የጉባ Assembly ማጣቀሻ ያክሉ

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Amharic;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //አስፈላጊ

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// ግዙፍ ፣ ዝርዝር ኤ.ፒ.አይ. ለማግኘት እዚህ ያስሱ
// - ገጾች ፣ ብሎኮች ፣ ፓራፋፎች ፣ መስመሮች ፣ ቃላት ፣ ቻርስ
// - የምስል ወደ ውጭ መላክ ፣ ቅርጸ-ቁምፊዎች መጋጠሚያዎች ፣ ስታቲስቲካዊ መረጃዎች
}
Imports IronOcr
Imports System.Drawing 'የጉባ Assembly ማጣቀሻ ያክሉ

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Amharic
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'አስፈላጊ

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' ግዙፍ ፣ ዝርዝር ኤ.ፒ.አይ. ለማግኘት እዚህ ያስሱ
' - ገጾች ፣ ብሎኮች ፣ ፓራፋፎች ፣ መስመሮች ፣ ቃላት ፣ ቻርስ
' - የምስል ወደ ውጭ መላክ ፣ ቅርጸ-ቁምፊዎች መጋጠሚያዎች ፣ ስታቲስቲካዊ መረጃዎች
End Using
VB   C#

አፈፃፀም

IronpR ከብረት ሳጥኑ ውጭ ይሠራል ፣ የግቤት ምስሎችን ማሻሻል ወይም በከፍተኛ ሁኔታ ማሻሻል አያስፈልገውም።

ፍጥነት እያበራ ነው IronOcr.2020 + እስከ 10 እጥፍ ፈጣን ሲሆን ከቀደሙት ግንባታዎች በበለጠ ከ 250% ያነሱ ስህተቶችን ያደርጋል።

የበለጠ ለመረዳት

በ C#፣ VB ፣ F # ወይም በሌላ በማንኛውም. NET ቋንቋ ስለ OCR የበለጠ ለማወቅ እባክዎ የማህበረሰብ መመሪያዎቻችንን ያንብቡ ፣ ይህም ብረት ኦ.ሲ.አር. እንዴት ጥቅም ላይ እንደሚውል የእውነተኛውን ዓለም ምሳሌዎችን የሚሰጥ እና ከዚህ ቤተ-መጽሐፍት ምርጡን እንዴት ማግኘት እንደሚቻል ልዩነቶችን ያሳያል ፡፡

ሙሉ ለ. NET ገንቢዎች የነገር ማጣቀሻ እንዲሁ ይገኛል።