C# සහ .NET හි සිංහල OCR

මෙම ලේඛනයේ වෙනත් සංස්කරණ:

අයන්ඕසීආර් යනු C# මෘදුකාංග සංරචකයකි .NET කෝඩර්වරුන්ට සිංහල ඇතුළු භාෂා 126 කින් රූප සහ පී.ඩී.එෆ්.

එය .NET සංවර්ධකයින් සඳහාම තනන ලද ටෙසෙරැක්ට් හි දෙබලක වන අතර වේගය සහ නිරවද්‍යතාවය යන දෙකටම නිතිපතා අනෙකුත් ටෙසරැක්ට් එන්ජින් අභිබවා යයි.

IronOcr.Languages.Sinhala හි අන්තර්ගතය

මෙම පැකේජයේ .NET සඳහා OCR භාෂා 114 ක් අඩංගු වේ:

  • සිංහල
  • සිංහලබෙස්ට්
  • සිංහල ෆාස්ට්
  • සිංහල ඇල්ෆබෙට්
  • සිංහල ඇල්ෆබෙට්බෙස්ට්
  • සිංහල ඇල්ෆබෙට් ෆාස්ට්

බාගත

සිංහල භාෂා ඇසුරුම Download as සිප් ⬇ | Install with NuGet: IronOcr.Languages.Sinhala

ස්ථාපනය

අප විසින් කළ යුතු පළමු දෙය නම් අපගේ සිංහල OCR පැකේජය ඔබේ .NET ව්‍යාපෘතියට ස්ථාපනය කිරීමයි.

Install-Package IronOCR.Languages.Sinhala

කේත උදාහරණය

මෙම C# කේත උදාහරණය රූප හෝ PDF ලේඛනයකින් සිංහල පෙළ කියවයි.

// PM> Install-Package IronOcr.Languages.Sinhala
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput(@"images\Sinhala.png"))
{
    var Result = Ocr.Read(Input);
    var AllText = Result.Text;
}
// PM> Install-Package IronOcr.Languages.Sinhala
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput(@"images\Sinhala.png"))
{
    var Result = Ocr.Read(Input);
    var AllText = Result.Text;
}
' PM> Install-Package IronOcr.Languages.Sinhala
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala

Using Input = New OcrInput("images\Sinhala.png")
	Dim Result = Ocr.Read(Input)
	Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel

IronOCR තෝරා ගන්නේ ඇයි?

යකඩ OCR යනු පහසුවෙන් ස්ථාපනය කළ හැකි, සම්පූර්ණ හා හොඳින් ලේඛනගත කළ .NET මෘදුකාංග පුස්තකාලයකි.

කිසිදු බාහිර වෙබ් සේවා, අඛණ්ඩ ගාස්තු හෝ අන්තර්ජාලය හරහා රහස්‍ය ලේඛන යැවීමකින් තොරව 99.8% + OCR නිරවද්‍යතාවය ලබා ගැනීමට යකඩ OCR තෝරන්න.

සී # සංවර්ධකයින් වැනිලා ටෙසරැක්ට වඩා යකඩ OCR තෝරා ගන්නේ ඇයි:

  • තනි DLL හෝ NuGet ලෙස ස්ථාපනය කරන්න
  • කොටුවෙන් පිටත ටෙසෙරැක්ට් 5, 4 සහ 3 එන්ජින් සඳහා ඇතුළත් වේ.
  • නිරවද්‍යතාවය 99.8% සාමාන්‍ය ටෙසරැක්ට වඩා සැලකිය යුතු ලෙස ඉක්මවා යයි.
  • දැවෙන වේගය සහ බහු ත්‍රෙඩ් කිරීම
  • MVC, WebApp, ඩෙස්ක්ටොප්, කොන්සෝලය සහ සේවාදායක යෙදුම අනුකූල වේ
  • වැඩ කිරීමට C++ හෝ unmanaged කේත සැපයීමේ අවශ්‍යතාවය නෑ
  • සම්පූර්ණ PDF OCR සහාය
  • OCR ඕනෑම රූප ගොනුවක් හෝ PDF එකක් පාහේ සිදු කිරීම
  • .NET Core, Standard සහ Framework සහාය
  • වින්ඩෝස්, මැක්, ලිනක්ස්, අසුර්, ඩෝකර්, AWS, එසේම Lambda පරිසරයන් මත යෙදවීම
  • තීරු කේත සහ QR කේත කියවන්න
  • XHTML ලෙස OCR අපනයනය කරන්න
  • සෙවිය හැකි PDF ලේඛන වෙත OCR අපනයනය කරන්න
  • බහු තෙරපුම් සහාය
  • ජාත්යන්තර භාෂා 126 ක් කළමනාකරණය කරන්නේ NuGet හෝ OCR data ෆයිල් මඟින් ය.
  • සංඛ්‍යාන හා අකුරු ඛණ්ඩාංක, සංඛ්‍යාන සහ අකුරු උපුටා ගන්න.
  • වාණිජ හා හිමිකාර යෙදුම් තුළ ටෙසරැක්ට් OCR නැවත බෙදා හැරීම සඳහා භාවිතා කළ හැකිය.

සැබෑ ලෝක රූප හා ඡායාරූප වැනි අසම්පූර්ණ ලේඛන හෝ ඩිජිටල් ශබ්දය හෝ අඩුපාඩු ඇති අඩු විභේදන ස්කෑන් සමඟ වැඩ කිරීමේදී යකඩ OCR බබළයි. .NET වේදිකාව සඳහා වන වෙනත් නොමිලේ OCR පුස්තකාල වැනි වෙනත් .net ටෙසරැක්ට් ඒපීඅයි සහ වෙබ් සේවා මෙම සැබෑ ලෝක භාවිත අවස්ථා වලදී එතරම් හොඳින් ක්‍රියා නොකරයි.

ටෙසරැක්ට් 5 සමඟ OCR - C#හි කේතීකරණය ආරම්භ කරන්න

පහත කේත නියැදියෙන් පෙන්වන්නේ C#හෝ VB .NET භාවිතයෙන් රූපයකින් සමගාමීව පෙළ කියවීම කොතරම් පහසුද යන්නයි.

OneLiner

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
$vbLabelText   $csharpLabel

වින්‍යාසගත හෙලෝ වර්ල්ඩ්

// PM> Install-Package IronOcr.Languages.Sinhala
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput())
{
    Input.AddImage("images/sample.jpeg");
    //... ඔබට ඕනෑම පින්තූර ගණනක් එක් කළ හැකිය
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOcr.Languages.Sinhala
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput())
{
    Input.AddImage("images/sample.jpeg");
    //... ඔබට ඕනෑම පින්තූර ගණනක් එක් කළ හැකිය
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOcr.Languages.Sinhala
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala

Using Input = New OcrInput()
	Input.AddImage("images/sample.jpeg")
	'... ඔබට ඕනෑම පින්තූර ගණනක් එක් කළ හැකිය
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

C# PDF OCR

ඔබට ඕනෑම PDF ලේඛනයකින් පෙළ උගහන්න:

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var input = new OcrInput())
{
    input.AddPdf("example.pdf", "password");
    // අපට OCR වෙත නිශ්චිත PDF පිටු අංක තෝරා ගත හැකිය

    var Result = Ocr.Read(input);

    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages");
    // PDF හි සෑම පිටුවක් සඳහාම 1 පිටුව
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var input = new OcrInput())
{
    input.AddPdf("example.pdf", "password");
    // අපට OCR වෙත නිශ්චිත PDF පිටු අංක තෝරා ගත හැකිය

    var Result = Ocr.Read(input);

    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages");
    // PDF හි සෑම පිටුවක් සඳහාම 1 පිටුව
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala

Using input = New OcrInput()
	input.AddPdf("example.pdf", "password")
	' අපට OCR වෙත නිශ්චිත PDF පිටු අංක තෝරා ගත හැකිය

	Dim Result = Ocr.Read(input)

	Console.WriteLine(Result.Text)
	Console.WriteLine($"{Result.Pages.Count()} Pages")
	' PDF හි සෑම පිටුවක් සඳහාම 1 පිටුව
End Using
$vbLabelText   $csharpLabel

බහු පිටු TIFF සඳහා OCR

TIFF ගොනු ආකෘතියෙහි බහු පිටු ලේඛන කියවීම සහ PDF ගොනුවකට පරිවර්තනය:

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("multi-frame.tiff");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("multi-frame.tiff");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala

Using Input = New OcrInput()
	Input.AddMultiFrameTiff("multi-frame.tiff")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

තීරු කේත සහ QR

යාකඩ OCR හි සුවිශේෂී ලක්ෂණය වන්නේ එය පෙළ සඳහා පරිලෝකනය කරන අතරතුර ලේඛන වලින් තීරු කේත සහ QR කේත කියවිය හැකි වීමයි. OcrResult.OcrBarcode පන්තියේ අවස්ථා සංවර්ධකයාට පරිලෝකනය කරන ලද සෑම තීරු කේතයක් ගැනම සවිස්තරාත්මක තොරතුරු ලබා දෙයි.

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
    input.AddImage("img/Barcode.png");
    var Result = Ocr.Read(input);
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // වර්ගය සහ ස්ථාන ගුණාංග ද නිරාවරණය වේ
    }
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
    input.AddImage("img/Barcode.png");
    var Result = Ocr.Read(input);
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // වර්ගය සහ ස්ථාන ගුණාංග ද නිරාවරණය වේ
    }
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
	input.AddImage("img/Barcode.png")
	Dim Result = Ocr.Read(input)
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
		' වර්ගය සහ ස්ථාන ගුණාංග ද නිරාවරණය වේ
	Next Barcode
End Using
$vbLabelText   $csharpLabel

රූපවල නිශ්චිත ප්‍රදේශ පිළිබඳ OCR

කියවීමට කැමති ස්ථානවල නිශ්චිත උපාය මාර්ග:

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    // මානයන් px හි ඇත

    Input.Add("document.png", ContentArea);

    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    // මානයන් px හි ඇත

    Input.Add("document.png", ContentArea);

    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala

Using Input = New OcrInput()
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	' මානයන් px හි ඇත

	Input.Add("document.png", ContentArea)

	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

අඩු ගුණාත්මක ස්කෑන් සඳහා OCR

අඩු නිරවද්‍යතාවන් සඳහා හා ශබ්දය සහිත ස්කෑන් වෙනස් කිරීම:

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    Input.DeNoise(); // ඩිජිටල් ශබ්දය සහ දුර්වල ස්කෑන් කිරීම නිවැරදි කරයි
    Input.Deskew(); // භ්‍රමණය සහ ඉදිරිදර්ශනය නිවැරදි කරයි
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    Input.DeNoise(); // ඩිජිටල් ශබ්දය සහ දුර්වල ස්කෑන් කිරීම නිවැරදි කරයි
    Input.Deskew(); // භ්‍රමණය සහ ඉදිරිදර්ශනය නිවැරදි කරයි
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
	Input.DeNoise() ' ඩිජිටල් ශබ්දය සහ දුර්වල ස්කෑන් කිරීම නිවැරදි කරයි
	Input.Deskew() ' භ්‍රමණය සහ ඉදිරිදර්ශනය නිවැරදි කරයි
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

OCR ප්‍රති results ල සෙවිය හැකි PDF ලෙස අපනයනය කරන්න

PDF මගින් සෙවිය හැකි පෙළක් ලෙස OCR ප්‍රති results:

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput())
{
    input.Title = "Quarterly Report";
    input.AddImage("image1.jpeg");
    input.AddImage("image2.png");
    input.AddImage("image3.gif");

    var Result = Ocr.Read(input);
    Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput())
{
    input.Title = "Quarterly Report";
    input.AddImage("image1.jpeg");
    input.AddImage("image2.png");
    input.AddImage("image3.gif");

    var Result = Ocr.Read(input);
    Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala

Using Input = New OcrInput()
	input.Title = "Quarterly Report"
	input.AddImage("image1.jpeg")
	input.AddImage("image2.png")
	input.AddImage("image3.gif")

	Dim Result = Ocr.Read(input)
	Result.SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

සෙවිය හැකි PDF පරිවර්තනයට TIFF

TIFF ලේඛනයක් සෙවිය හැකි PDF එකක් බවට පරිවර්තනය කරන්න:

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput())
{
    input.AddMultiFrameTiff("example.tiff");
    var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput())
{
    input.AddMultiFrameTiff("example.tiff");
    var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala

Using Input = New OcrInput()
	input.AddMultiFrameTiff("example.tiff")
	Dim Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

OCR ප්‍රති results ල HTML ලෙස අපනයනය කරන්න

OCR ප්‍රති පොළ XHTML ලෙස සෙවිය හැකි ආකාරයට සකසන්න:

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput())
{
    input.Title = "Html Title";
    input.AddImage("image1.jpeg");

    var Result = Ocr.Read(input);
    Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput())
{
    input.Title = "Html Title";
    input.AddImage("image1.jpeg");

    var Result = Ocr.Read(input);
    Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala

Using Input = New OcrInput()
	input.Title = "Html Title"
	input.AddImage("image1.jpeg")

	Dim Result = Ocr.Read(input)
	Result.SaveAsHocrFile("results.html")
End Using
$vbLabelText   $csharpLabel

OCR රූප වැඩි දියුණු කිරීමේ පෙරහන්

OCR කාර්ය සාධනය වැඩි දියුණු කිරීම සඳහා OcrInput පන්තිය භාවිතා කරන්න.

රූප වැඩි දියුණු කිරීමේ කේත උදාහරණය

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    Input.DeNoise(); // ඩිජිටල් ශබ්දය සහ දුර්වල ස්කෑන් කිරීම නිවැරදි කරයි
    Input.Deskew(); // භ්‍රමණය සහ ඉදිරිදර්ශනය නිවැරදි කරයි
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    Input.DeNoise(); // ඩිජිටල් ශබ්දය සහ දුර්වල ස්කෑන් කිරීම නිවැරදි කරයි
    Input.Deskew(); // භ්‍රමණය සහ ඉදිරිදර්ශනය නිවැරදි කරයි
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala

Using Input = New OcrInput("LowQuality.jpeg")
	Input.DeNoise() ' ඩිජිටල් ශබ්දය සහ දුර්වල ස්කෑන් කිරීම නිවැරදි කරයි
	Input.Deskew() ' භ්‍රමණය සහ ඉදිරිදර්ශනය නිවැරදි කරයි
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

OCR රූප පෙරහන් ලැයිස්තුව

  • OcrInput.Rotate(double degrees) - රූප අංශක ගණනකින් භ්‍රමණය.
  • OcrInput.Binarize() - රූපය කළු හෝ සුදු බවට පත් කරයි.
  • OcrInput.ToGrayScale() - රූපය අළු පාට සෙවනක් ලෙස පරිවර්තනය කරයි.
  • OcrInput.Contrast() - වෙනස ස්වයංක්‍රීයව වැඩි කරයි.
  • OcrInput.DeNoise() - ඩිජිටල් ශබ්දය ඉවත් කරයි.
  • OcrInput.Invert() - වර්ණ ප්‍රතිලෝම කෙරේ.
  • OcrInput.Dilate() - වස්තූන්ගේ මායිමට විස්තාරණය කරයි.
  • OcrInput.Erode() - ඛාදනය වස්තු මායිම්වල පික්සෙල් ඉවත් කරයි.
  • OcrInput.Deskew() - රූපයේ භ්‍රමණය නිවැරදි කරයි.
  • OcrInput.DeepCleanBackgroundNoise() - අශුද්ධතා ඉවත් කිරීම.
  • OcrInput.EnhanceResolution - අඩු රූප විභේදනය වැඩි දියුණු කරන්න.

භාෂා ඇසුරුම් 126

Download language packs or from NuGet to support 126 ජාත්‍යන්තර භාෂා for IronOCR. Languages include German, French, English, Chinese, Japanese, and more.

භාෂා උදාහරණය

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
    input.AddImage("img/arabic.gif");
    // අවශ්‍ය නම් රූප පෙරහන් එක් කරන්න
    var Result = Ocr.Read(input);

    // වින්ඩෝස් හි පහසුවෙන් අරාබි මුද්‍රණය කළ නොහැක.
    Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
    input.AddImage("img/arabic.gif");
    // අවශ්‍ය නම් රූප පෙරහන් එක් කරන්න
    var Result = Ocr.Read(input);

    // වින්ඩෝස් හි පහසුවෙන් අරාබි මුද්‍රණය කළ නොහැක.
    Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
	input.AddImage("img/arabic.gif")
	' අවශ්‍ය නම් රූප පෙරහන් එක් කරන්න
	Dim Result = Ocr.Read(input)

	' වින්ඩෝස් හි පහසුවෙන් අරාබි මුද්‍රණය කළ නොහැක.
	Result.SaveAsTextFile("arabic.txt")
End Using
$vbLabelText   $csharpLabel

බහු භාෂා උදාහරණය

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Sinhala);

using (var input = new OcrInput())
{
    input.Add("multi-language.pdf");
    var Result = Ocr.Read(input);
    Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Sinhala);

using (var input = new OcrInput())
{
    input.Add("multi-language.pdf");
    var Result = Ocr.Read(input);
    Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Sinhala)

Using input = New OcrInput()
	input.Add("multi-language.pdf")
	Dim Result = Ocr.Read(input)
	Result.SaveAsTextFile("results.txt")
End Using
$vbLabelText   $csharpLabel

සවිස්තර OCR ප්‍රති Results ල වස්තු

Iron OCR සෑම OCR මෙහෙයුමක් සඳහාම OCR ප්‍රති result ල වස්තුවක් ලබා දෙයි.

using IronOcr;
using System.Drawing; // එකලස් කිරීමේ යොමුව එක් කරන්න

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true;

using (var Input = new OcrInput(@"images\sample.tiff"))
{
    OcrResult Result = Ocr.Read(Input);
    var Pages = Result.Pages;
    var Words = Pages[0].Words;
    var Barcodes = Result.Barcodes;
    // පරිමිත සවිස්තරාත්මක API එකක් සොයා ගැනීමට මෙහි ගවේෂණය කරන්න
}
using IronOcr;
using System.Drawing; // එකලස් කිරීමේ යොමුව එක් කරන්න

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true;

using (var Input = new OcrInput(@"images\sample.tiff"))
{
    OcrResult Result = Ocr.Read(Input);
    var Pages = Result.Pages;
    var Words = Pages[0].Words;
    var Barcodes = Result.Barcodes;
    // පරිමිත සවිස්තරාත්මක API එකක් සොයා ගැනීමට මෙහි ගවේෂණය කරන්න
}
Imports IronOcr
Imports System.Drawing ' එකලස් කිරීමේ යොමුව එක් කරන්න

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True

Using Input = New OcrInput("images\sample.tiff")
	Dim Result As OcrResult = Ocr.Read(Input)
	Dim Pages = Result.Pages
	Dim Words = Pages(0).Words
	Dim Barcodes = Result.Barcodes
	' පරිමිත සවිස්තරාත්මක API එකක් සොයා ගැනීමට මෙහි ගවේෂණය කරන්න
End Using
$vbLabelText   $csharpLabel

කාර්ය සාධනය

අයන්ඕසීආර් කොටුවෙන් පිටත ක්‍රියා කරයි. වේගය දැල්වෙමින් පවතී: IronOcr.2020+ 10 ගුණයකින් වේගවත් වන අතර පෙර ගොඩනැඟිලි වලට වඩා 250% අඩු දෝෂ ඇති කරයි.

වැඩිදුර ඉගෙන ගන්න

C#, VB, F# හෝ වෙනත් ඕනෑම .NET භාෂාවෙන් OCR ගැන වැඩි විස්තර දැනගැනීම සඳහා අපගේ ප්‍රජා නිබන්ධන කියවන්න.

.NET සංවර්ධකයින් සඳහා සම්පූර්ණ වස්තු යොමු කිරීමක් ද ඇත.