C# සහ .NET හි සිංහල OCR
මෙම ලේඛනයේ වෙනත් සංස්කරණ:
අයන්ඕසීආර් යනු C# මෘදුකාංග සංරචකයකි .NET කෝඩර්වරුන්ට සිංහල ඇතුළු භාෂා 126 කින් රූප සහ පී.ඩී.එෆ්.
එය .NET සංවර්ධකයින් සඳහාම තනන ලද ටෙසෙරැක්ට් හි දෙබලක වන අතර වේගය සහ නිරවද්යතාවය යන දෙකටම නිතිපතා අනෙකුත් ටෙසරැක්ට් එන්ජින් අභිබවා යයි.
IronOcr.Languages.Sinhala හි අන්තර්ගතය
මෙම පැකේජයේ .NET සඳහා OCR භාෂා 114 ක් අඩංගු වේ:
- සිංහල
- සිංහලබෙස්ට්
- සිංහල ෆාස්ට්
- සිංහල ඇල්ෆබෙට්
- සිංහල ඇල්ෆබෙට්බෙස්ට්
- සිංහල ඇල්ෆබෙට් ෆාස්ට්
බාගත
සිංහල භාෂා ඇසුරුම Download as සිප් ⬇ | Install with NuGet: IronOcr.Languages.Sinhala
ස්ථාපනය
අප විසින් කළ යුතු පළමු දෙය නම් අපගේ සිංහල OCR පැකේජය ඔබේ .NET ව්යාපෘතියට ස්ථාපනය කිරීමයි.
Install-Package IronOCR.Languages.Sinhala
කේත උදාහරණය
මෙම C# කේත උදාහරණය රූප හෝ PDF ලේඛනයකින් සිංහල පෙළ කියවයි.
// PM> Install-Package IronOcr.Languages.Sinhala
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput(@"images\Sinhala.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
// PM> Install-Package IronOcr.Languages.Sinhala
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput(@"images\Sinhala.png"))
{
var Result = Ocr.Read(Input);
var AllText = Result.Text;
}
' PM> Install-Package IronOcr.Languages.Sinhala
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala
Using Input = New OcrInput("images\Sinhala.png")
Dim Result = Ocr.Read(Input)
Dim AllText = Result.Text
End Using
IronOCR තෝරා ගන්නේ ඇයි?
යකඩ OCR යනු පහසුවෙන් ස්ථාපනය කළ හැකි, සම්පූර්ණ හා හොඳින් ලේඛනගත කළ .NET මෘදුකාංග පුස්තකාලයකි.
කිසිදු බාහිර වෙබ් සේවා, අඛණ්ඩ ගාස්තු හෝ අන්තර්ජාලය හරහා රහස්ය ලේඛන යැවීමකින් තොරව 99.8% + OCR නිරවද්යතාවය ලබා ගැනීමට යකඩ OCR තෝරන්න.
සී # සංවර්ධකයින් වැනිලා ටෙසරැක්ට වඩා යකඩ OCR තෝරා ගන්නේ ඇයි:
- තනි DLL හෝ NuGet ලෙස ස්ථාපනය කරන්න
- කොටුවෙන් පිටත ටෙසෙරැක්ට් 5, 4 සහ 3 එන්ජින් සඳහා ඇතුළත් වේ.
- නිරවද්යතාවය 99.8% සාමාන්ය ටෙසරැක්ට වඩා සැලකිය යුතු ලෙස ඉක්මවා යයි.
- දැවෙන වේගය සහ බහු ත්රෙඩ් කිරීම
- MVC, WebApp, ඩෙස්ක්ටොප්, කොන්සෝලය සහ සේවාදායක යෙදුම අනුකූල වේ
- වැඩ කිරීමට C++ හෝ unmanaged කේත සැපයීමේ අවශ්යතාවය නෑ
- සම්පූර්ණ PDF OCR සහාය
- OCR ඕනෑම රූප ගොනුවක් හෝ PDF එකක් පාහේ සිදු කිරීම
- .NET Core, Standard සහ Framework සහාය
- වින්ඩෝස්, මැක්, ලිනක්ස්, අසුර්, ඩෝකර්, AWS, එසේම Lambda පරිසරයන් මත යෙදවීම
- තීරු කේත සහ QR කේත කියවන්න
- XHTML ලෙස OCR අපනයනය කරන්න
- සෙවිය හැකි PDF ලේඛන වෙත OCR අපනයනය කරන්න
- බහු තෙරපුම් සහාය
- ජාත්යන්තර භාෂා 126 ක් කළමනාකරණය කරන්නේ NuGet හෝ OCR data ෆයිල් මඟින් ය.
- සංඛ්යාන හා අකුරු ඛණ්ඩාංක, සංඛ්යාන සහ අකුරු උපුටා ගන්න.
- වාණිජ හා හිමිකාර යෙදුම් තුළ ටෙසරැක්ට් OCR නැවත බෙදා හැරීම සඳහා භාවිතා කළ හැකිය.
සැබෑ ලෝක රූප හා ඡායාරූප වැනි අසම්පූර්ණ ලේඛන හෝ ඩිජිටල් ශබ්දය හෝ අඩුපාඩු ඇති අඩු විභේදන ස්කෑන් සමඟ වැඩ කිරීමේදී යකඩ OCR බබළයි. .NET වේදිකාව සඳහා වන වෙනත් නොමිලේ OCR පුස්තකාල වැනි වෙනත් .net ටෙසරැක්ට් ඒපීඅයි සහ වෙබ් සේවා මෙම සැබෑ ලෝක භාවිත අවස්ථා වලදී එතරම් හොඳින් ක්රියා නොකරයි.
ටෙසරැක්ට් 5 සමඟ OCR - C#හි කේතීකරණය ආරම්භ කරන්න
පහත කේත නියැදියෙන් පෙන්වන්නේ C#හෝ VB .NET භාවිතයෙන් රූපයකින් සමගාමීව පෙළ කියවීම කොතරම් පහසුද යන්නයි.
OneLiner
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
වින්යාසගත හෙලෝ වර්ල්ඩ්
// PM> Install-Package IronOcr.Languages.Sinhala
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput())
{
Input.AddImage("images/sample.jpeg");
//... ඔබට ඕනෑම පින්තූර ගණනක් එක් කළ හැකිය
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOcr.Languages.Sinhala
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput())
{
Input.AddImage("images/sample.jpeg");
//... ඔබට ඕනෑම පින්තූර ගණනක් එක් කළ හැකිය
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOcr.Languages.Sinhala
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg")
'... ඔබට ඕනෑම පින්තූර ගණනක් එක් කළ හැකිය
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
C# PDF OCR
ඔබට ඕනෑම PDF ලේඛනයකින් පෙළ උගහන්න:
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// අපට OCR වෙත නිශ්චිත PDF පිටු අංක තෝරා ගත හැකිය
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// PDF හි සෑම පිටුවක් සඳහාම 1 පිටුව
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// අපට OCR වෙත නිශ්චිත PDF පිටු අංක තෝරා ගත හැකිය
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// PDF හි සෑම පිටුවක් සඳහාම 1 පිටුව
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' අපට OCR වෙත නිශ්චිත PDF පිටු අංක තෝරා ගත හැකිය
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' PDF හි සෑම පිටුවක් සඳහාම 1 පිටුව
End Using
බහු පිටු TIFF සඳහා OCR
TIFF ගොනු ආකෘතියෙහි බහු පිටු ලේඛන කියවීම සහ PDF ගොනුවකට පරිවර්තනය:
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("multi-frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("multi-frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala
Using Input = New OcrInput()
Input.AddMultiFrameTiff("multi-frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
තීරු කේත සහ QR
යාකඩ OCR හි සුවිශේෂී ලක්ෂණය වන්නේ එය පෙළ සඳහා පරිලෝකනය කරන අතරතුර ලේඛන වලින් තීරු කේත සහ QR කේත කියවිය හැකි වීමයි. OcrResult.OcrBarcode
පන්තියේ අවස්ථා සංවර්ධකයාට පරිලෝකනය කරන ලද සෑම තීරු කේතයක් ගැනම සවිස්තරාත්මක තොරතුරු ලබා දෙයි.
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// වර්ගය සහ ස්ථාන ගුණාංග ද නිරාවරණය වේ
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// වර්ගය සහ ස්ථාන ගුණාංග ද නිරාවරණය වේ
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' වර්ගය සහ ස්ථාන ගුණාංග ද නිරාවරණය වේ
Next Barcode
End Using
රූපවල නිශ්චිත ප්රදේශ පිළිබඳ OCR
කියවීමට කැමති ස්ථානවල නිශ්චිත උපාය මාර්ග:
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// මානයන් px හි ඇත
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// මානයන් px හි ඇත
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' මානයන් px හි ඇත
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
අඩු ගුණාත්මක ස්කෑන් සඳහා OCR
අඩු නිරවද්යතාවන් සඳහා හා ශබ්දය සහිත ස්කෑන් වෙනස් කිරීම:
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ඩිජිටල් ශබ්දය සහ දුර්වල ස්කෑන් කිරීම නිවැරදි කරයි
Input.Deskew(); // භ්රමණය සහ ඉදිරිදර්ශනය නිවැරදි කරයි
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ඩිජිටල් ශබ්දය සහ දුර්වල ස්කෑන් කිරීම නිවැරදි කරයි
Input.Deskew(); // භ්රමණය සහ ඉදිරිදර්ශනය නිවැරදි කරයි
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ඩිජිටල් ශබ්දය සහ දුර්වල ස්කෑන් කිරීම නිවැරදි කරයි
Input.Deskew() ' භ්රමණය සහ ඉදිරිදර්ශනය නිවැරදි කරයි
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR ප්රති results ල සෙවිය හැකි PDF ලෙස අපනයනය කරන්න
PDF මගින් සෙවිය හැකි පෙළක් ලෙස OCR ප්රති results:
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput())
{
input.Title = "Quarterly Report";
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput())
{
input.Title = "Quarterly Report";
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala
Using Input = New OcrInput()
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")
Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
සෙවිය හැකි PDF පරිවර්තනයට TIFF
TIFF ලේඛනයක් සෙවිය හැකි PDF එකක් බවට පරිවර්තනය කරන්න:
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput())
{
input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput())
{
input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala
Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff")
Dim Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
OCR ප්රති results ල HTML ලෙස අපනයනය කරන්න
OCR ප්රති පොළ XHTML ලෙස සෙවිය හැකි ආකාරයට සකසන්න:
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput())
{
input.Title = "Html Title";
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput())
{
input.Title = "Html Title";
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala
Using Input = New OcrInput()
input.Title = "Html Title"
input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
OCR රූප වැඩි දියුණු කිරීමේ පෙරහන්
OCR කාර්ය සාධනය වැඩි දියුණු කිරීම සඳහා OcrInput
පන්තිය භාවිතා කරන්න.
රූප වැඩි දියුණු කිරීමේ කේත උදාහරණය
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ඩිජිටල් ශබ්දය සහ දුර්වල ස්කෑන් කිරීම නිවැරදි කරයි
Input.Deskew(); // භ්රමණය සහ ඉදිරිදර්ශනය නිවැරදි කරයි
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ඩිජිටල් ශබ්දය සහ දුර්වල ස්කෑන් කිරීම නිවැරදි කරයි
Input.Deskew(); // භ්රමණය සහ ඉදිරිදර්ශනය නිවැරදි කරයි
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ඩිජිටල් ශබ්දය සහ දුර්වල ස්කෑන් කිරීම නිවැරදි කරයි
Input.Deskew() ' භ්රමණය සහ ඉදිරිදර්ශනය නිවැරදි කරයි
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR රූප පෙරහන් ලැයිස්තුව
- OcrInput.Rotate(double degrees) - රූප අංශක ගණනකින් භ්රමණය.
- OcrInput.Binarize() - රූපය කළු හෝ සුදු බවට පත් කරයි.
- OcrInput.ToGrayScale() - රූපය අළු පාට සෙවනක් ලෙස පරිවර්තනය කරයි.
- OcrInput.Contrast() - වෙනස ස්වයංක්රීයව වැඩි කරයි.
- OcrInput.DeNoise() - ඩිජිටල් ශබ්දය ඉවත් කරයි.
- OcrInput.Invert() - වර්ණ ප්රතිලෝම කෙරේ.
- OcrInput.Dilate() - වස්තූන්ගේ මායිමට විස්තාරණය කරයි.
- OcrInput.Erode() - ඛාදනය වස්තු මායිම්වල පික්සෙල් ඉවත් කරයි.
- OcrInput.Deskew() - රූපයේ භ්රමණය නිවැරදි කරයි.
- OcrInput.DeepCleanBackgroundNoise() - අශුද්ධතා ඉවත් කිරීම.
- OcrInput.EnhanceResolution - අඩු රූප විභේදනය වැඩි දියුණු කරන්න.
භාෂා ඇසුරුම් 126
Download language packs or from NuGet to support 126 ජාත්යන්තර භාෂා for IronOCR. Languages include German, French, English, Chinese, Japanese, and more.
භාෂා උදාහරණය
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// අවශ්ය නම් රූප පෙරහන් එක් කරන්න
var Result = Ocr.Read(input);
// වින්ඩෝස් හි පහසුවෙන් අරාබි මුද්රණය කළ නොහැක.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// අවශ්ය නම් රූප පෙරහන් එක් කරන්න
var Result = Ocr.Read(input);
// වින්ඩෝස් හි පහසුවෙන් අරාබි මුද්රණය කළ නොහැක.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' අවශ්ය නම් රූප පෙරහන් එක් කරන්න
Dim Result = Ocr.Read(input)
' වින්ඩෝස් හි පහසුවෙන් අරාබි මුද්රණය කළ නොහැක.
Result.SaveAsTextFile("arabic.txt")
End Using
බහු භාෂා උදාහරණය
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Sinhala);
using (var input = new OcrInput())
{
input.Add("multi-language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Sinhala);
using (var input = new OcrInput())
{
input.Add("multi-language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Sinhala)
Using input = New OcrInput()
input.Add("multi-language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
සවිස්තර OCR ප්රති Results ල වස්තු
Iron OCR සෑම OCR මෙහෙයුමක් සඳහාම OCR ප්රති result ල වස්තුවක් ලබා දෙයි.
using IronOcr;
using System.Drawing; // එකලස් කිරීමේ යොමුව එක් කරන්න
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true;
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// පරිමිත සවිස්තරාත්මක API එකක් සොයා ගැනීමට මෙහි ගවේෂණය කරන්න
}
using IronOcr;
using System.Drawing; // එකලස් කිරීමේ යොමුව එක් කරන්න
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Sinhala;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true;
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// පරිමිත සවිස්තරාත්මක API එකක් සොයා ගැනීමට මෙහි ගවේෂණය කරන්න
}
Imports IronOcr
Imports System.Drawing ' එකලස් කිරීමේ යොමුව එක් කරන්න
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Sinhala
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' පරිමිත සවිස්තරාත්මක API එකක් සොයා ගැනීමට මෙහි ගවේෂණය කරන්න
End Using
කාර්ය සාධනය
අයන්ඕසීආර් කොටුවෙන් පිටත ක්රියා කරයි. වේගය දැල්වෙමින් පවතී: IronOcr.2020+ 10 ගුණයකින් වේගවත් වන අතර පෙර ගොඩනැඟිලි වලට වඩා 250% අඩු දෝෂ ඇති කරයි.
වැඩිදුර ඉගෙන ගන්න
C#, VB, F# හෝ වෙනත් ඕනෑම .NET භාෂාවෙන් OCR ගැන වැඩි විස්තර දැනගැනීම සඳහා අපගේ ප්රජා නිබන්ධන කියවන්න.
.NET සංවර්ධකයින් සඳහා සම්පූර්ණ වස්තු යොමු කිරීමක් ද ඇත.