சி # மறறும .நெடடில தமிழ ஓ.சி.ஆர
இநத ஆவணததின பிற பதிபபுகள:
IronOCR எனபது ஒரு சி # மெனபொருள கூறு ஆகும. நெட குறியடடாளரகள படஙகள மறறும PDF ஆவணஙகளிலிருநது உரையை தமிழ உடபட 126 மொழியில படிகக அனுமதிககிறது.
இது டெசராகடின மேமபடட முடகரணடி ஆகும, இது நெட டெவலபபரகளுககாக பிரதயேகமாக கடடபபடடுளளது மறறும வேகம மறறும துலலியம ஆகிய இரணடிறகும மறற டெசராகட இயநதிரஙகளை தவறாமல விஞசும.
IronOcr.Languages.Tamil இன உளளடககஙகள
இநத தொகுபபில .NET ககான 102 OCR மொழிகள உளளன:
- தமிழ
- தமிழபெஸட
- தமிழபாஸட
- தமிழ எழுததுககள
- தமிழ ஆலபாபெட பெஸட
- தமிழ ஆலபாபெடஃபாஸட
பதிவிறகக Tamil
தமிழ மொழிப பொதி [தமனித]
* Download as ஜிப
* Install with as https://www.nuget.org/packages/IronOcr.Languages.Tamil/'> நுஜெட
நிறுவல
நாஙகள செயய வேணடியது முதலில உஙகள .NET திடடததில எஙகள தமிழ OCR தொகுபபை நிறுவ வேணடும.
PM> Install-Package IronOCR.Languages.Tamil
குறியடு எடுததுககாடடு
இநத சி # குறியடு எடுததுககாடடு ஒரு படம அலலது PDF ஆவணததிலிருநது தமிழ உரையைப படிககிறது.
// PM> Install-Package IronOcr.Languages.Tamil
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Tamil
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"images\Tamil.png"))
{
var Result = Ocr.Read(Input);
// Extract all the recognized text
var AllText = Result.Text;
}
// PM> Install-Package IronOcr.Languages.Tamil
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Tamil
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"images\Tamil.png"))
{
var Result = Ocr.Read(Input);
// Extract all the recognized text
var AllText = Result.Text;
}
' PM> Install-Package IronOcr.Languages.Tamil
Imports IronOcr
Private Ocr = New IronTesseract()
' Set the language to Tamil
Ocr.Language = OcrLanguage.Tamil
Using Input = New OcrInput("images\Tamil.png")
Dim Result = Ocr.Read(Input)
' Extract all the recognized text
Dim AllText = Result.Text
End Using
IronOCR ஐ ஏன தேரவு செயய வேணடும?
இருமபு ஓ.சி.ஆர எனபது நிறுவ எளிதானது, முழுமையானது மறறும நனகு ஆவணபபடுததபபடட நெட மெனபொருள நூலகம.
வெளிபபுற வலை சேவைகள, நடநதுகொணடிருககும கடடணம அலலது இணையததில ரகசிய ஆவணஙகளை அனுபபாமல 99.8% + OCR துலலியததை அடைய இருமபு OCR ஐத தேரவுசெயக.
சி # டெவலபபரகள வெணணிலா டெசராகடை விட இருமபு ஓ.சி.ஆரை ஏன தேரவு செயகிறாரகள:
- ஒறறை டி.எல.எல அலலது நுஜெடடாக நிறுவவும
- பெடடியின வெளியே டெசராகட 5, 4 மறறும 3 எனஜினகள அடஙகும.
- துலலியம 99.8% வழககமான டெசராகடை விட சிறபபாக செயலபடுகிறது.
- எரியும வேகம மறறும மலடி தரெடிங
- எம.வி.சி, வெபஆப, டெஸகடாப, கனசோல & சரவர பயனபாடு இணககமானது
- வேலை செயய Exes அலலது C ++ குறியடு இலலை
- முழு PDF OCR ஆதரவு
- OCR ஐ செயய கிடடததடட எநத படக கோபபு அலலது PDF
- முழு .நெட கோர, ஸடாணடரட மறறும ஃபிரேமவொரக ஆதரவு
- விணடோஸ, மேக, லினகஸ, அஸூர, டோககர, லாமபடா, ஏ.டபிளயூ.எஸ
- பாரகோடுகள மறறும கியூஆர குறியடுகளைப படிககவும
- XHTML ஆக OCR ஐ ஏறறுமதி செயக
- தேடககூடிய PDF ஆவணஙகளுககு OCR ஐ ஏறறுமதி செயக
- மலடிதரெடிங ஆதரவு
- 126 சரவதேச மொழிகள அனைததும நுஜெட அலலது ஓகராடா கோபபுகள வழியாக நிரவகிககபபடுகினறன
- படஙகள, ஒருஙகிணைபபுகள, புளளிவிவரஙகள மறறும எழுததுருககளைப பிரிததெடுககவும. உரை மடடுமலல.
- வணிக மறறும தனியுரிம பயனபாடுகளுககுள டெசராகட ஓ.சி.ஆரை மறுபகிரவு செயய பயனபடுததலாம.
நிஜ உலக படஙகள மறறும புகைபபடஙகள போனற அபூரண ஆவணஙகளுடன அலலது டிஜிடடல இரைசசல அலலது குறைபாடுகளைக கொணட குறைநத தெளிவுததிறனுடன ஸகேன செயயும போது இருமபு OCR பிரகாசிககிறது.
நெட இயஙகுதளததிறகான பிற இலவச OCR நூலகஙகள இநத உணமையான உலக பயனபாடடு நிகழவுகளில அவவளவு சிறபபாக செயலபடவிலலை. நெட டெசரகட API கள மறறும வலை சேவைகள.
டெசராகட 5 உடன OCR - சி # இல குறியடடு முறையைத தொடஙகுஙகள
கழேயுளள குறியடு மாதிரி C# அலலது VB .NET ஐப பயனபடுததி ஒரு படததிலிருநது உரையைப படிபபது எவவளவு எளிது எனபதைக காடடுகிறது.
ஒனலைனர
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
கடடமைககககூடிய ஹலோ உலகம
// PM> Install-Package IronOCR.Languages.Tamil
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput())
{
Input.AddImage("images/sample.jpeg");
//... நஙகள எததனை படஙகளையும சேரககலாம
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Tamil
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput())
{
Input.AddImage("images/sample.jpeg");
//... நஙகள எததனை படஙகளையும சேரககலாம
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Tamil
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tamil
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg")
'... நஙகள எததனை படஙகளையும சேரககலாம
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
சி # PDF OCR
எநதவொரு PDF ஆவணததிலிருநதும உரையைப பிரிததெடுகக இதே அணுகுமுறையைப பயனபடுததலாம.
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// OCR ககு குறிபபிடட PDF பகக எணகளையும நாம தேரநதெடுககலாம
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// PDF இன ஒவவொரு பககததிறகும 1 பககம
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// OCR ககு குறிபபிடட PDF பகக எணகளையும நாம தேரநதெடுககலாம
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// PDF இன ஒவவொரு பககததிறகும 1 பககம
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tamil
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' OCR ககு குறிபபிடட PDF பகக எணகளையும நாம தேரநதெடுககலாம
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' PDF இன ஒவவொரு பககததிறகும 1 பககம
End Using
மலடிபேஜ TIFF களுககான OCR
OCR படிததல பல பகக ஆவணஙகள உடபட TIFF கோபபு வடிவம. TIFF ஐ நேரடியாக தேடககூடிய உரையுடன PDF கோபபாக மாறறலாம.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput())
{
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput())
{
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tamil
Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
பாரகோடுகள மறறும QR
இருமபு OCR இன ஒரு தனிததுவமான அமசம, இது உரையை ஸகேன செயயும போது ஆவணஙகளிலிருநது பாரகோடுகள மறறும QR குறியடுகளைப படிகக முடியும. OcrResult.OcrBarcode
வகுபபின நிகழவுகள டெவலபபருககு ஒவவொரு ஸகேன செயயபபடட பாரகோடு பறறிய விரிவான தகவலகளையும OcrResult.OcrBarcode
.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// வகை மறறும இருபபிட பணபுகளும அமபலபபடுததபபடுகினறன
}
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// வகை மறறும இருபபிட பணபுகளும அமபலபபடுததபபடுகினறன
}
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' வகை மறறும இருபபிட பணபுகளும அமபலபபடுததபபடுகினறன
Next Barcode
End Using
படஙகளின குறிபபிடட பகுதிகளில OCR
இருமபு ஓ.சி.ஆரின ஸகேனிங மறறும வாசிபபு முறைகள அனைததும ஒரு பககததின எநத பகுதியை அலலது நாம உரையை படிகக விருமபுகிறோம எனபதை சரியாக குறிபபிடும திறனை வழஙகுகிறது. தரபபடுததபபடட படிவஙகளைப பாரககுமபோது இது மிகவும பயனுளளதாக இருககும, மேலும மோசமான நேரததை மிசசபபடுததவும செயலதிறனை மேமபடுததவும முடியும.
பயிர பகுதிகளைப பயனபடுதத, நாஙகள System.Drawing
ககு ஒரு கணினி குறிபபைச சேரகக வேணடும, இதனால System.Drawing.Rectangle
object ஐப பயனபடுததலாம.
using IronOcr;
using System.Drawing; // Necessary for Rectangle
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// பரிமாணஙகள px இல உளளன
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
using System.Drawing; // Necessary for Rectangle
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// பரிமாணஙகள px இல உளளன
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Imports System.Drawing ' Necessary for Rectangle
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tamil
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' பரிமாணஙகள px இல உளளன
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
குறைநத தர ஸகேனகளுககான OCR
இருமபு OCR OcrInput
வகுபபு சாதாரண OcrInput
படிகக முடியாத ஸகேனகளை சரிசெயய முடியும.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // டிஜிடடல சததம மறறும மோசமான ஸகேனிங ஆகியவறறை சரிசெயகிறது
Input.Deskew(); // சுழறசி மறறும முனனோககை சரிசெயகிறது
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // டிஜிடடல சததம மறறும மோசமான ஸகேனிங ஆகியவறறை சரிசெயகிறது
Input.Deskew(); // சுழறசி மறறும முனனோககை சரிசெயகிறது
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tamil
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' டிஜிடடல சததம மறறும மோசமான ஸகேனிங ஆகியவறறை சரிசெயகிறது
Input.Deskew() ' சுழறசி மறறும முனனோககை சரிசெயகிறது
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR முடிவுகளை தேடககூடிய PDF ஆக ஏறறுமதி செயக
நகலெடுககககூடிய உரை சரஙகளுடன PDF ககு படம. தேடுபொறிகள மறறும தரவுததளஙகளால குறியிடபபடலாம.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput())
{
input.Title = "Quarterly Report";
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput())
{
input.Title = "Quarterly Report";
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tamil
Using Input = New OcrInput()
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")
Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
தேடககூடிய PDF மாறறததிறகு TIFF
ஒரு TIFF ஆவணததை (அலலது படக கோபபுகளின எநதவொரு குழுவையும) நேரடாக தேடககூடிய PDF ககு மாறறவும, இது இனடராநெட, வலைததளம மறறும Google தேடுபொறிகளால குறியிடபபடலாம.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput())
{
input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput())
{
input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tamil
Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff")
Dim Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
OCR முடிவுகளை HTML ஆக ஏறறுமதி செயக
OCR படம XHTML மாறறததிறகு.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput())
{
input.Title = "Html Title";
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput())
{
input.Title = "Html Title";
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tamil
Using Input = New OcrInput()
input.Title = "Html Title"
input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
OCR பட விரிவாகக வடிபபானகள
OCR செயலதிறனை மேமபடுதத OcrInput
பொருளகளுககான தனிததுவமான வடிபபானகளை IronOCR வழஙகுகிறது.
பட மேமபாடடுக குறியடு எடுததுககாடடு
சிறநத, வேகமான OCR முடிவுகளை உருவாகக OCR உளளடடு படஙகளை உயர தரமாககுகிறது.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // அபததமான சததம மறறும சரறற ஸகேனிஙகிறகு தரவு
Input.Deskew(); // சுழல மறறும ஸகியூ சரிசெயகிறது
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // அபததமான சததம மறறும சரறற ஸகேனிஙகிறகு தரவு
Input.Deskew(); // சுழல மறறும ஸகியூ சரிசெயகிறது
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tamil
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' அபததமான சததம மறறும சரறற ஸகேனிஙகிறகு தரவு
Input.Deskew() ' சுழல மறறும ஸகியூ சரிசெயகிறது
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR பட வடிபபானகளின படடியல
இருமபு ஓ.சி.ஆரில கடடமைககபபடட OCR செயலதிறனை மேமபடுதத உளளாடடு வடிபபானகள பினவருமாறு:
- OcrInput.Rotate (இரடடை டிகிரி) - பல டிகிரி கடிகார திசையில படஙகளை சுழறறுகிறது. எதிரபபு கடிகார திசையில, எதிரமறை எணகளைப பயனபடுததவும.
- OcrInput.Binarize () - இநத பட வடிபபான ஒவவொரு பிகசலையும கருபபு அலலது வெளளை நிறமாக மாறறும. உரையின பினனணிககு மிகக குறைநத மாறுபாடடின OCR செயலதிறன நிகழவுகளை மேமபடுததலாம.
- OcrInput.ToGrayScale () - இநத பட வடிபபான ஒவவொரு பிகசலையும கிரேஸகேலின நிழலாக மாறறுகிறது . OCR துலலியததை மேமபடுதத வாயபபிலலை, ஆனால வேகததை மேமபடுததலாம
- OcrInput.Contrast () - மாறுபாடடை தானாக அதிகரிககிறது. இநத வடிபபான பெருமபாலும குறைநத மாறுபாடு ஸகேனகளில OCR வேகததையும துலலியததையும மேமபடுததுகிறது.
- OcrInput.DeNoise () - டிஜிடடல சததததை நககுகிறது. சததம எதிரபாரககபபடும இடததில மடடுமே இநத வடிபபான பயனபடுததபபட வேணடும.
- OcrInput.Invert () - ஒவவொரு வணணததையும தலைகழாக மாறறுகிறது. எ.கா வெளளை கருபபு ஆகிறது: கருபபு வெளளை ஆகிறது.
- OcrInput.Dilate () - மேமபடட உருவவியல. ஒரு படததில உளள பொருடகளின எலலைகளுககு நடடிபபு பிகசலகளைச சேரககிறது. ஈரோடடுககு எதிரே
- OcrInput.Erode () - மேமபடட உருவவியல. அரிபபு பொருள எலலைகளில பிகசலகளை நககுகிறது
- OcrInput.Deskew () - ஒரு படததை சுழறறுகிறது, எனவே இது சரியான வழி மறறும ஆரததோகனல ஆகும. இது OCR ககு மிகவும பயனுளளதாக இருககும, ஏனெனில வளைநத ஸகேனகளுககான டெசராகட சகிபபுததனமை 5 டிகிரி வரை குறைவாக இருககும.
- OcrInput.DeepCleanBackgroundNoise () - கனமான பினனணி இரைசசல நககம. தவிர ஆவண பினனணி இரைசசல தெரிநதால மடடுமே இநத வடிபபானைப பயனபடுததவும, ஏனெனில இநத வடிபபான சுததமான ஆவணஙகளின OCR துலலியததை குறைககும அபாயததை ஏறபடுததும, மேலும இது மிகவும CPU விலை அதிகம.
- OcrInput.EnhanceResolution - குறைநத தரமான படஙகளின தரமானததை மேமபடுததுகிறது. இநத வடிபபான பெருமபாலும தேவையிலலை, ஏனெனில OcrInput.MinimumDPI மறறும OcrInput.TargetDPI தானாகவே குறைநத தெளிவுததிறன உளளடுகளைப பிடிதது தரககும.
CleanBackgroundNoise. இது ஓரளவு நேரம எடுககும ஒரு அமைபபு; இருபபினும, டிஜிடடல இரைசசலுககுள டிஜிடடல இரைசசல, காகித நொறுககுதலகள மறறும பிற குறைபாடுகளை தானாகவே சுததம செயய நூலகததை இது அனுமதிககிறது, இது மறற OCR நூலகஙகளால படிகக இயலாது.
EnhanceContrast எனபது ஒரு அமைபபாகும, இது இருமபு OCR தானாக ஒரு படததின பினனணிககு எதிரான உரையின மாறுபாடடை அதிகரிககச செயகிறது, OCR இன துலலியததை அதிகரிககிறது மறறும பொதுவாக செயலதிறன மறறும OCR இன வேகததை அதிகரிககும.
EnhanceResolution எனபது குறைநத தெளிவுததிறன கொணட படஙகளை (275 dpi ககுக கழ உளளவை ) தானாகவே கணடறிநது தானாகவே படததை உயரததி , பினனர அனைதது உரையையும கூரமைபபடுததும, எனவே இது OCR நூலகததால முழுமையாகப படிகக முடியும. இநத செயலபாடு தானாகவே நேரததை எடுததுககொளளும எனறாலும, இது பொதுவாக ஒரு படததில OCR செயலபாடடிறகான ஒடடுமொதத நேரததைக குறைககிறது.
மொழி இருமபு OCR 22 சரவதேச மொழி பொதிகளை ஆதரிககிறது, மேலும OCR செயலபாடடிறகு பயனபடுததபபட வேணடிய ஒனறு அலலது அதறகு மேறபடட பல மொழிகளைத தேரநதெடுகக மொழி அமைபபைப பயனபடுததலாம.
வியூகம இருமபு OCR இரணடு உததிகளை ஆதரிககிறது. ஒரு ஆவணததின வேகமான மறறும குறைவான துலலியமான ஸகேன செயய நாஙகள தேரவு செயயலாம அலலது ஒரு செயறகை சொறகளை ஒருவருககொருவர ஒரு உறவில பாரபபதன மூலம OCR உரையின துலலியததை தானாக மேமபடுதத சில செயறகை நுணணறிவு மாதிரிகளைப பயனபடுததும ஒரு மேமபடட மூலோபாயததைப பயனபடுததலாம. .
கலரஸபேஸ எனபது ஒரு அமைபபாகும, இதன மூலம நாம OCR ஐ கிரேஸகேல அலலது வணணததில தேரவு செயயலாம. பொதுவாக, கிரேஸகேல சிறநத வழி. இருபபினும, சில நேரஙகளில ஒதத சாயல ஆனால மிகவும மாறுபடட நிறததின உரைகள அலலது பினனணிகள இருககுமபோது, ஒரு முழு வணண வணண இடம சிறநத முடிவுகளை வழஙகும.
DetectWhiteTextOnDarkBackgrounds. பொதுவாக, அனைதது OCR நூலகஙகளும வெளளை பினனணியில கருபபு உரையைக காண எதிரபாரககினறன. இநத அமைபபு இருமபு OCR ஐ தானாகவே எதிரமறைகளைக கணடறிய அலலது வெளளை உரையுடன இருணட பககஙகளைக கணடறிநது அவறறைப படிகக அனுமதிககிறது.
InputImageType. இநத அமைபபு டெவலபபருககு OCR நூலகததை ஒரு முழு ஆவணமா அலலது ஸகிரன ஷாட போனற ஒரு துணுககைப பாரககிறதா எனறு வழிகாடட அனுமதிககிறது.
RotateAndStraighten எனபது ஒரு மேமபடட அமைபபாகும, இது இருமபு OCR ஐ சுழறறுவதோடு மடடுமலலாமல, உரை ஆவணஙகளின புகைபபடஙகள போனற முனனோககையும கொணடிருககும ஆவணஙகளைப படிகக தனிததுவமான திறனை அனுமதிககிறது.
ReadBarcodes எனபது ஒரு பயனுளள அமசமாகும, இது இருமபு OCR பககஙகளில பாரகோடுகள மறறும QR குறியடுகளை தானாகவே படிகக அனுமதிககிறது, இது உரையை வாசிபபதால, கூடுதல கூடுதல நேர சுமையைச சேரககாமல.
கலர டெபத. ஒரு வணணததின ஆழததை தரமானிகக OCR நூலகம ஒரு பிகசலுககு எததனை பிடகள பயனபடுததும எனபதை இநத அமைபபு தரமானிககிறது. அதிக வணண ஆழம OCR தரததை அதிகரிககககூடும, ஆனால OCR செயலபாடடை முடிகக தேவையான நேரததையும அதிகரிககும.
126 மொழிப பொதிகள
இருமபு ஓ.சி.ஆர 126 சரவதேச மொழிகளை ம௯ழி பொதிகள வழியாக ஆதரிககிறது, அவை டி.எல.எல ஆக விநியோகிககபபடுகினறன, அவறறை இநத வலைததளததிலிருநது பதிவிறககம செயயலாம அலலது நுஜெட தொகுபபு மேலாளரிடமிருநதும பதிவிறககம செயயலாம .
மொழிகளில ஜெரமன, பிரஞசு, ஆஙகிலம, சன, ஜபபானிய மறறும பல உளளன. பாஸபோரட எம.ஆர.இசட, எம.ஐ.சி.ஆர காசோலைகள, நிதி தரவு, உரிமத தகடுகள மறறும பலவறறிறகான சிறபபு மொழிப பொதிகள உளளன. நஙகள உருவாககும எநதவொரு டெசராகட ".traineddata" கோபபையும பயனபடுததலாம.
மொழி எடுததுககாடடு
பிற OCR மொழிகளைப பயனபடுததுதல.
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// தேவைபபடடால பட வடிபபானகளைச சேரககவும
// இநத விஷயததில, சிநதனை உளளடு கூட மிகக குறைநத தரம கொணடது
// வழககமான டெசராகடால முடியாததை அயரன டெசராகட படிகக முடியும.
var Result = Ocr.Read(input);
// விணடோஸில கனசோல அரபியை எளிதில அசசிட முடியாது.
// அதறகு பதிலாக வடடில சேமிபபோம.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// தேவைபபடடால பட வடிபபானகளைச சேரககவும
// இநத விஷயததில, சிநதனை உளளடு கூட மிகக குறைநத தரம கொணடது
// வழககமான டெசராகடால முடியாததை அயரன டெசராகட படிகக முடியும.
var Result = Ocr.Read(input);
// விணடோஸில கனசோல அரபியை எளிதில அசசிட முடியாது.
// அதறகு பதிலாக வடடில சேமிபபோம.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' தேவைபபடடால பட வடிபபானகளைச சேரககவும
' இநத விஷயததில, சிநதனை உளளடு கூட மிகக குறைநத தரம கொணடது
' வழககமான டெசராகடால முடியாததை அயரன டெசராகட படிகக முடியும.
Dim Result = Ocr.Read(input)
' விணடோஸில கனசோல அரபியை எளிதில அசசிட முடியாது.
' அதறகு பதிலாக வடடில சேமிபபோம.
Result.SaveAsTextFile("arabic.txt")
End Using
பல மொழி எடுததுககாடடு
ஒரே நேரததில பல மொழிகளைப பயனபடுததி OCR ககும இது சாததியமாகும. யூனிகோட ஆவணஙகளில ஆஙகில மொழி மெடடாடேடடா மறறும URL களைப பெற இது உணமையில உதவும.
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Tamil);
// நாம எததனை மொழிகளையும சேரககலாம
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Tamil);
// நாம எததனை மொழிகளையும சேரககலாம
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Tamil)
' நாம எததனை மொழிகளையும சேரககலாம
Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
விரிவான OCR முடிவுகள பொருளகள
இருமபு OCR ஒவவொரு OCR செயலபாடடிறகும ஒரு OCR முடிவு பொருளை வழஙகுகிறது. பொதுவாக, டெவலபபரகள இநத பொருளின உரை சொததை மடடுமே படததிலிருநது ஸகேன செயய பயனபடுததுகிறாரகள. இருபபினும, OCR முடிவுகள DOM இதை விட மிகவும மேமபடடது.
using IronOcr;
using System.Drawing; //சடடசபை குறிபபைச சேரககவும
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; // !முககியமான
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// மிகபபெரிய, விரிவான API ஐக கணடுபிடிகக இஙகே ஆராயுஙகள:
// - பககஙகள, தொகுதிகள, பொழிபபுரைகள, கோடுகள, சொறகள, எழுததுககள
// - பட ஏறறுமதி, எழுததுரு ஒருஙகிணைபபுகள, புளளிவிவர தரவு
}
using IronOcr;
using System.Drawing; //சடடசபை குறிபபைச சேரககவும
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Tamil;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; // !முககியமான
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// மிகபபெரிய, விரிவான API ஐக கணடுபிடிகக இஙகே ஆராயுஙகள:
// - பககஙகள, தொகுதிகள, பொழிபபுரைகள, கோடுகள, சொறகள, எழுததுககள
// - பட ஏறறுமதி, எழுததுரு ஒருஙகிணைபபுகள, புளளிவிவர தரவு
}
Imports IronOcr
Imports System.Drawing 'சடடசபை குறிபபைச சேரககவும
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Tamil
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True ' !முககியமான
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' மிகபபெரிய, விரிவான API ஐக கணடுபிடிகக இஙகே ஆராயுஙகள:
' - பககஙகள, தொகுதிகள, பொழிபபுரைகள, கோடுகள, சொறகள, எழுததுககள
' - பட ஏறறுமதி, எழுததுரு ஒருஙகிணைபபுகள, புளளிவிவர தரவு
End Using
செயலதிறன
செயலதிறன இசைககு அலலது உளளடடு படஙகளை பெரிதும மாறற வேணடிய அவசியமினறி இருமபு ஓ.சி.ஆர பெடடியிலிருநது செயலபடுகிறது.
வேகம எரியும: IronOcr.2020 + 10 மடஙகு வேகமானது மறறும முநதைய உருவாககஙகளை விட 250% குறைவான பிழைகள செயகிறது.
மேலும அறிக
சி #, வி.பி., எஃப # அலலது வேறு எநத நெட மொழியிலும ஓ.சி.ஆர பறறி மேலும அறிய, தயவுசெயது எஙகள சமூக பயிறசிகளைப படியுஙகள , இது இருமபு ஓ.சி.ஆர எவவாறு பயனபடுததபபடலாம எனபதறகான உணமையான உலக எடுததுககாடடுகளைத தருகிறது, மேலும சிறநததை எவவாறு பெறுவது எனபதறகான நுணுககஙகளைக காடடககூடும இநத நூலகம.
நெட டெவலபபரகளுககான முழு பொருள குறிபபும கிடைககிறது.