C#ଏବଂ .NET ରେ ଓଡିଆ OCR |
ଏହି ଡକ୍ୟୁମେଣ୍ଟର ଅନ୍ୟ ସଂସ୍କରଣ:
IronOCR ହେଉଛି ଏକ C#ସଫ୍ଟୱେର୍ ଉପାଦାନ ଯାହାକି .NET କୋଡର୍ମାନଙ୍କୁ ଓଡିଆ ସମେତ 126 ଭାଷାରେ ପ୍ରତିଛବି ଏବଂ PDF ଡକ୍ୟୁମେଣ୍ଟରୁ ପାଠ ପ to ିବାକୁ ଅନୁମତି ଦେଇଥାଏ |
ଏହା ଟେସେରାକ୍ଟର ଏକ ଉନ୍ନତ ଫଙ୍କ, ଯାହା କେବଳ .NET ଡେଭଲପର୍ମାନଙ୍କ ପାଇଁ ନିର୍ମିତ ଏବଂ ଉଭୟ ଗତି ଏବଂ ସଠିକତା ପାଇଁ ନିୟମିତ ଭାବରେ ଅନ୍ୟ ଟେସେରାକ୍ଟ ଇଞ୍ଜିନଗୁଡ଼ିକୁ ଅତିକ୍ରମ କରିଥାଏ |
IronOcr.Languages.Oriya ର ବିଷୟବସ୍ତୁ |
ଏହି ପ୍ୟାକେଜ୍ .NET ପାଇଁ 102 OCR ଭାଷା ଧାରଣ କରିଥାଏ:
- ଓଡିଆ
- ଓଡିଆ ବେଷ୍ଟ |
- ଓଡିଆ ଫାଷ୍ଟ |
- ଓଡିଆ ବର୍ଣ୍ଣମାଳା |
- ଓଡିଆ ଆଲଫାବେଟ୍ ବେଷ୍ଟ |
- ଓଡିଆ ଆଲଫାବେଟ୍ ଫାଷ୍ଟ |
ଡାଉନଲୋଡ୍ କରନ୍ତୁ |
ଓଡ଼ିଆ ଭାଷା ପ୍ୟାକ୍ [ଓଡ଼ିଆ]
* Download as ଜିପ୍
* Install with as https://www.nuget.org/packages/IronOcr.Languages.Oriya/'> NuGet
ସ୍ଥାପନ
ଆମକୁ ପ୍ରଥମେ କରିବାକୁ ହେବ ଆମର .NET ପ୍ରୋଜେକ୍ଟରେ ଆମର ଓଡିଆ OCR ପ୍ୟାକେଜ୍ ସଂସ୍ଥାପନ କରିବା |
PM> Install-Package IronOCR.Languages.Oriya
କୋଡ୍ ଉଦାହରଣ |
ଏହି C#କୋଡ୍ ଉଦାହରଣ ଏକ ପ୍ରତିଛବି କିମ୍ବା PDF ଡକ୍ୟୁମେଣ୍ଟରୁ ଓଡିଆ ପାଠ ପ read େ |
//PM> Install-Package IronOcr.Languages.Oriya
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput(@"images\Oriya.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Oriya
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput(@"images\Oriya.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Oriya
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput("images\Oriya.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
IronOCR କାହିଁକି ବାଛନ୍ତୁ?
ଆଇରନ୍ OCR ଏକ ସହଜ-ସଂସ୍ଥାପିତ, ସଂପୂର୍ଣ୍ଣ ଏବଂ ଭଲ-ଡକ୍ୟୁମେଣ୍ଟ୍ ହୋଇଥିବା .NET ସଫ୍ଟୱେର୍ ଲାଇବ୍ରେରୀ |
99.8% + OCR ସଠିକତା ହାସଲ କରିବାକୁ IronOCR ବାଛନ୍ତୁ, କ external ଣସି ବାହ୍ୟ ୱେବ୍ ସେବା, ଚାଲୁଥିବା ଶୁଳ୍କ କିମ୍ବା ଇଣ୍ଟରନେଟରେ ଗୁପ୍ତ ଡକ୍ୟୁମେଣ୍ଟ ପଠାଇ |
ଭାନିଲା ଟେସେରାକ୍ଟ ଉପରେ C#ବିକାଶକାରୀମାନେ କାହିଁକି IronOCR ବାଛନ୍ତି:
- ଗୋଟିଏ DLL କିମ୍ବା NuGet ଭାବରେ ସଂସ୍ଥାପନ କରନ୍ତୁ |
- ବାକ୍ସ ବାହାରେ ଟେସେରାକ୍ଟ 5, 4 ଏବଂ 3 ଇଞ୍ଜିନ୍ ପାଇଁ ଅନ୍ତର୍ଭୂକ୍ତ କରେ |
- ସଠିକତା 99.8% ନିୟମିତ ଟେସେରାକ୍ଟକୁ ଯଥେଷ୍ଟ ଅଧିକ କରିଥାଏ |
- ଜ୍ୱଳନ୍ତ ଗତି ଏବଂ ମଲ୍ଟି ଥ୍ରେଡିଂ |
- MVC, ୱେବ୍ ଆପ୍, ଡେସ୍କଟପ୍, କନସୋଲ୍ ଏବଂ ସର୍ଭର ଆପ୍ଲିକେସନ୍ ସୁସଙ୍ଗତ |
- କାମ କରିବାକୁ କ Ex ଣସି Exes କିମ୍ବା C ++ କୋଡ୍ ନାହିଁ |
- ସମ୍ପୂର୍ଣ୍ଣ PDF OCR ସମର୍ଥନ |
- OCR କୁ ପ୍ରାୟ ଯେକ Image ଣସି ପ୍ରତିଛବି ଫାଇଲ୍ କିମ୍ବା PDF କରିବା ପାଇଁ |
- ପୂର୍ଣ୍ଣ .ନେଟ କୋର, ଷ୍ଟାଣ୍ଡାର୍ଡ ଏବଂ ଫ୍ରେମ୍ ୱର୍କ ସମର୍ଥନ |
- ୱିଣ୍ଡୋଜ୍, ମ୍ୟାକ୍, ଲିନକ୍ସ, ଆଜୁର୍, ଡକର୍, ଲମ୍ବଡା, AWS ରେ ନିୟୋଜିତ କରନ୍ତୁ |
- ବାରକୋଡ୍ ଏବଂ QR କୋଡ୍ ପ Read ନ୍ତୁ |
- XHTML ପରି OCR ରପ୍ତାନି କରନ୍ତୁ |
- ସନ୍ଧାନଯୋଗ୍ୟ PDF ଡକ୍ୟୁମେଣ୍ଟଗୁଡିକ ପାଇଁ OCR ରପ୍ତାନି କରନ୍ତୁ |
- ମଲ୍ଟିଥ୍ରେଡିଂ ସମର୍ଥନ |
- 126 ଆନ୍ତର୍ଜାତୀୟ ଭାଷା ସମସ୍ତ NuGet କିମ୍ବା OcrData ଫାଇଲ୍ ମାଧ୍ୟମରେ ପରିଚାଳିତ |
- ପ୍ରତିଛବି, ସଂଯୋଜକ, ପରିସଂଖ୍ୟାନ ଏବଂ ଫଣ୍ଟ ବାହାର କରନ୍ତୁ | କେବଳ ପାଠ ନୁହେଁ |
- ବାଣିଜ୍ୟିକ ଏବଂ ମାଲିକାନା ପ୍ରୟୋଗଗୁଡ଼ିକ ମଧ୍ୟରେ ଟେସେରାକ୍ଟ OCR କୁ ପୁନ istr ବଣ୍ଟନ ପାଇଁ ବ୍ୟବହାର କରାଯାଇପାରିବ |
ବାସ୍ତବ ବିଶ୍ images ପ୍ରତିଛବି ଏବଂ ଅସମ୍ପୂର୍ଣ୍ଣ ଡକ୍ୟୁମେଣ୍ଟ୍ ଯେପରିକି ଫଟୋଗ୍ରାଫ୍, କିମ୍ବା କମ୍ ରିଜୋଲ୍ୟୁସନ୍ ସ୍କାନ୍ ସହିତ କାମ କରିବାବେଳେ ଲ Iron ହ OCR ଉଜ୍ଜ୍ୱଳ ହୋଇଥାଏ ଯାହା ଡିଜିଟାଲ୍ ଶବ୍ଦ କିମ୍ବା ଅସମ୍ପୂର୍ଣ୍ଣତା ଥାଇପାରେ |
.NET ପ୍ଲାଟଫର୍ମ ପାଇଁ ଅନ୍ୟାନ୍ୟ ମାଗଣା OCR ଲାଇବ୍ରେରୀଗୁଡ଼ିକ ଏହିପରି ଅନ୍ୟ .net ଟେସେରାକ୍ଟ API ଏବଂ ୱେବ୍ ସେବାଗୁଡିକ ଏହି ବାସ୍ତବ ଦୁନିଆ ବ୍ୟବହାର କ୍ଷେତ୍ରରେ ଏତେ ଭଲ ପ୍ରଦର୍ଶନ କରେ ନାହିଁ |
ଟେସେରାକ୍ଟ 5 ସହିତ OCR - C#ରେ କୋଡିଂ ଆରମ୍ଭ କରନ୍ତୁ |
ନିମ୍ନରେ କୋଡ୍ ନମୁନା ଦର୍ଶାଏ ଯେ C#କିମ୍ବା VB .NET ବ୍ୟବହାର କରି ଏକ ପ୍ରତିଛବିରୁ ପାଠ ପ to ିବା କେତେ ସହଜ |
OneLiner
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
ବିନ୍ୟାସଯୋଗ୍ୟ ହେଲୋ ୱାର୍ଲ୍ଡ |
// PM> Install-Package IronOCR.Languages.Oriya
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... ଆପଣ ଯେକ any ଣସି ସଂଖ୍ୟକ ପ୍ରତିଛବି ଯୋଗ କରିପାରିବେ |
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Oriya
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... ଆପଣ ଯେକ any ଣସି ସଂଖ୍ୟକ ପ୍ରତିଛବି ଯୋଗ କରିପାରିବେ |
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Oriya
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
C#PDF OCR |
ସମାନ ପଦ୍ଧତି ଯେକ PDF ଣସି PDF ଡକ୍ୟୁମେଣ୍ଟରୁ ପାଠ ବାହାର କରିବା ପାଇଁ ସମାନ ଭାବରେ ବ୍ୟବହୃତ ହୋଇପାରେ |
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// ଆମେ OCR କୁ ନିର୍ଦ୍ଦିଷ୍ଟ PDF ପୃଷ୍ଠା ସଂଖ୍ୟା ମଧ୍ୟ ଚୟନ କରିପାରିବା |
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// PDF ର ପ୍ରତ୍ୟେକ ପୃଷ୍ଠା ପାଇଁ 1 ପୃଷ୍ଠା |
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// ଆମେ OCR କୁ ନିର୍ଦ୍ଦିଷ୍ଟ PDF ପୃଷ୍ଠା ସଂଖ୍ୟା ମଧ୍ୟ ଚୟନ କରିପାରିବା |
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// PDF ର ପ୍ରତ୍ୟେକ ପୃଷ୍ଠା ପାଇଁ 1 ପୃଷ୍ଠା |
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' ଆମେ OCR କୁ ନିର୍ଦ୍ଦିଷ୍ଟ PDF ପୃଷ୍ଠା ସଂଖ୍ୟା ମଧ୍ୟ ଚୟନ କରିପାରିବା |
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' PDF ର ପ୍ରତ୍ୟେକ ପୃଷ୍ଠା ପାଇଁ 1 ପୃଷ୍ଠା |
End Using
ମଲ୍ଟିପେଜ୍ TIFF ପାଇଁ OCR |
ଏକାଧିକ ପୃଷ୍ଠା ଡକ୍ୟୁମେଣ୍ଟ୍ ସହିତ OCR ପଠନ TIFF ଫାଇଲ୍ ଫର୍ମାଟ୍ | ସନ୍ଧାନଯୋଗ୍ୟ ପାଠ୍ୟ ସହିତ TIFF କୁ ସିଧାସଳଖ ଏକ PDF ଫାଇଲରେ ରୂପାନ୍ତର କରାଯାଇପାରେ |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ବାରକୋଡ୍ ଏବଂ QR |
ଆଇରନ୍ OCR ର ଏକ ଅନନ୍ୟ ବ feature ଶିଷ୍ଟ୍ୟ ହେଉଛି ଏହା ଟେକ୍ସଟ୍ ପାଇଁ ସ୍କାନ କରୁଥିବାବେଳେ ଡକ୍ୟୁମେଣ୍ଟରୁ ବାରକୋଡ୍ ଏବଂ QR କୋଡ୍ ପ read ିପାରେ | OcrResult.OcrBarcode
ଶ୍ରେଣୀର ଉଦାହରଣଗୁଡିକ ପ୍ରତ୍ୟେକ ସ୍କାନ ହୋଇଥିବା ବାରକୋଡ୍ ବିଷୟରେ ବିକାଶକାରୀଙ୍କୁ ବିସ୍ତୃତ ସୂଚନା ଦେଇଥାଏ |
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// ପ୍ରକାର ଏବଂ ଅବସ୍ଥାନ ଗୁଣଗୁଡିକ ମଧ୍ୟ ଉନ୍ମୋଚିତ ହୋଇଛି |
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// ପ୍ରକାର ଏବଂ ଅବସ୍ଥାନ ଗୁଣଗୁଡିକ ମଧ୍ୟ ଉନ୍ମୋଚିତ ହୋଇଛି |
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' ପ୍ରକାର ଏବଂ ଅବସ୍ଥାନ ଗୁଣଗୁଡିକ ମଧ୍ୟ ଉନ୍ମୋଚିତ ହୋଇଛି |
Next Barcode
End Using
ପ୍ରତିଛବିଗୁଡ଼ିକର ନିର୍ଦ୍ଦିଷ୍ଟ କ୍ଷେତ୍ର ଉପରେ OCR |
ସମସ୍ତ ଆଇରନ୍ OCR ର ସ୍କାନିଂ ଏବଂ ପ reading ଼ିବା ପଦ୍ଧତିଗୁଡ଼ିକ କେଉଁ ପୃଷ୍ଠାର କେଉଁ ଅଂଶରୁ ଆମେ ପାଠ ପ to ିବାକୁ ଚାହୁଁଛୁ ତାହା ନିର୍ଦ୍ଦିଷ୍ଟ କରିବାର କ୍ଷମତା ପ୍ରଦାନ କରିଥାଏ | ଯେତେବେଳେ ଆମେ ମାନକ ଫର୍ମଗୁଡିକୁ ଦେଖୁ ଏହା ଅତ୍ୟନ୍ତ ଉପଯୋଗୀ ଏବଂ ଏକ ଭୟଙ୍କର ସମୟ ବଞ୍ଚାଇ ପାରିବ ଏବଂ ଦକ୍ଷତା ବୃଦ୍ଧି କରିପାରିବ |
ଫସଲ ଅଞ୍ଚଳ ବ୍ୟବହାର କରିବାକୁ, ଆମକୁ System.Drawing
ଏକ ସିଷ୍ଟମ୍ ରେଫରେନ୍ସ ଯୋଡିବାକୁ ପଡିବ ଯାହା System.Drawing
we System.Drawing
ଆମେ System.Drawing.Rectangle
ବସ୍ତୁ ବ୍ୟବହାର କରିପାରିବା |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ପରିମାପ px ରେ ଅଛି |
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ପରିମାପ px ରେ ଅଛି |
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' ପରିମାପ px ରେ ଅଛି |
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ନିମ୍ନ ଗୁଣବତ୍ତା ସ୍କାନ୍ ପାଇଁ OCR |
ଆଇରନ୍ OCR OcrInput
ଶ୍ରେଣୀ ସ୍କାନ୍ ଠିକ୍ କରିପାରିବ ଯାହା ସାଧାରଣ OcrInput
ନାହିଁ |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ଡିଜିଟାଲ୍ ଶବ୍ଦ ଏବଂ ଖରାପ ସ୍କାନିଂ ଠିକ୍ କରେ |
Input.Deskew(); // ଘୂର୍ଣ୍ଣନ ଏବଂ ଦୃଷ୍ଟିକୋଣ ଠିକ୍ କରେ |
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ଡିଜିଟାଲ୍ ଶବ୍ଦ ଏବଂ ଖରାପ ସ୍କାନିଂ ଠିକ୍ କରେ |
Input.Deskew(); // ଘୂର୍ଣ୍ଣନ ଏବଂ ଦୃଷ୍ଟିକୋଣ ଠିକ୍ କରେ |
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ଡିଜିଟାଲ୍ ଶବ୍ଦ ଏବଂ ଖରାପ ସ୍କାନିଂ ଠିକ୍ କରେ |
Input.Deskew() ' ଘୂର୍ଣ୍ଣନ ଏବଂ ଦୃଷ୍ଟିକୋଣ ଠିକ୍ କରେ |
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ଏକ ସନ୍ଧାନଯୋଗ୍ୟ PDF ଭାବରେ OCR ଫଳାଫଳ ରପ୍ତାନି କରନ୍ତୁ |
କପି ଯୋଗ୍ୟ ପାଠ୍ୟ ଷ୍ଟ୍ରିଙ୍ଗ ସହିତ PDF କୁ ପ୍ରତିଛବି | ସର୍ଚ୍ଚ ଇଞ୍ଜିନ୍ ଏବଂ ଡାଟାବେସ୍ ଦ୍ୱାରା ସୂଚୀବଦ୍ଧ ହୋଇପାରିବ |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")
Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
ସନ୍ଧାନଯୋଗ୍ୟ PDF ରୂପାନ୍ତର ପାଇଁ TIFF |
ଏକ TIFF ଡକ୍ୟୁମେଣ୍ଟ୍ (କିମ୍ବା ପ୍ରତିଛବି ଫାଇଲଗୁଡିକର କ group ଣସି ଗୋଷ୍ଠୀ) କୁ ଏକ ସନ୍ଧାନଯୋଗ୍ୟ PDF କୁ ସିଧାସଳଖ ରୂପାନ୍ତର କରନ୍ତୁ ଯାହା ଇଣ୍ଟରନେଟ୍, ୱେବସାଇଟ୍ ଏବଂ ଗୁଗୁଲ୍ ସର୍ଚ୍ଚ ଇଞ୍ଜିନ୍ ଦ୍ୱାରା ସୂଚୀବଦ୍ଧ ହୋଇପାରିବ |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
OCR ଫଳାଫଳକୁ HTML ଭାବରେ ରପ୍ତାନି କରନ୍ତୁ |
XHTML ରୂପାନ୍ତର ପାଇଁ OCR ପ୍ରତିଛବି |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
OCR ପ୍ରତିଛବି ଉନ୍ନତି ଫିଲ୍ଟର୍ |
OCR କାର୍ଯ୍ୟଦକ୍ଷତାକୁ ଉନ୍ନତ କରିବା ପାଇଁ OcrInput
ବସ୍ତୁଗୁଡ଼ିକ ପାଇଁ ଅନନ୍ୟ ଫିଲ୍ଟର୍ ପ୍ରଦାନ କରେ |
ପ୍ରତିଛବି ଉନ୍ନତି ସଂକେତ ଉଦାହରଣ |
ଉନ୍ନତ, ତୀବ୍ର OCR ଫଳାଫଳ ଉତ୍ପାଦନ କରିବାକୁ OCR ଇନପୁଟ୍ ପ୍ରତିଛବିଗୁଡ଼ିକୁ ଉଚ୍ଚ ଗୁଣ କରିଥାଏ |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ଡିଜିଟାଲ୍ ଶବ୍ଦ ଏବଂ ଖରାପ ସ୍କାନିଂ ଠିକ୍ କରେ |
Input.Deskew(); // ଘୂର୍ଣ୍ଣନ ଏବଂ ଦୃଷ୍ଟିକୋଣ ଠିକ୍ କରେ |
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ଡିଜିଟାଲ୍ ଶବ୍ଦ ଏବଂ ଖରାପ ସ୍କାନିଂ ଠିକ୍ କରେ |
Input.Deskew(); // ଘୂର୍ଣ୍ଣନ ଏବଂ ଦୃଷ୍ଟିକୋଣ ଠିକ୍ କରେ |
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ଡିଜିଟାଲ୍ ଶବ୍ଦ ଏବଂ ଖରାପ ସ୍କାନିଂ ଠିକ୍ କରେ |
Input.Deskew() ' ଘୂର୍ଣ୍ଣନ ଏବଂ ଦୃଷ୍ଟିକୋଣ ଠିକ୍ କରେ |
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR ପ୍ରତିଛବି ଫିଲ୍ଟରଗୁଡ଼ିକର ତାଲିକା |
OCR କାର୍ଯ୍ୟଦକ୍ଷତା ବୃଦ୍ଧି କରିବାକୁ ଇନପୁଟ୍ ଫିଲ୍ଟର୍ ଯାହା IronOCR ରେ ନିର୍ମିତ:
- OcrInput.Rotate (ଡବଲ୍ ଡ଼ିଗ୍ରୀ) - ଚିତ୍ରକୁ ଅନେକ ଡିଗ୍ରୀ ଘଣ୍ଟା ବୁଲାଇ ଘୂର୍ଣ୍ଣନ କରେ | ଘଣ୍ଟା ବିରୋଧୀ ପାଇଁ, ନକାରାତ୍ମକ ସଂଖ୍ୟା ବ୍ୟବହାର କରନ୍ତୁ |
- OcrInput.Binarize () - ଏହି ପ୍ରତିଛବି ଫିଲ୍ଟରଟି ପ୍ରତ୍ୟେକ ପିକ୍ସେଲକୁ କଳା କିମ୍ବା ଧଳା ରଙ୍ଗରେ ପରିଣତ କରେ | ପୃଷ୍ଠଭୂମିରେ ପାଠ୍ୟର ଅତି ନିମ୍ନ ବିପରୀତ OCR କାର୍ଯ୍ୟଦକ୍ଷତା କ୍ଷେତ୍ରରେ ଉନ୍ନତି ହୋଇପାରେ |
- OcrInput.ToGrayScale () - ଏହି ପ୍ରତିଛବି ଫିଲ୍ଟର ପ୍ରତ୍ୟେକ ପିକ୍ସେଲକୁ ଗ୍ରେସ୍କେଲର ଛାଇରେ ପରିଣତ କରେ | OCR ସଠିକତାକୁ ଉନ୍ନତ କରିବା ସମ୍ଭବ ନୁହେଁ କିନ୍ତୁ ଗତି ଉନ୍ନତ କରିପାରେ |
- OcrInput.Contrast () - ସ୍ୱୟଂଚାଳିତ ଭାବରେ ବିପରୀତ ବୃଦ୍ଧି କରେ | ଏହି ଫିଲ୍ଟର୍ ପ୍ରାୟତ low କମ୍ କଣ୍ଟ୍ରାସ୍ ସ୍କାନରେ OCR ଗତି ଏବଂ ସଠିକତାକୁ ଉନ୍ନତ କରିଥାଏ |
- OcrInput.DeNoise () - ଡିଜିଟାଲ୍ ଶବ୍ଦ ଅପସାରଣ କରେ | ଯେଉଁଠାରେ ଶବ୍ଦ ଆଶା କରାଯାଏ ଏହି ଫିଲ୍ଟରକୁ ବ୍ୟବହାର କରାଯିବା ଉଚିତ |
- OcrInput.Invert () - ପ୍ରତ୍ୟେକ ରଙ୍ଗକୁ ଓଲଟାଇଥାଏ | ଯଥା ଧଳା କଳା ହୋଇଯାଏ: କଳା ଧଳା ହୋଇଯାଏ |
- OcrInput.Dilate () - ଉନ୍ନତ ମର୍ଫୋଲୋଜି | ଚିତ୍ରରେ ବସ୍ତୁର ସୀମା ସହିତ ଡିଲେସନ୍ ପିକ୍ସେଲ ଯୋଗ କରେ | ଏରୋଡର ବିପରୀତ |
- OcrInput.Erode () - ଉନ୍ନତ ମର୍ଫୋଲୋଜି | Erosion Dilate ର ଅବଜେକ୍ଟ boundariesOpposite ଉପରେ ପିକ୍ସେଲ ଅପସାରଣ
- OcrInput.Deskew () - ଏକ ପ୍ରତିଛବି ଘୂର୍ଣ୍ଣନ କରେ ତେଣୁ ଏହା ଉପର ଏବଂ ଅର୍ଗୋଗୋନାଲ୍ ଅଟେ | OCR ପାଇଁ ଏହା ଅତ୍ୟନ୍ତ ଉପଯୋଗୀ କାରଣ ସ୍କେଡ୍ ସ୍କାନ୍ ପାଇଁ ଟେସେରାକ୍ଟ ସହନଶୀଳତା 5 ଡିଗ୍ରୀ ପର୍ଯ୍ୟନ୍ତ କମ୍ ହୋଇପାରେ |
- OcrInput.DeepCleanBackgroundNoise () - ଭାରୀ ପୃଷ୍ଠଭୂମି ଶବ୍ଦ ଅପସାରଣ | ଚରମ ଡକ୍ୟୁମେଣ୍ଟ୍ ପୃଷ୍ଠଭୂମି ଶବ୍ଦ ଜଣାଶୁଣା ହେଲେ କେବଳ ଏହି ଫିଲ୍ଟର୍ ବ୍ୟବହାର କରନ୍ତୁ, କାରଣ ଏହି ଫିଲ୍ଟର୍ ମଧ୍ୟ ସଫା ଡକ୍ୟୁମେଣ୍ଟଗୁଡିକର OCR ସଠିକତା ହ୍ରାସ କରିବାକୁ ବିପଦ ସୃଷ୍ଟି କରିବ ଏବଂ ଏହା CPU ମହଙ୍ଗା ଅଟେ |
- OcrInput.EnhanceResolution - ନିମ୍ନ ମାନର ପ୍ରତିଛବିଗୁଡିକର ବିଭେଦନକୁ ବୃଦ୍ଧି କରିଥାଏ | ଏହି ଫିଲ୍ଟର ପ୍ରାୟତ needed ଆବଶ୍ୟକ ହୁଏ ନାହିଁ କାରଣ OcrInput.MinimumDPI ଏବଂ OcrInput.TargetDPI ସ୍ୱୟଂଚାଳିତ ଭାବରେ ନିମ୍ନ ରେଜୋଲୁସନ ଇନପୁଟ୍ଗୁଡ଼ିକୁ ଧରିବ ଏବଂ ସମାଧାନ କରିବ |
କ୍ଲିନ୍ ବ୍ୟାକ୍ଗ୍ରାଉଣ୍ଡ୍ ନ୍ୟୁଜ୍ | ଏହା ଏକ ସେଟିଂ ଯାହାକି କିଛି ସମୟ ସାପେକ୍ଷ; ଅବଶ୍ୟ, ଏହା ଲାଇବ୍ରେରୀକୁ ସ୍ୱୟଂଚାଳିତ ଭାବରେ ଡିଜିଟାଲ୍ ଶବ୍ଦ, କାଗଜ ଖଣ୍ଡ ଏବଂ ଅନ୍ୟାନ୍ୟ ଅସମ୍ପୂର୍ଣ୍ଣତାକୁ ଏକ ଡିଜିଟାଲ୍ ପ୍ରତିଛବି ମଧ୍ୟରେ ସଫା କରିବାକୁ ଅନୁମତି ଦିଏ ଯାହା ଅନ୍ୟ OCR ଲାଇବ୍ରେରୀଗୁଡ଼ିକ ଦ୍ୱାରା ପ read ଼ିବାରେ ଅସମର୍ଥ ହେବ |
EnhanceContrast ହେଉଛି ଏକ ସେଟିଂ ଯାହାକି ଆଇରନ୍ OCR ସ୍ୱୟଂଚାଳିତ ଭାବରେ ଏକ ପ୍ରତିଛବି ପୃଷ୍ଠଭୂମିରେ ପାଠ୍ୟର ବିପରୀତତା ବ OC ାଇଥାଏ, OCR ର ସଠିକତା ବ increasing ାଇଥାଏ ଏବଂ ସାଧାରଣତ performance କାର୍ଯ୍ୟଦକ୍ଷତା ଏବଂ OCR ର ଗତି ବ increasing ାଇଥାଏ |
EnhanceResolution ହେଉଛି ଏକ ସେଟିଂ ଯାହା ସ୍ୱୟଂଚାଳିତ ଭାବରେ ଲୋ-ରିଜୋଲ୍ୟୁସନ୍ ପ୍ରତିଛବିଗୁଡ଼ିକୁ ଚିହ୍ନଟ କରିବ (ଯାହା 275 dpi ତଳେ) ଏବଂ ସ୍ୱୟଂଚାଳିତ ଭାବରେ ପ୍ରତିଛବିକୁ ଅପସ୍କଲ୍ କରେ ଏବଂ ତାପରେ ସମସ୍ତ ପାଠକୁ ତୀକ୍ଷ୍ଣ କରେ ଯାହା ଦ୍ an ାରା ଏହା ଏକ OCR ଲାଇବ୍ରେରୀ ଦ୍ୱାରା ସମ୍ପୂର୍ଣ୍ଣ ଭାବରେ ପ read ାଯାଇପାରିବ | ଯଦିଓ ଏହି ଅପରେସନ୍ ନିଜେ ସମୟ ସାପେକ୍ଷ, ଏହା ସାଧାରଣତ an ଏକ ପ୍ରତିଛବି ଉପରେ OCR ଅପରେସନ୍ ପାଇଁ ସାମଗ୍ରିକ ସମୟକୁ ହ୍ରାସ କରିଥାଏ |
ଭାଷା ଆଇରନ୍ OCR 22 ଟି ଆନ୍ତର୍ଜାତୀୟ ଭାଷା ପ୍ୟାକ୍ କୁ ସମର୍ଥନ କରେ, ଏବଂ ଏକ OCR ଅପରେସନ୍ ପାଇଁ ପ୍ରୟୋଗ ହେବାକୁ ଥିବା ଏକ କିମ୍ବା ଏକାଧିକ ଭାଷା ବାଛିବା ପାଇଁ ଭାଷା ସେଟିଂ ବ୍ୟବହାର କରାଯାଇପାରିବ |
ଷ୍ଟ୍ରାଟେଜୀ ଆଇରନ୍ OCR ଦୁଇଟି ରଣନୀତିକୁ ସମର୍ଥନ କରେ | ଆମେ ହୁଏତ ଏକ ଡକ୍ୟୁମେଣ୍ଟର ଦ୍ରୁତ ଏବଂ କମ୍ ସଠିକ୍ ସ୍କାନ୍ ପାଇଁ ଯିବାକୁ ବାଛିପାରିବା, କିମ୍ବା ଏକ ଉନ୍ନତ ରଣନୀତି ବ୍ୟବହାର କରିପାରିବା ଯାହାକି ବାକ୍ୟରେ ପରସ୍ପରର ଶବ୍ଦର ପରିସଂଖ୍ୟାନିକ ସମ୍ପର୍କକୁ ଦେଖି OCR ପାଠ୍ୟର ସଠିକତାକୁ ସ୍ୱୟଂଚାଳିତ ଭାବରେ ଉନ୍ନତ କରିବାକୁ କିଛି କୃତ୍ରିମ ବୁଦ୍ଧିମତା ମଡେଲ ବ୍ୟବହାର କରେ | ।
କଲର୍ ସ୍ପେସ୍ ହେଉଛି ଏକ ସେଟିଂ ଯେଉଁଥିରେ ଆମେ ଗ୍ରେସ୍କାଲ୍ କିମ୍ବା ରଙ୍ଗରେ OCR କୁ ବାଛିପାରିବା | ସାଧାରଣତ ,, ଗ୍ରେସ୍କେଲ୍ ହେଉଛି ସର୍ବୋତ୍ତମ ବିକଳ୍ପ | ଅବଶ୍ୟ, ବେଳେବେଳେ ଯେତେବେଳେ ସମାନ ରଙ୍ଗର ପାଠ୍ୟ କିମ୍ବା ପୃଷ୍ଠଭୂମି ଥାଏ କିନ୍ତୁ ବହୁତ ଭିନ୍ନ ରଙ୍ଗ, ଏକ ପୂର୍ଣ୍ଣ ରଙ୍ଗର ରଙ୍ଗ ସ୍ଥାନ ଭଲ ଫଳାଫଳ ପ୍ରଦାନ କରିବ |
ୱାଇଟ୍ ଟେକ୍ସଟୋନ୍ ଡାର୍କ ବ୍ୟାକ୍ଗ୍ରାଉଣ୍ଡ୍ ଚିହ୍ନଟ କରନ୍ତୁ | ସାଧାରଣତ ,, ସମସ୍ତ OCR ଲାଇବ୍ରେରୀଗୁଡ଼ିକ ଧଳା ପୃଷ୍ଠଭୂମିରେ କଳା ପାଠ ଦେଖିବାକୁ ଆଶା କରନ୍ତି | ଏହି ସେଟିଂ ଆଇରନ୍ OCR କୁ ସ୍ୱୟଂଚାଳିତ ଭାବରେ ନକାରାତ୍ମକ, କିମ୍ବା ଧଳା ପାଠ୍ୟ ସହିତ ଗା dark ପୃଷ୍ଠାଗୁଡ଼ିକୁ ଚିହ୍ନଟ କରିବାକୁ ଅନୁମତି ଦିଏ |
ଇନପୁଟ୍ ଇମେଜ୍ ଟାଇପ୍ | ଏହି ସେଟିଙ୍ଗ୍ ଠିକାଦାରଙ୍କୁ OCR ଲାଇବ୍ରେରୀକୁ ଗାଇଡ୍ କରିବାକୁ ଅନୁମତି ଦିଏ କି ଏହା ଏକ ସମ୍ପୂର୍ଣ୍ଣ ଡକ୍ୟୁମେଣ୍ଟ୍ କିମ୍ବା ଏକ ସ୍ନିପେଟ୍, ଯେପରିକି ସ୍କ୍ରିନସଟ୍ ଭଳି |
RotateAndStraighten ହେଉଛି ଏକ ଉନ୍ନତ ସେଟିଂ ଯାହା ଆଇରନ୍ OCR କୁ ଡକ୍ୟୁମେଣ୍ଟ୍ ପ read ିବାର ଅନନ୍ୟ କ୍ଷମତା ଦେଇଥାଏ ଯାହା କେବଳ ଘୂର୍ଣ୍ଣନ ହୋଇନଥାଏ, କିନ୍ତୁ ବୋଧହୁଏ ଦୃଷ୍ଟିକୋଣ ଧାରଣ କରିଥାଏ, ଯେପରିକି ପାଠ୍ୟ ଡକ୍ୟୁମେଣ୍ଟର ଫଟୋଗ୍ରାଫ୍ |
ରିଡ୍ ବାରକୋଡ୍ ହେଉଛି ଏକ ଉପଯୋଗୀ ବ feature ଶିଷ୍ଟ୍ୟ ଯାହା ଆଇରନ୍ OCR କୁ ସ୍ୱୟଂଚାଳିତ ଭାବରେ ପୃଷ୍ଠାରେ ବାରକୋଡ୍ ଏବଂ QR କୋଡ୍ ପ read ିବାକୁ ଅନୁମତି ଦିଏ କାରଣ ଏହା ମଧ୍ୟ ପାଠ୍ୟ ପ read ଼ିଥାଏ , ଏକ ବଡ଼ ଅତିରିକ୍ତ ସମୟ ଭାର ଯୋଗ ନକରି |
ColorDepth। ଏକ ରଙ୍ଗର ଗଭୀରତା ନିର୍ଣ୍ଣୟ କରିବା ପାଇଁ OCR ଲାଇବ୍ରେରୀ ପିକ୍ସେଲରେ କେତେ ବିଟ୍ ବ୍ୟବହାର କରିବ ଏହି ସେଟିଂ ନିର୍ଣ୍ଣୟ କରେ | ଏକ ଉଚ୍ଚ ରଙ୍ଗର ଗଭୀରତା OCR ଗୁଣବତ୍ତା ବ increase ାଇପାରେ, କିନ୍ତୁ OCR ଅପରେସନ୍ ସଂପୂର୍ଣ୍ଣ ହେବା ପାଇଁ ଆବଶ୍ୟକ ସମୟ ମଧ୍ୟ ବ increase ାଇବ |
126 ଭାଷା ପ୍ୟାକ୍ |
ଆଇରନ୍ OCR ଭାଷା ପ୍ୟାକ୍ ମାଧ୍ୟମରେ 126 ଆନ୍ତର୍ଜାତୀୟ ଭାଷାକୁ ସମର୍ଥନ କରେ ଯାହା DLL ଭାବରେ ବିତରଣ ହୁଏ, ଯାହା ଏହି ୱେବସାଇଟରୁ କିମ୍ବା NuGet ପ୍ୟାକେଜ୍ ମ୍ୟାନେଜର୍ ଠାରୁ ଡାଉନଲୋଡ୍ ହୋଇପାରିବ |
ଭାଷାଗୁଡ଼ିକରେ ଜର୍ମାନ, ଫରାସୀ, ଇଂରାଜୀ, ଚାଇନିଜ୍, ଜାପାନିଜ୍ ଏବଂ ଅନେକ ଅନ୍ତର୍ଭୁକ୍ତ | ପାସପୋର୍ଟ MRZ, MICR ଯାଞ୍ଚ, ଆର୍ଥିକ ତଥ୍ୟ, ଲାଇସେନ୍ସ ପ୍ଲେଟ୍ ଏବଂ ଅନ୍ୟାନ୍ୟ ପାଇଁ ବିଶେଷଜ୍ଞ ଭାଷା ପ୍ୟାକ୍ ବିଦ୍ୟମାନ | ଆପଣ ଯେକ any ଣସି ଟେସେରାକ୍ଟ ".traineddata" ଫାଇଲ୍ ମଧ୍ୟ ବ୍ୟବହାର କରିପାରିବେ - ଆପଣ ନିଜେ ସୃଷ୍ଟି କରିଥିବା ଫାଇଲଗୁଡିକ ଅନ୍ତର୍ଭୁକ୍ତ କରି |
ଭାଷା ଉଦାହରଣ |
ଅନ୍ୟ OCR ଭାଷା ବ୍ୟବହାର କରିବା |
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// ଆବଶ୍ୟକ ହେଲେ ପ୍ରତିଛବି ଫିଲ୍ଟର୍ ଯୋଡନ୍ତୁ |
// ଏହି କ୍ଷେତ୍ରରେ, ଚିନ୍ତା ଇନପୁଟ୍ ମଧ୍ୟ ବହୁତ କମ୍ ଗୁଣ ଅଟେ |
// ଆଇରନ୍ ଟେସରାକ୍ଟ ପାରମ୍ପାରିକ ଟେସେରାକ୍ଟ ଯାହା କରିପାରିବ ନାହିଁ ପ read ିପାରେ |
var Result = Ocr.Read(input);
// କନସୋଲ୍ ସହଜରେ ୱିଣ୍ଡୋଜ୍ ରେ ଆରବୀ ପ୍ରିଣ୍ଟ୍ କରିପାରିବ ନାହିଁ |
// ଏହା ବଦଳରେ ଡିସ୍କରେ ସେଭ୍ କରିବା |
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// ଆବଶ୍ୟକ ହେଲେ ପ୍ରତିଛବି ଫିଲ୍ଟର୍ ଯୋଡନ୍ତୁ |
// ଏହି କ୍ଷେତ୍ରରେ, ଚିନ୍ତା ଇନପୁଟ୍ ମଧ୍ୟ ବହୁତ କମ୍ ଗୁଣ ଅଟେ |
// ଆଇରନ୍ ଟେସରାକ୍ଟ ପାରମ୍ପାରିକ ଟେସେରାକ୍ଟ ଯାହା କରିପାରିବ ନାହିଁ ପ read ିପାରେ |
var Result = Ocr.Read(input);
// କନସୋଲ୍ ସହଜରେ ୱିଣ୍ଡୋଜ୍ ରେ ଆରବୀ ପ୍ରିଣ୍ଟ୍ କରିପାରିବ ନାହିଁ |
// ଏହା ବଦଳରେ ଡିସ୍କରେ ସେଭ୍ କରିବା |
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' ଆବଶ୍ୟକ ହେଲେ ପ୍ରତିଛବି ଫିଲ୍ଟର୍ ଯୋଡନ୍ତୁ |
' ଏହି କ୍ଷେତ୍ରରେ, ଚିନ୍ତା ଇନପୁଟ୍ ମଧ୍ୟ ବହୁତ କମ୍ ଗୁଣ ଅଟେ |
' ଆଇରନ୍ ଟେସରାକ୍ଟ ପାରମ୍ପାରିକ ଟେସେରାକ୍ଟ ଯାହା କରିପାରିବ ନାହିଁ ପ read ିପାରେ |
Dim Result = Ocr.Read(input)
' କନସୋଲ୍ ସହଜରେ ୱିଣ୍ଡୋଜ୍ ରେ ଆରବୀ ପ୍ରିଣ୍ଟ୍ କରିପାରିବ ନାହିଁ |
' ଏହା ବଦଳରେ ଡିସ୍କରେ ସେଭ୍ କରିବା |
Result.SaveAsTextFile("arabic.txt")
End Using
ଏକାଧିକ ଭାଷା ଉଦାହରଣ |
ଏକ ସମୟରେ ଏକାଧିକ ଭାଷା ବ୍ୟବହାର କରି OCR ପାଇଁ ମଧ୍ୟ ସମ୍ଭବ | ୟୁନିକୋଡ୍ ଡକ୍ୟୁମେଣ୍ଟରେ ଏହା ଇଂରାଜୀ ଭାଷା ମେଟାଡାଟା ଏବଂ url ପାଇବାକୁ ପ୍ରକୃତରେ ସାହାଯ୍ୟ କରିଥାଏ |
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Oriya);
// ଆମେ ଯେକ any ଣସି ସଂଖ୍ୟକ ଭାଷା ଯୋଗ କରିପାରିବା |
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Oriya);
// ଆମେ ଯେକ any ଣସି ସଂଖ୍ୟକ ଭାଷା ଯୋଗ କରିପାରିବା |
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Oriya)
' ଆମେ ଯେକ any ଣସି ସଂଖ୍ୟକ ଭାଷା ଯୋଗ କରିପାରିବା |
Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
ବିସ୍ତୃତ OCR ଫଳାଫଳ ଅବଜେକ୍ଟସ୍ |
ଆଇରନ୍ OCR ପ୍ରତ୍ୟେକ OCR ଅପରେସନ୍ ପାଇଁ ଏକ OCR ଫଳାଫଳ ବସ୍ତୁ ଫେରସ୍ତ କରେ | ସାଧାରଣତ ,, ଡେଭଲପର୍ମାନେ କେବଳ ଏହି ବସ୍ତୁର ଟେକ୍ସଟ୍ ପ୍ରପର୍ଟି ବ୍ୟବହାର କରନ୍ତି ଯାହା ଇମେଜ୍ ରୁ ଟେକ୍ସଟ୍ ସ୍କାନ୍ ହୋଇଥାଏ | ତଥାପି, OCR ଫଳାଫଳ DOM ଏହାଠାରୁ ଅଧିକ ଉନ୍ନତ ଅଟେ |
using IronOcr;
using System.Drawing; //ବିଧାନସଭା ସନ୍ଦର୍ଭ ଯୋଡନ୍ତୁ |
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ!
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// ଏକ ବୃହତ, ବିସ୍ତୃତ API ଖୋଜିବା ପାଇଁ ଏଠାରେ ଏକ୍ସପ୍ଲୋର୍ କରନ୍ତୁ:
// - ପୃଷ୍ଠାଗୁଡ଼ିକ, ବ୍ଲକଗୁଡିକ, ପାରାଫଫସ୍, ରେଖା, ଶବ୍ଦ, ଅକ୍ଷର |
// - ପ୍ରତିଛବି ରପ୍ତାନି, ଫଣ୍ଟ ସଂଯୋଜକ, ପରିସଂଖ୍ୟାନ ତଥ୍ୟ |
}
using IronOcr;
using System.Drawing; //ବିଧାନସଭା ସନ୍ଦର୍ଭ ଯୋଡନ୍ତୁ |
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ!
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// ଏକ ବୃହତ, ବିସ୍ତୃତ API ଖୋଜିବା ପାଇଁ ଏଠାରେ ଏକ୍ସପ୍ଲୋର୍ କରନ୍ତୁ:
// - ପୃଷ୍ଠାଗୁଡ଼ିକ, ବ୍ଲକଗୁଡିକ, ପାରାଫଫସ୍, ରେଖା, ଶବ୍ଦ, ଅକ୍ଷର |
// - ପ୍ରତିଛବି ରପ୍ତାନି, ଫଣ୍ଟ ସଂଯୋଜକ, ପରିସଂଖ୍ୟାନ ତଥ୍ୟ |
}
Imports IronOcr
Imports System.Drawing 'ବିଧାନସଭା ସନ୍ଦର୍ଭ ଯୋଡନ୍ତୁ |
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ!
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' ଏକ ବୃହତ, ବିସ୍ତୃତ API ଖୋଜିବା ପାଇଁ ଏଠାରେ ଏକ୍ସପ୍ଲୋର୍ କରନ୍ତୁ:
' - ପୃଷ୍ଠାଗୁଡ଼ିକ, ବ୍ଲକଗୁଡିକ, ପାରାଫଫସ୍, ରେଖା, ଶବ୍ଦ, ଅକ୍ଷର |
' - ପ୍ରତିଛବି ରପ୍ତାନି, ଫଣ୍ଟ ସଂଯୋଜକ, ପରିସଂଖ୍ୟାନ ତଥ୍ୟ |
End Using
ପ୍ରଦର୍ଶନ
IronOCR କାର୍ଯ୍ୟଦକ୍ଷତା ବାହାରେ କିମ୍ବା ଇନପୁଟ୍ ପ୍ରତିଛବିଗୁଡ଼ିକୁ ଅଧିକ ରୂପାନ୍ତର କରିବାର ଆବଶ୍ୟକତା ବିନା ବାକ୍ସରେ କାମ କରେ |
ଗତି ବ୍ଲେଜିଙ୍ଗ୍: IronOcr.2020 + 10 ଗୁଣ ଅଧିକ ଦ୍ରୁତ ଅଟେ ଏବଂ ପୂର୍ବ ବିଲ୍ଡ ଅପେକ୍ଷା 250% କମ୍ ତ୍ରୁଟି କରିଥାଏ |
ଅଧିକ ସିଖନ୍ତୁ
C #, VB, F #, କିମ୍ବା ଅନ୍ୟ କ .ଣସି .NET ଭାଷାରେ OCR ବିଷୟରେ ଅଧିକ ଜାଣିବାକୁ, ଦୟାକରି ଆମର ସମ୍ପ୍ରଦାୟ ଟ୍ୟୁଟୋରିଆଲ୍ ପ read ନ୍ତୁ , ଯାହା ଆଇରନ୍ OCR କୁ କିପରି ବ୍ୟବହାର କରାଯାଇପାରିବ ତାହାର ପ୍ରକୃତ ବିଶ୍ୱ ଉଦାହରଣ ଦେଇଥାଏ ଏବଂ କିପରି ଭଲ ଭାବରେ ବାହାରକୁ ଆସିବ ତାହାର ନ୍ୟୁନେସ୍ ଦେଖାଇପାରେ | ଏହି ଲାଇବ୍ରେରୀ |
.NET ବିକାଶକାରୀଙ୍କ ପାଇଁ ଏକ ସମ୍ପୂର୍ଣ୍ଣ ଅବଜେକ୍ଟ ରେଫରେନ୍ସ ମଧ୍ୟ ଉପଲବ୍ଧ |