C# ଏବଂ .NET ରେ ଓଡିଆ OCR |
ଏହି ଡକ୍ୟୁମେଣ୍ଟର ଅନ୍ୟ ସଂସ୍କରଣ:
IronOCR ହେଉଛି ଏକ C# ସଫ୍ଟୱେର୍ ଉପାଦାନ ଯାହାକି .NET କୋଡର୍ମାନଙ୍କୁ ଓଡିଆ ସମେତ 126 ଭାଷାରେ ପ୍ରତିଛବି ଏବଂ PDF ଡକ୍ୟୁମେଣ୍ଟରୁ ପାଠ ପ to ିବାକୁ ଅନୁମତି ଦେଇଥାଏ |
ଏହା ଟେସେରାକ୍ଟର ଏକ ଉନ୍ନତ ଫଙ୍କ, ଯାହା କେବଳ .NET ଡେଭଲପର୍ମାନଙ୍କ ପାଇଁ ନିର୍ମିତ ଏବଂ ଉଭୟ ଗତି ଏବଂ ସଠିକତା ପାଇଁ ନିୟମିତ ଭାବରେ ଅନ୍ୟ ଟେସେରାକ୍ଟ ଇଞ୍ଜିନଗୁଡ଼ିକୁ ଅତିକ୍ରମ କରିଥାଏ |
IronOcr.Languages.Oriya ର ବିଷୟବସ୍ତୁ |
ଏହି ପ୍ୟାକେଜ୍ .NET ପାଇଁ 102 OCR ଭାଷା ଧାରଣ କରିଥାଏ:
- ଓଡିଆ
- ଓଡିଆ ବେଷ୍ଟ |
- ଓଡିଆ ଫାଷ୍ଟ |
- ଓଡିଆ ବର୍ଣ୍ଣମାଳା |
- ଓଡିଆ ଆଲଫାବେଟ୍ ବେଷ୍ଟ |
- ଓଡିଆ ଆଲଫାବେଟ୍ ଫାଷ୍ଟ |
ଡାଉନଲୋଡ୍ କରନ୍ତୁ |
ଓଡ଼ିଆ ଭାଷା ପ୍ୟାକ୍ [ଓଡ଼ିଆ]
* Download as ଜିପ୍
* Install with as https://www.nuget.org/packages/IronOcr.Languages.Oriya/'> NuGet
ସ୍ଥାପନ
ଆମକୁ ପ୍ରଥମେ କରିବାକୁ ହେବ ଆମର .NET ପ୍ରୋଜେକ୍ଟରେ ଆମର ଓଡିଆ OCR ପ୍ୟାକେଜ୍ ସଂସ୍ଥାପନ କରିବା |
PM> Install-Package IronOCR.Languages.Oriya
କୋଡ୍ ଉଦାହରଣ |
ଏହି C# କୋଡ୍ ଉଦାହରଣ ଏକ ପ୍ରତିଛବି କିମ୍ବା PDF ଡକ୍ୟୁମେଣ୍ଟରୁ ଓଡିଆ ପାଠ ପ read େ |
// Install the IronOCR Oriya language package
// PM> Install-Package IronOcr.Languages.Oriya
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Oriya
Ocr.Language = OcrLanguage.Oriya;
// Use the OcrInput with the path to the image
using (var Input = new OcrInput(@"images\Oriya.png"))
{
// Perform OCR to get the result
var Result = Ocr.Read(Input);
// Get the text from the OCR result
var AllText = Result.Text;
}
// Install the IronOCR Oriya language package
// PM> Install-Package IronOcr.Languages.Oriya
using IronOcr;
var Ocr = new IronTesseract();
// Set the language to Oriya
Ocr.Language = OcrLanguage.Oriya;
// Use the OcrInput with the path to the image
using (var Input = new OcrInput(@"images\Oriya.png"))
{
// Perform OCR to get the result
var Result = Ocr.Read(Input);
// Get the text from the OCR result
var AllText = Result.Text;
}
' Install the IronOCR Oriya language package
' PM> Install-Package IronOcr.Languages.Oriya
Imports IronOcr
Private Ocr = New IronTesseract()
' Set the language to Oriya
Ocr.Language = OcrLanguage.Oriya
' Use the OcrInput with the path to the image
Using Input = New OcrInput("images\Oriya.png")
' Perform OCR to get the result
Dim Result = Ocr.Read(Input)
' Get the text from the OCR result
Dim AllText = Result.Text
End Using
IronOCR କାହିଁକି ବାଛନ୍ତୁ?
ଆଇରନ୍ OCR ଏକ ସହଜ-ସଂସ୍ଥାପିତ, ସଂପୂର୍ଣ୍ଣ ଏବଂ ଭଲ-ଡକ୍ୟୁମେଣ୍ଟ୍ ହୋଇଥିବା .NET ସଫ୍ଟୱେର୍ ଲାଇବ୍ରେରୀ |
99.8% + OCR ସଠିକତା ହାସଲ କରିବାକୁ IronOCR ବାଛନ୍ତୁ, କ external ଣସି ବାହ୍ୟ ୱେବ୍ ସେବା, ଚାଲୁଥିବା ଶୁଳ୍କ କିମ୍ବା ଇଣ୍ଟରନେଟରେ ଗୁପ୍ତ ଡକ୍ୟୁମେଣ୍ଟ ପଠାଇ |
ଭାନିଲା ଟେସେରାକ୍ଟ ଉପରେ C# ବିକାଶକାରୀମାନେ କାହିଁକି IronOCR ବାଛନ୍ତି:
- ଗୋଟିଏ DLL କିମ୍ବା NuGet ଭାବରେ ସଂସ୍ଥାପନ କରନ୍ତୁ |
- ବାକ୍ସ ବାହାରେ ଟେସେରାକ୍ଟ 5, 4 ଏବଂ 3 ଇଞ୍ଜିନ୍ ପାଇଁ ଅନ୍ତର୍ଭୂକ୍ତ କରେ |
- ସଠିକତା 99.8% ନିୟମିତ ଟେସେରାକ୍ଟକୁ ଯଥେଷ୍ଟ ଅଧିକ କରିଥାଏ |
- ଜ୍ୱଳନ୍ତ ଗତି ଏବଂ ମଲ୍ଟି ଥ୍ରେଡିଂ |
- MVC, ୱେବ୍ ଆପ୍, ଡେସ୍କଟପ୍, କନସୋଲ୍ ଏବଂ ସର୍ଭର ଆପ୍ଲିକେସନ୍ ସୁସଙ୍ଗତ |
- କାମ କରିବାକୁ କ Ex ଣସି Exes କିମ୍ବା C ++ କୋଡ୍ ନାହିଁ |
- ସମ୍ପୂର୍ଣ୍ଣ PDF OCR ସମର୍ଥନ |
- OCR କୁ ପ୍ରାୟ ଯେକ Image ଣସି ପ୍ରତିଛବି ଫାଇଲ୍ କିମ୍ବା PDF କରିବା ପାଇଁ |
- ପୂର୍ଣ୍ଣ .ନେଟ କୋର, ଷ୍ଟାଣ୍ଡାର୍ଡ ଏବଂ ଫ୍ରେମ୍ ୱର୍କ ସମର୍ଥନ |
- ୱିଣ୍ଡୋଜ୍, ମ୍ୟାକ୍, ଲିନକ୍ସ, ଆଜୁର୍, ଡକର୍, ଲମ୍ବଡା, AWS ରେ ନିୟୋଜିତ କରନ୍ତୁ |
- ବାରକୋଡ୍ ଏବଂ QR କୋଡ୍ ପ Read ନ୍ତୁ |
- XHTML ପରି OCR ରପ୍ତାନି କରନ୍ତୁ |
- ସନ୍ଧାନଯୋଗ୍ୟ PDF ଡକ୍ୟୁମେଣ୍ଟଗୁଡିକ ପାଇଁ OCR ରପ୍ତାନି କରନ୍ତୁ |
- ମଲ୍ଟିଥ୍ରେଡିଂ ସମର୍ଥନ |
- 126 ଆନ୍ତର୍ଜାତୀୟ ଭାଷା ସମସ୍ତ NuGet କିମ୍ବା OcrData ଫାଇଲ୍ ମାଧ୍ୟମରେ ପରିଚାଳିତ |
- ପ୍ରତିଛବି, ସଂଯୋଜକ, ପରିସଂଖ୍ୟାନ ଏବଂ ଫଣ୍ଟ ବାହାର କରନ୍ତୁ | କେବଳ ପାଠ ନୁହେଁ |
- ବାଣିଜ୍ୟିକ ଏବଂ ମାଲିକାନା ପ୍ରୟୋଗଗୁଡ଼ିକ ମଧ୍ୟରେ ଟେସେରାକ୍ଟ OCR କୁ ପୁନ istr ବଣ୍ଟନ ପାଇଁ ବ୍ୟବହାର କରାଯାଇପାରିବ |
ବାସ୍ତବ ବିଶ୍ images ପ୍ରତିଛବି ଏବଂ ଅସମ୍ପୂର୍ଣ୍ଣ ଡକ୍ୟୁମେଣ୍ଟ୍ ଯେପରିକି ଫଟୋଗ୍ରାଫ୍, କିମ୍ବା କମ୍ ରିଜୋଲ୍ୟୁସନ୍ ସ୍କାନ୍ ସହିତ କାମ କରିବାବେଳେ ଲ Iron ହ OCR ଉଜ୍ଜ୍ୱଳ ହୋଇଥାଏ ଯାହା ଡିଜିଟାଲ୍ ଶବ୍ଦ କିମ୍ବା ଅସମ୍ପୂର୍ଣ୍ଣତା ଥାଇପାରେ |
.NET ପ୍ଲାଟଫର୍ମ ପାଇଁ ଅନ୍ୟାନ୍ୟ ମାଗଣା OCR ଲାଇବ୍ରେରୀଗୁଡ଼ିକ ଏହିପରି ଅନ୍ୟ .net ଟେସେରାକ୍ଟ API ଏବଂ ୱେବ୍ ସେବାଗୁଡିକ ଏହି ବାସ୍ତବ ଦୁନିଆ ବ୍ୟବହାର କ୍ଷେତ୍ରରେ ଏତେ ଭଲ ପ୍ରଦର୍ଶନ କରେ ନାହିଁ |
ଟେସେରାକ୍ଟ 5 ସହିତ OCR - C# ରେ କୋଡିଂ ଆରମ୍ଭ କରନ୍ତୁ |
ନିମ୍ନରେ କୋଡ୍ ନମୁନା ଦର୍ଶାଏ ଯେ C# କିମ୍ବା VB .NET ବ୍ୟବହାର କରି ଏକ ପ୍ରତିଛବିରୁ ପାଠ ପ to ିବା କେତେ ସହଜ |
OneLiner
// Quick one-line OCR text extraction from an image
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
// Quick one-line OCR text extraction from an image
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
' Quick one-line OCR text extraction from an image
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
ବିନ୍ୟାସଯୋଗ୍ୟ ହେଲୋ ୱାର୍ଲ୍ଡ |
// PM> Install-Package IronOCR.Languages.Oriya
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
// Add an image to the OCR input
Input.AddImage("images/sample.jpeg");
// You can add any number of images here
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Oriya
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
// Add an image to the OCR input
Input.AddImage("images/sample.jpeg");
// You can add any number of images here
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Oriya
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput()
' Add an image to the OCR input
Input.AddImage("images/sample.jpeg")
' You can add any number of images here
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
C# PDF OCR |
ସମାନ ପଦ୍ଧତି ଯେକ PDF ଣସି PDF ଡକ୍ୟୁମେଣ୍ଟରୁ ପାଠ ବାହାର କରିବା ପାଇଁ ସମାନ ଭାବରେ ବ୍ୟବହୃତ ହୋଇପାରେ |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Specific PDF pages can also be selected for OCR
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count} Pages");
// Outputs page count for each page in the PDF
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Specific PDF pages can also be selected for OCR
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count} Pages");
// Outputs page count for each page in the PDF
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' Specific PDF pages can also be selected for OCR
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count} Pages")
' Outputs page count for each page in the PDF
End Using
ମଲ୍ଟିପେଜ୍ TIFF ପାଇଁ OCR |
ଏକାଧିକ ପୃଷ୍ଠା ଡକ୍ୟୁମେଣ୍ଟ୍ ସହିତ OCR ପଠନ TIFF ଫାଇଲ୍ ଫର୍ମାଟ୍ | ସନ୍ଧାନଯୋଗ୍ୟ ପାଠ୍ୟ ସହିତ TIFF କୁ ସିଧାସଳଖ ଏକ PDF ଫାଇଲରେ ରୂପାନ୍ତର କରାଯାଇପାରେ |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("multi-frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("multi-frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput()
Input.AddMultiFrameTiff("multi-frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ବାରକୋଡ୍ ଏବଂ QR |
ଆଇରନ୍ OCR ର ଏକ ଅନନ୍ୟ ବ feature ଶିଷ୍ଟ୍ୟ ହେଉଛି ଏହା ଟେକ୍ସଟ୍ ପାଇଁ ସ୍କାନ କରୁଥିବାବେଳେ ଡକ୍ୟୁମେଣ୍ଟରୁ ବାରକୋଡ୍ ଏବଂ QR କୋଡ୍ ପ read ିପାରେ | OcrResult.OcrBarcode
ଶ୍ରେଣୀର ଉଦାହରଣଗୁଡିକ ପ୍ରତ୍ୟେକ ସ୍କାନ ହୋଇଥିବା ବାରକୋଡ୍ ବିଷୟରେ ଜଣା ହୋଇଥାଏ |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// Type and Position properties are also available for each barcode
}
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// Type and Position properties are also available for each barcode
}
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' Type and Position properties are also available for each barcode
Next Barcode
End Using
ପ୍ରତିଛବିଗୁଡ଼ିକର ନିର୍ଦ୍ଦିଷ୍ଟ କ୍ଷେତ୍ର ଉପରେ OCR |
ସମସ୍ତ ଆଇରନ୍ OCR ର ସ୍କାନିଂ ଏବଂ ପ reading ଼ିବା ପଦ୍ଧତିଗୁଡ଼ିକ କେଉଁ ପୃଷ୍ଠାର କେଉଁ ଅଂଶରୁ ଆମେ ପାଠ ପ to ିବାକୁ ଚାହୁଁଛୁ ତାହା ନିର୍ଦ୍ଦିଷ୍ଟ କରିବାର କ୍ଷମତା ଦେଇଥାଏ | ଯେତେବେଳେ ଆମେ ମାନକ ଫର୍ମଗୁଡିକୁ ଦେଖୁ ଏହା ଅତ୍ୟନ୍ତ ଉପଯୋଗୀ ଏବଂ ଏକ ଭୟଙ୍କର ସମୟ ବଞ୍ଚାଇ ପାରିବ ଏବଂ ଦକ୍ଷତା ବୃଦ୍ଧି କରିପାରିବ |
ଫସଲ ଅଞ୍ଚଳ ବ୍ୟବହାର କରିବାକୁ, ଆମକୁ System.Drawing
ଏକ ସିଷ୍ଟମ୍ ରେଫରେନ୍ସ ଯୋଡିଵାକୁ ପଡିବ ଯାହା System.Drawing.Rectangle
ବସ୍ତୁ ବ୍ୟବହାର କରିପାରିବା |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle()
{
X = 215, Y = 1250, Height = 280, Width = 1335
// Measurements are in pixels
};
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle()
{
X = 215, Y = 1250, Height = 280, Width = 1335
// Measurements are in pixels
};
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ନିମ୍ନ ଗୁଣବତ୍ତା ସ୍କାନ୍ ପାଇଁ OCR |
ଆଇରନ୍ OCR OcrInput
ଶ୍ରେଣୀ ସ୍କାନ୍ ଗୁଣବତ୍ତା ପ୍ରବଧାନକୁ ନିର୍ଦ୍ଦେଶ କରେ ଏବଂ ଏକ ସଂପୂର୍ଣ୍ଣ ସମାଧାନ ଦେଇଥାଏ ଯାହା ସଡ଼ିଲା ଏବଂ ଅସୁନ୍ଦର ସ୍କାନ ବିିମୋକ୍ତ କରିପାରେ ଏବଂ ଡିଜିଟାଲ୍ ଶବ୍ଦ କିମ୍ବା ଅସମ୍ପୂର୍ଣ୍ଣତାକୁ ଠିକ କରିପାରେ |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // Corrects digital noise and poor scanning
Input.Deskew(); // Corrects rotation and perspective
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // Corrects digital noise and poor scanning
Input.Deskew(); // Corrects rotation and perspective
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' Corrects digital noise and poor scanning
Input.Deskew() ' Corrects rotation and perspective
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ଏକ ସନ୍ଧାନଯୋଗ୍ୟ PDF ଭାବରେ OCR ଫଳାଫଳ ରପ୍ତାନି କରନ୍ତୁ |
କପି ଯୋଗ୍ୟ ପାଠ୍ୟ ଷ୍ଟ୍ରିଙ୍ଗ ସହିତ PDF କୁ ପ୍ରତିଛବି | ସର୍ଚ୍ଚ ଇଞ୍ଜିନ୍ ଏବଂ ଡାଟାବେସ୍ ଦ୍ୱାରା ସୂଚୀବଦ୍ଧ ହୋଇପାରିବ |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput()
Input.Title = "Quarterly Report"
Input.AddImage("image1.jpeg")
Input.AddImage("image2.png")
Input.AddImage("image3.gif")
Dim Result = Ocr.Read(Input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
ସନ୍ଧାନଯୋଗ୍ୟ PDF ରୂପାନ୍ତର ପାଇଁ TIFF |
ଏକ TIFF ଡକ୍ୟୁମେଣ୍ଟ୍ (କିମ୍ବା ପ୍ରତିଛବି ଫାଇଲଗୁଡିକର କ group ଣସି ଗୋଷ୍ଠୀ) କୁ ଏକ ସନ୍ଧାନଯୋଗ୍ୟ PDF କୁ ସିଧାସଳଖ ରୂପାନ୍ତର କରନ୍ତୁ ଯାହା ଇଣ୍ଟରନେଟ୍, ୱେବସାଇଟ୍ ଏବଂ ଗୁଗୁଲ୍ ସର୍ଚ୍ଚ ଇଞ୍ଜିନ୍ ଦ୍ୱାରା ସୂଚୀବଦ୍ଧ ହୋଇପାରିବ |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput()
Input.AddMultiFrameTiff("example.tiff")
Dim Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf")
End Using
OCR ଫଳାଫଳକୁ HTML ଭାବରେ ରପ୍ତାନି କରନ୍ତୁ |
XHTML ରୂପାନ୍ତର ପାଇଁ OCR ପ୍ରତିଛବି |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
var Result = Ocr.Read(Input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput())
{
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
var Result = Ocr.Read(Input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput()
Input.Title = "Html Title"
Input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(Input)
Result.SaveAsHocrFile("results.html")
End Using
OCR ପ୍ରତିଛବି ଉନ୍ନତି ଫିଲ୍ଟର୍ |
OCR ଆବଶ୍ୟକତା ➗ ବାଢନକୁ OcrInput
ବସ୍ତୁଗୁଡ଼ିକ ପାଇଁ ଦିଆଏ ସମାଧାନୀୟ ଫିଲ୍ଟର୍ ଉପଲବ୍ଧ |
ପ୍ରତିଛବି ଉନ୍ନତି ସଂକେତ ଉଦାହରଣ |
ଉପରୁତ, ବାହାର ମାଇନାମରୀ କାର ଟ୍ୟାରୋଉ ନଦେଇଲା |
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // Corrects digital noise and poor scanning
Input.Deskew(); // Corrects rotation and perspective
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // Corrects digital noise and poor scanning
Input.Deskew(); // Corrects rotation and perspective
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' Corrects digital noise and poor scanning
Input.Deskew() ' Corrects rotation and perspective
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR ପ୍ରତିଛବି ଫିଲ୍ଟରଗୁଡ଼ିକର ତାଲିକା |
OCR କାର୍ଯ୍ୟଦକ୍ଷତା ବୃଦ୍ଧି କରିବାକୁ ଇନପୁଟ୍ ଫିଲ୍ଟର୍ ଯାହା IronOCR ରେ ନିର୍ମିତ:
- OcrInput.Rotate(double degrees) - Rotates the image a number of degrees clockwise. For counterclockwise, use a negative number.
- OcrInput.Binarize() - This image filter turns each pixel black or white. Useful where there is low-contrast text on a background and OCR performance improves.
- OcrInput.ToGrayScale() - Converts each pixel to grayscale. Might not increase OCR accuracy but can improve speed.
- OcrInput.Contrast() - Automatically increases contrast. Improves OCR speed and accuracy especially on low contrast scans.
- OcrInput.DeNoise() - Removes digital noise. Should be used wherever noise is expected.
- OcrInput.Invert() - Inverts each color (e.g., white becomes black; black becomes white).
- OcrInput.Dilate() - Enhanced morphology, adds pixels around the boundary of objects in the image. Opposite of Erode.
- OcrInput.Erode() - Enhanced morphology, removes pixels on object boundaries. Opposite of Dilate.
- OcrInput.Deskew() - Rotates image so that it is upright and orthogonally aligned. Essential for accuracy, the 5-degree tolerance of Tesseract is improved.
- OcrInput.DeepCleanBackgroundNoise() - Removes heavy background noise. Use only where known, as it can lower OCR accuracy on clean documents and is CPU intensive.
- OcrInput.EnhanceResolution - Increases resolution of low-quality images. Automatically handles low res inputs using MinimumDPI and TargetDPI properties.
Clean Background Noise is a setting that is time-sensitive but allows the library to automatically clean digital noise, paper shreds, and other artifacts, which other libraries cannot.
Enhance Contrast automatically increases image text contrast and improves OCR accuracy, thereby generally increasing performance and speed.
Enhance Resolution detects low-resolution images (<275 dpi) and auto-upscales them for sharp text. This operation is timely but often faster overall for OCR ops.
Language settings support multiple languages, useful for translating foreign documents.
126 ଭାଷା ପ୍ୟାକ୍ |
IronOCR supports 126 ଆନ୍ତର୍ଜାତୀୟ ମାଗଣା languages distributed as DLLs; downloadable from this website or NuGet.
Included languages span German, French, English, Chinese, Japanese, and many more. Specialist packages exist for MRZ, MICR, license plates, and others. Any Tesseract ".traineddata" files you have can be used, including your custom-made ones.
Language Example |
Using another OCR language:
using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Add image noise filters if needed
// In this case, the input might be of very poor quality
// IronTesseract can read what conventional ones cannot
var Result = Ocr.Read(input);
// Saving Arabic text - cannot print Arabic easily in console on Windows
Result.SaveAsTextFile("arabic.txt");
}
using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Add image noise filters if needed
// In this case, the input might be of very poor quality
// IronTesseract can read what conventional ones cannot
var Result = Ocr.Read(input);
// Saving Arabic text - cannot print Arabic easily in console on Windows
Result.SaveAsTextFile("arabic.txt");
}
Imports IronOcr
' PM> Install IronOcr.Languages.Arabic
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Add image noise filters if needed
' In this case, the input might be of very poor quality
' IronTesseract can read what conventional ones cannot
Dim Result = Ocr.Read(input)
' Saving Arabic text - cannot print Arabic easily in console on Windows
Result.SaveAsTextFile("arabic.txt")
End Using
Multiple Language Example |
Using multiple languages in one go is possible, aiding in receiving metadata in multiple languages from runtime OCR:
using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Oriya);
// Any number of additional languages can be added
using (var input = new OcrInput())
{
input.Add("multi-language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Oriya);
// Any number of additional languages can be added
using (var input = new OcrInput())
{
input.Add("multi-language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
Imports IronOcr
' PM> Install IronOcr.Languages.ChineseSimplified
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Oriya)
' Any number of additional languages can be added
Using input = New OcrInput()
input.Add("multi-language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
ାସାଧାରଣ OCR ଫଳାଫଳ ଅବଜେକ୍ଟସ୍ |
IronOCR provides robust OCR result object for each operation. Developers can access text but the result DOM is far more extensive.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; // Important!
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// Explore a large, detailed API here:
// - Pages, Blocks, Paragraphs, Lines, Words, Characters |
// - Image exports, Font Interactions, Statistical data |
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Oriya;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; // Important!
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// Explore a large, detailed API here:
// - Pages, Blocks, Paragraphs, Lines, Words, Characters |
// - Image exports, Font Interactions, Statistical data |
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Oriya
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True ' Important!
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' Explore a large, detailed API here:
' - Pages, Blocks, Paragraphs, Lines, Words, Characters |
' - Image exports, Font Interactions, Statistical data |
End Using
ପ୍ରଦର୍ଶନ
IronOCR performs efficiently out-of-the-box without extra transformation steps.
Blazing fast: IronOcr.2020 is 10 times faster and 250% less error-prone than previous builds.
ଅଧିକ ସିଖନ୍ତୁ
For more on OCR in C#, VB, F#, or any .NET language, please read our community tutorials, or see how best to make use of its nuances in real-world example applications using this library.
A full object reference is also available for .NET developers.