ಸಿ # ಮತ್ತು .ನೆಟ್ನಲ್ಲಿ ಕನ್ನಡ ಒಸಿಆರ್

ಈ ಡಾಕ್ಯುಮೆಂಟ್‌ನ ಇತರ ಆವೃತ್ತಿಗಳು:

ಐರನ್‌ಒಸಿಆರ್ ಎನ್ನುವುದು ಸಿ # ಸಾಫ್ಟ್‌ವೇರ್ ಘಟಕವಾಗಿದ್ದು, ಕನ್ನಡ ಸೇರಿದಂತೆ 126 ಭಾಷೆಯಲ್ಲಿ ಚಿತ್ರಗಳು ಮತ್ತು ಪಿಡಿಎಫ್ ದಾಖಲೆಗಳಿಂದ ಪಠ್ಯವನ್ನು ಓದಲು ನೆಟ್ ಕೋಡರ್ ಗಳು ಅವಕಾಶ ಮಾಡಿಕೊಡುತ್ತವೆ.

ಇದು ಟೆಸ್ಸೆರಾಕ್ಟ್‌ನ ಸುಧಾರಿತ ಫೋರ್ಕ್ ಆಗಿದೆ, ಇದನ್ನು .NET ಡೆವಲಪರ್‌ಗಳಿಗಾಗಿ ಪ್ರತ್ಯೇಕವಾಗಿ ನಿರ್ಮಿಸಲಾಗಿದೆ ಮತ್ತು ವೇಗ ಮತ್ತು ನಿಖರತೆ ಎರಡಕ್ಕೂ ನಿಯಮಿತವಾಗಿ ಇತರ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಎಂಜಿನ್‌ಗಳನ್ನು ಮೀರಿಸುತ್ತದೆ.

IronOcr.Languages.Kannada ನ ವಿಷಯಗಳು

ಈ ಪ್ಯಾಕೇಜ್ .NET ಗಾಗಿ 114 ಒಸಿಆರ್ ಭಾಷೆಗಳನ್ನು ಒಳಗೊಂಡಿದೆ:

  • ಕನ್ನಡ
  • ಕನ್ನಡಬೆಸ್ಟ್
  • ಕನ್ನಡ ಫಾಸ್ಟ್
  • ಕನ್ನಡ ಆಲ್ಫಾಬೆಟ್
  • ಕನ್ನಡ ಆಲ್ಫಾಬೆಟ್ ಬೆಸ್ಟ್
  • ಕನ್ನಡ ಆಲ್ಫಾಬೆಟ್ ಫಾಸ್ಟ್

ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ

ಕನ್ನಡ ಭಾಷಾ ಪ್ಯಾಕ್ [
* Download as ಜಿಪ್
* Install with as
https://www.nuget.org/packages/IronOcr.Languages.Kannada/'> ನುಜೆಟ್

ಅನುಸ್ಥಾಪನ

ನಾವು ಮಾಡಬೇಕಾಗಿರುವುದು ನಿಮ್ಮ ಕನ್ನಡ ಒಸಿಆರ್ ಪ್ಯಾಕೇಜ್ ಅನ್ನು ನಿಮ್ಮ .NET ಯೋಜನೆಗೆ ಸ್ಥಾಪಿಸುವುದು.

PM> Install-Package IronOCR.Languages.Kannada

ಕೋಡ್ ಉದಾಹರಣೆ

ಈ ಸಿ # ಕೋಡ್ ಉದಾಹರಣೆಯು ಚಿತ್ರ ಅಥವಾ ಪಿಡಿಎಫ್ ಡಾಕ್ಯುಮೆಂಟ್‌ನಿಂದ ಕನ್ನಡ ಪಠ್ಯವನ್ನು ಓದುತ್ತದೆ.

//PM> Install-Package IronOcr.Languages.Kannada
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput(@"images\Kannada.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Kannada
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput(@"images\Kannada.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Kannada
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using Input = New OcrInput("images\Kannada.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

ಐರನ್‌ಒಸಿಆರ್ ಅನ್ನು ಏಕೆ ಆರಿಸಬೇಕು?

ಐರನ್ ಒಸಿಆರ್ ಸ್ಥಾಪಿಸಲು ಸುಲಭ, ಸಂಪೂರ್ಣ ಮತ್ತು ಉತ್ತಮವಾಗಿ ದಾಖಲಿಸಲಾದ .ನೆಟ್ ಸಾಫ್ಟ್‌ವೇರ್ ಲೈಬ್ರರಿಯಾಗಿದೆ.

ಯಾವುದೇ ಬಾಹ್ಯ ವೆಬ್ ಸೇವೆಗಳು, ನಡೆಯುತ್ತಿರುವ ಶುಲ್ಕಗಳು ಅಥವಾ ಅಂತರ್ಜಾಲದಲ್ಲಿ ಗೌಪ್ಯ ದಾಖಲೆಗಳನ್ನು ಕಳುಹಿಸದೆ 99.8% + ಒಸಿಆರ್ ನಿಖರತೆಯನ್ನು ಸಾಧಿಸಲು ಐರನ್‌ಒಸಿಆರ್ ಆಯ್ಕೆಮಾಡಿ.

ಸಿ # ಡೆವಲಪರ್‌ಗಳು ವೆನಿಲ್ಲಾ ಟೆಸ್ಸೆರಾಕ್ಟ್ಗಿಂತ ಐರನ್‌ಒಸಿಆರ್ ಅನ್ನು ಏಕೆ ಆರಿಸುತ್ತಾರೆ:

  • ಒಂದೇ ಡಿಎಲ್ಎಲ್ ಅಥವಾ ನುಜೆಟ್ ಆಗಿ ಸ್ಥಾಪಿಸಿ
  • ಪೆಟ್ಟಿಗೆಯ ಹೊರಗೆ ಟೆಸ್ಸೆರಾಕ್ಟ್ 5, 4 ಮತ್ತು 3 ಎಂಜಿನ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿದೆ.
  • ನಿಖರತೆ 99.8% ಸಾಮಾನ್ಯ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಅನ್ನು ಗಮನಾರ್ಹವಾಗಿ ಮೀರಿಸುತ್ತದೆ.
  • ಪ್ರಜ್ವಲಿಸುವ ವೇಗ ಮತ್ತು ಮಲ್ಟಿ ಥ್ರೆಡಿಂಗ್
  • ಎಂವಿಸಿ, ವೆಬ್‌ಅಪ್, ಡೆಸ್ಕ್‌ಟಾಪ್, ಕನ್ಸೋಲ್ ಮತ್ತು ಸರ್ವರ್ ಅಪ್ಲಿಕೇಶನ್ ಹೊಂದಾಣಿಕೆಯಾಗಿದೆ
  • ಕೆಲಸ ಮಾಡಲು ಎಕ್ಸೆಸ್ ಅಥವಾ ಸಿ ++ ಕೋಡ್ ಇಲ್ಲ
  • ಪೂರ್ಣ ಪಿಡಿಎಫ್ ಒಸಿಆರ್ ಬೆಂಬಲ
  • ಒಸಿಆರ್ ಅನ್ನು ಯಾವುದೇ ಇಮೇಜ್ ಫೈಲ್ ಅಥವಾ ಪಿಡಿಎಫ್ ಮಾಡಲು
  • ಪೂರ್ಣ .ನೆಟ್ ಕೋರ್, ಸ್ಟ್ಯಾಂಡರ್ಡ್ ಮತ್ತು ಫ್ರೇಮ್‌ವರ್ಕ್ ಬೆಂಬಲ
  • ವಿಂಡೋಸ್, ಮ್ಯಾಕ್, ಲಿನಕ್ಸ್, ಅಜುರೆ, ಡಾಕರ್, ಲ್ಯಾಂಬ್ಡಾ, ಎಡಬ್ಲ್ಯೂಎಸ್ನಲ್ಲಿ ನಿಯೋಜಿಸಿ
  • ಬಾರ್‌ಕೋಡ್‌ಗಳು ಮತ್ತು ಕ್ಯೂಆರ್ ಕೋಡ್‌ಗಳನ್ನು ಓದಿ
  • XHTML ಗೆ OCR ಅನ್ನು ರಫ್ತು ಮಾಡಿ
  • ಹುಡುಕಬಹುದಾದ ಪಿಡಿಎಫ್ ದಾಖಲೆಗಳಿಗೆ ಒಸಿಆರ್ ಅನ್ನು ರಫ್ತು ಮಾಡಿ
  • ಮಲ್ಟಿಥ್ರೆಡಿಂಗ್ ಬೆಂಬಲ
  • 126 ಅಂತರರಾಷ್ಟ್ರೀಯ ಭಾಷೆಗಳನ್ನು ನುಜೆಟ್ ಅಥವಾ ಒಕ್ರ್ಡೇಟಾ ಫೈಲ್‌ಗಳ ಮೂಲಕ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ
  • ಚಿತ್ರಗಳು, ನಿರ್ದೇಶಾಂಕಗಳು, ಅಂಕಿಅಂಶಗಳು ಮತ್ತು ಫಾಂಟ್‌ಗಳನ್ನು ಹೊರತೆಗೆಯಿರಿ. ಕೇವಲ ಪಠ್ಯವಲ್ಲ.
  • ವಾಣಿಜ್ಯ ಮತ್ತು ಸ್ವಾಮ್ಯದ ಅಪ್ಲಿಕೇಶನ್‌ಗಳಲ್ಲಿ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಒಸಿಆರ್ ಅನ್ನು ಮರುಹಂಚಿಕೆ ಮಾಡಲು ಬಳಸಬಹುದು.

ನೈಜ ಪ್ರಪಂಚದ ಚಿತ್ರಗಳು ಮತ್ತು s ಾಯಾಚಿತ್ರಗಳಂತಹ ಅಪೂರ್ಣ ದಾಖಲೆಗಳೊಂದಿಗೆ ಅಥವಾ ಡಿಜಿಟಲ್ ಶಬ್ದ ಅಥವಾ ಅಪೂರ್ಣತೆಗಳನ್ನು ಹೊಂದಿರುವ ಕಡಿಮೆ ರೆಸಲ್ಯೂಶನ್‌ನ ಸ್ಕ್ಯಾನ್‌ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವಾಗ ಐರನ್ ಒಸಿಆರ್ ಹೊಳೆಯುತ್ತದೆ.

.NET ಪ್ಲಾಟ್‌ಫಾರ್ಮ್‌ಗಾಗಿ ಇತರ ಉಚಿತ ಒಸಿಆರ್ ಗ್ರಂಥಾಲಯಗಳು ಇತರ .ನೆಟ್ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಎಪಿಐಗಳು ಮತ್ತು ವೆಬ್ ಸೇವೆಗಳು ಈ ನೈಜ ಪ್ರಪಂಚದ ಬಳಕೆಯ ಸಂದರ್ಭಗಳಲ್ಲಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವುದಿಲ್ಲ.

ಟೆಸ್ಸೆರಾಕ್ಟ್ 5 ರೊಂದಿಗಿನ ಒಸಿಆರ್ - ಸಿ # ನಲ್ಲಿ ಕೋಡಿಂಗ್ ಪ್ರಾರಂಭಿಸಿ

ಕೆಳಗಿನ ಕೋಡ್ ಮಾದರಿಯು ಸಿ # ಅಥವಾ ವಿಬಿ .ನೆಟ್ ಬಳಸಿ ಚಿತ್ರದಿಂದ ಪಠ್ಯವನ್ನು ಓದುವುದು ಎಷ್ಟು ಸುಲಭ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ.

ಒನ್‌ಲೈನರ್

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

ಕಾನ್ಫಿಗರ್ ಮಾಡಬಹುದಾದ ಹಲೋ ವರ್ಲ್ಡ್

// PM> Install-Package IronOCR.Languages.Kannada
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... ನೀವು ಯಾವುದೇ ಸಂಖ್ಯೆಯ ಚಿತ್ರಗಳನ್ನು ಸೇರಿಸಬಹುದು
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Kannada
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... ನೀವು ಯಾವುದೇ ಸಂಖ್ಯೆಯ ಚಿತ್ರಗಳನ್ನು ಸೇರಿಸಬಹುದು
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Kannada
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

ಸಿ # ಪಿಡಿಎಫ್ ಒಸಿಆರ್

ಯಾವುದೇ ಪಿಡಿಎಫ್ ಡಾಕ್ಯುಮೆಂಟ್‌ನಿಂದ ಪಠ್ಯವನ್ನು ಹೊರತೆಗೆಯಲು ಇದೇ ವಿಧಾನವನ್ನು ಬಳಸಬಹುದು.

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// ನಾವು ಒಸಿಆರ್‌ಗೆ ನಿರ್ದಿಷ್ಟ ಪಿಡಿಎಫ್ ಪುಟ ಸಂಖ್ಯೆಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಬಹುದು

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// ಪಿಡಿಎಫ್‌ನ ಪ್ರತಿ ಪುಟಕ್ಕೆ 1 ಪುಟ
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// ನಾವು ಒಸಿಆರ್‌ಗೆ ನಿರ್ದಿಷ್ಟ ಪಿಡಿಎಫ್ ಪುಟ ಸಂಖ್ಯೆಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಬಹುದು

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// ಪಿಡಿಎಫ್‌ನ ಪ್ರತಿ ಪುಟಕ್ಕೆ 1 ಪುಟ
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' ನಾವು ಒಸಿಆರ್‌ಗೆ ನಿರ್ದಿಷ್ಟ ಪಿಡಿಎಫ್ ಪುಟ ಸಂಖ್ಯೆಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಬಹುದು

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' ಪಿಡಿಎಫ್‌ನ ಪ್ರತಿ ಪುಟಕ್ಕೆ 1 ಪುಟ
End Using
VB   C#

ಮಲ್ಟಿಪೇಜ್ ಟಿಐಎಫ್‌ಎಫ್‌ಗಳಿಗಾಗಿ ಒಸಿಆರ್

ಒಸಿಆರ್ ಬಹು ಪುಟ ದಾಖಲೆಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ಟಿಐಎಫ್ಎಫ್ ಫೈಲ್ ಸ್ವರೂಪವನ್ನು ಓದುವುದು. ಹುಡುಕಬಹುದಾದ ಪಠ್ಯದೊಂದಿಗೆ ಟಿಐಎಫ್ಎಫ್ ಅನ್ನು ನೇರವಾಗಿ ಪಿಡಿಎಫ್ ಫೈಲ್ ಆಗಿ ಪರಿವರ್ತಿಸಬಹುದು.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

ಬಾರ್‌ಕೋಡ್‌ಗಳು ಮತ್ತು ಕ್ಯೂಆರ್

ಐರನ್ ಒಸಿಆರ್‌ನ ಒಂದು ವಿಶಿಷ್ಟ ಲಕ್ಷಣವೆಂದರೆ ಅದು ಪಠ್ಯಕ್ಕಾಗಿ ಸ್ಕ್ಯಾನ್ ಮಾಡುವಾಗ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳಿಂದ ಬಾರ್‌ಕೋಡ್‌ಗಳು ಮತ್ತು ಕ್ಯೂಆರ್ ಕೋಡ್‌ಗಳನ್ನು ಓದಬಹುದು. OcrResult.OcrBarcode ವರ್ಗದ ನಿದರ್ಶನಗಳು ಡೆವಲಪರ್‌ಗೆ ಪ್ರತಿ ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಬಾರ್‌ಕೋಡ್ ಬಗ್ಗೆ ವಿವರವಾದ ಮಾಹಿತಿಯನ್ನು ನೀಡುತ್ತದೆ.

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// ಪ್ರಕಾರ ಮತ್ತು ಸ್ಥಳ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಸಹ ಬಹಿರಂಗಪಡಿಸಲಾಗಿದೆ
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// ಪ್ರಕಾರ ಮತ್ತು ಸ್ಥಳ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಸಹ ಬಹಿರಂಗಪಡಿಸಲಾಗಿದೆ
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' ಪ್ರಕಾರ ಮತ್ತು ಸ್ಥಳ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಸಹ ಬಹಿರಂಗಪಡಿಸಲಾಗಿದೆ
Next Barcode
End Using
VB   C#

ಚಿತ್ರಗಳ ನಿರ್ದಿಷ್ಟ ಪ್ರದೇಶಗಳಲ್ಲಿ ಒಸಿಆರ್

ಐರನ್ ಒಸಿಆರ್ನ ಎಲ್ಲಾ ಸ್ಕ್ಯಾನಿಂಗ್ ಮತ್ತು ಓದುವ ವಿಧಾನಗಳು ನಾವು ಪಠ್ಯವನ್ನು ಓದಲು ಬಯಸುವ ಪುಟ ಅಥವಾ ಪುಟಗಳ ಯಾವ ಭಾಗವನ್ನು ನಿಖರವಾಗಿ ಸೂಚಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಒದಗಿಸುತ್ತದೆ. ನಾವು ಪ್ರಮಾಣೀಕೃತ ರೂಪಗಳನ್ನು ನೋಡುತ್ತಿರುವಾಗ ಇದು ತುಂಬಾ ಉಪಯುಕ್ತವಾಗಿದೆ ಮತ್ತು ಸಾಕಷ್ಟು ಸಮಯವನ್ನು ಉಳಿಸಬಹುದು ಮತ್ತು ದಕ್ಷತೆಯನ್ನು ಸುಧಾರಿಸಬಹುದು.

ಬೆಳೆ ಪ್ರದೇಶಗಳನ್ನು ಬಳಸಲು, ನಾವು System.Drawing ಸಿಸ್ಟಮ್ ರೆಫರೆನ್ಸ್ ಅನ್ನು ಸೇರಿಸುವ ಅಗತ್ಯವಿರುತ್ತದೆ ಇದರಿಂದ ನಾವು System.Drawing.Rectangle ಆಬ್ಜೆಕ್ಟ್ ಅನ್ನು ಬಳಸಬಹುದು.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ಆಯಾಮಗಳು px ನಲ್ಲಿವೆ

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ಆಯಾಮಗಳು px ನಲ್ಲಿವೆ

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' ಆಯಾಮಗಳು px ನಲ್ಲಿವೆ

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

ಕಡಿಮೆ ಗುಣಮಟ್ಟದ ಸ್ಕ್ಯಾನ್‌ಗಳಿಗಾಗಿ ಒಸಿಆರ್

ಐರನ್ ಒಸಿಆರ್ OcrInput ವರ್ಗವು ಸಾಮಾನ್ಯ ಟೆಸ್ಸೆರಾಕ್ಟ್ OcrInput ಸ್ಕ್ಯಾನ್‌ಗಳನ್ನು ಸರಿಪಡಿಸಬಹುದು.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ಡಿಜಿಟಲ್ ಶಬ್ದ ಮತ್ತು ಕಳಪೆ ಸ್ಕ್ಯಾನಿಂಗ್ ಅನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Input.Deskew(); // ತಿರುಗುವಿಕೆ ಮತ್ತು ದೃಷ್ಟಿಕೋನವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ಡಿಜಿಟಲ್ ಶಬ್ದ ಮತ್ತು ಕಳಪೆ ಸ್ಕ್ಯಾನಿಂಗ್ ಅನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Input.Deskew(); // ತಿರುಗುವಿಕೆ ಮತ್ತು ದೃಷ್ಟಿಕೋನವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ಡಿಜಿಟಲ್ ಶಬ್ದ ಮತ್ತು ಕಳಪೆ ಸ್ಕ್ಯಾನಿಂಗ್ ಅನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Input.Deskew() ' ತಿರುಗುವಿಕೆ ಮತ್ತು ದೃಷ್ಟಿಕೋನವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

ಒಸಿಆರ್ ಫಲಿತಾಂಶಗಳನ್ನು ಹುಡುಕಬಹುದಾದ ಪಿಡಿಎಫ್ ಆಗಿ ರಫ್ತು ಮಾಡಿ

ನಕಲಿಸಬಹುದಾದ ಪಠ್ಯ ತಂತಿಗಳೊಂದಿಗೆ ಚಿತ್ರಕ್ಕೆ ಪಿಡಿಎಫ್. ಸರ್ಚ್ ಇಂಜಿನ್ಗಳು ಮತ್ತು ಡೇಟಾಬೇಸ್ಗಳಿಂದ ಸೂಚಿಕೆ ಮಾಡಬಹುದು.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

ಹುಡುಕಬಹುದಾದ ಪಿಡಿಎಫ್ ಪರಿವರ್ತನೆಗೆ ಟಿಐಎಫ್ಎಫ್

ಟಿಐಎಫ್ಎಫ್ ಡಾಕ್ಯುಮೆಂಟ್ ಅನ್ನು (ಅಥವಾ ಇಮೇಜ್ ಫೈಲ್‌ಗಳ ಯಾವುದೇ ಗುಂಪು) ನೇರವಾಗಿ ಹುಡುಕಬಹುದಾದ ಪಿಡಿಎಫ್‌ಗೆ ಪರಿವರ್ತಿಸಿ, ಅದನ್ನು ಅಂತರ್ಜಾಲ, ವೆಬ್‌ಸೈಟ್ ಮತ್ತು ಗೂಗಲ್ ಸರ್ಚ್ ಇಂಜಿನ್ಗಳಿಂದ ಸೂಚಿಸಬಹುದು.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

ಒಸಿಆರ್ ಫಲಿತಾಂಶಗಳನ್ನು HTML ಆಗಿ ರಫ್ತು ಮಾಡಿ

ಒಸಿಆರ್ ಚಿತ್ರ XHTML ಪರಿವರ್ತನೆಗೆ.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

ಒಸಿಆರ್ ಇಮೇಜ್ ವರ್ಧಕ ಫಿಲ್ಟರ್‌ಗಳು

ಒಸಿಆರ್ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಸುಧಾರಿಸಲು OcrInput ವಸ್ತುಗಳಿಗೆ ಅನನ್ಯ ಫಿಲ್ಟರ್‌ಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ.

ಚಿತ್ರ ವರ್ಧಕ ಕೋಡ್ ಉದಾಹರಣೆ

ಉತ್ತಮ, ವೇಗವಾಗಿ ಒಸಿಆರ್ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡಲು ಒಸಿಆರ್ ಇನ್ಪುಟ್ ಚಿತ್ರಗಳನ್ನು ಉತ್ತಮ ಗುಣಮಟ್ಟವನ್ನು ಮಾಡುತ್ತದೆ.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ಡಿಜಿಟಲ್ ಶಬ್ದ ಮತ್ತು ಕಳಪೆ ಸ್ಕ್ಯಾನಿಂಗ್ ಅನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Input.Deskew(); // ತಿರುಗುವಿಕೆ ಮತ್ತು ದೃಷ್ಟಿಕೋನವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ಡಿಜಿಟಲ್ ಶಬ್ದ ಮತ್ತು ಕಳಪೆ ಸ್ಕ್ಯಾನಿಂಗ್ ಅನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Input.Deskew(); // ತಿರುಗುವಿಕೆ ಮತ್ತು ದೃಷ್ಟಿಕೋನವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ಡಿಜಿಟಲ್ ಶಬ್ದ ಮತ್ತು ಕಳಪೆ ಸ್ಕ್ಯಾನಿಂಗ್ ಅನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Input.Deskew() ' ತಿರುಗುವಿಕೆ ಮತ್ತು ದೃಷ್ಟಿಕೋನವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

ಒಸಿಆರ್ ಇಮೇಜ್ ಫಿಲ್ಟರ್‌ಗಳ ಪಟ್ಟಿ

ಐಸಿಒಒಸಿಆರ್ನಲ್ಲಿ ನಿರ್ಮಿಸಲಾದ ಒಸಿಆರ್ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಹೆಚ್ಚಿಸಲು ಇನ್ಪುಟ್ ಫಿಲ್ಟರ್ಗಳು ಸೇರಿವೆ:

  • OcrInput.Rotate (ಡಬಲ್ ಡಿಗ್ರಿ) - ಚಿತ್ರಗಳನ್ನು ಪ್ರದಕ್ಷಿಣಾಕಾರವಾಗಿ ಹಲವಾರು ಡಿಗ್ರಿಗಳಿಂದ ತಿರುಗಿಸುತ್ತದೆ. ಪ್ರದಕ್ಷಿಣಾಕಾರವಾಗಿ, ನಕಾರಾತ್ಮಕ ಸಂಖ್ಯೆಗಳನ್ನು ಬಳಸಿ.
  • OcrInput.Binarize () - ಈ ಇಮೇಜ್ ಫಿಲ್ಟರ್ ಪ್ರತಿ ಪಿಕ್ಸೆಲ್ ಅನ್ನು ಕಪ್ಪು ಅಥವಾ ಬಿಳಿ ಬಣ್ಣಕ್ಕೆ ತಿರುಗಿಸುತ್ತದೆ. ಪಠ್ಯಕ್ಕೆ ಹಿನ್ನೆಲೆಗೆ ತೀರಾ ಕಡಿಮೆ ವ್ಯತಿರಿಕ್ತತೆಯ ಒಸಿಆರ್ ಕಾರ್ಯಕ್ಷಮತೆ ಪ್ರಕರಣಗಳನ್ನು ಸುಧಾರಿಸಬಹುದು.
  • OcrInput.ToGrayScale () - ಈ ಇಮೇಜ್ ಫಿಲ್ಟರ್ ಪ್ರತಿ ಪಿಕ್ಸೆಲ್ ಅನ್ನು ಗ್ರೇಸ್ಕೇಲ್ನ ನೆರಳುಗೆ ತಿರುಗಿಸುತ್ತದೆ. ಒಸಿಆರ್ ನಿಖರತೆಯನ್ನು ಸುಧಾರಿಸಲು ಅಸಂಭವ ಆದರೆ ವೇಗವನ್ನು ಸುಧಾರಿಸಬಹುದು
  • OcrInput.Contrast () - ಕಾಂಟ್ರಾಸ್ಟ್ ಅನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಹೆಚ್ಚಿಸುತ್ತದೆ. ಈ ಫಿಲ್ಟರ್ ಕಡಿಮೆ ಕಾಂಟ್ರಾಸ್ಟ್ ಸ್ಕ್ಯಾನ್‌ಗಳಲ್ಲಿ ಒಸಿಆರ್ ವೇಗ ಮತ್ತು ನಿಖರತೆಯನ್ನು ಸುಧಾರಿಸುತ್ತದೆ.
  • OcrInput.DeNoise () - ಡಿಜಿಟಲ್ ಶಬ್ದವನ್ನು ತೆಗೆದುಹಾಕುತ್ತದೆ. ಶಬ್ದವನ್ನು ನಿರೀಕ್ಷಿಸಿದಲ್ಲಿ ಮಾತ್ರ ಈ ಫಿಲ್ಟರ್ ಅನ್ನು ಬಳಸಬೇಕು.
  • OcrInput.Invert () - ಪ್ರತಿ ಬಣ್ಣವನ್ನು ತಲೆಕೆಳಗಾಗಿಸುತ್ತದೆ . ಉದಾ ಬಿಳಿ ಬಿಳಿ ಆಗುತ್ತದೆ: ಕಪ್ಪು ಬಿಳಿ ಆಗುತ್ತದೆ.
  • OcrInput.Dilate () - ಸುಧಾರಿತ ರೂಪವಿಜ್ಞಾನ. ಚಿತ್ರದಲ್ಲಿನ ವಸ್ತುಗಳ ಗಡಿಗಳಿಗೆ ಹಿಗ್ಗುವಿಕೆ ಪಿಕ್ಸೆಲ್‌ಗಳನ್ನು ಸೇರಿಸುತ್ತದೆ. ಈರೋಡ್ ಎದುರು
  • OcrInput.Erode () - ಸುಧಾರಿತ ರೂಪವಿಜ್ಞಾನ. ಸವೆತವು ಆಬ್ಜೆಕ್ಟ್ ಗಡಿಗಳಲ್ಲಿನ ಪಿಕ್ಸೆಲ್‌ಗಳನ್ನು ತೆಗೆದುಹಾಕುತ್ತದೆ
  • OcrInput.Deskew () - ಚಿತ್ರವನ್ನು ತಿರುಗಿಸುತ್ತದೆ ಆದ್ದರಿಂದ ಅದು ಸರಿಯಾದ ಮಾರ್ಗ ಮತ್ತು ಆರ್ಥೋಗೋನಲ್ ಆಗಿದೆ. ಒಸಿಆರ್‌ಗೆ ಇದು ತುಂಬಾ ಉಪಯುಕ್ತವಾಗಿದೆ ಏಕೆಂದರೆ ಓರೆಯಾದ ಸ್ಕ್ಯಾನ್‌ಗಳಿಗೆ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಸಹಿಷ್ಣುತೆ 5 ಡಿಗ್ರಿಗಳಷ್ಟು ಕಡಿಮೆ ಇರುತ್ತದೆ.
  • OcrInput.DeepCleanBackgroundNoise () - ಭಾರಿ ಹಿನ್ನೆಲೆ ಶಬ್ದ ತೆಗೆಯುವಿಕೆ. ವಿಪರೀತ ಡಾಕ್ಯುಮೆಂಟ್ ಹಿನ್ನೆಲೆ ಶಬ್ದ ತಿಳಿದಿದ್ದರೆ ಮಾತ್ರ ಈ ಫಿಲ್ಟರ್ ಅನ್ನು ಬಳಸಿ, ಏಕೆಂದರೆ ಈ ಫಿಲ್ಟರ್ ಶುದ್ಧ ದಾಖಲೆಗಳ ಒಸಿಆರ್ ನಿಖರತೆಯನ್ನು ಕಡಿಮೆ ಮಾಡುವ ಅಪಾಯವನ್ನುಂಟುಮಾಡುತ್ತದೆ ಮತ್ತು ಇದು ತುಂಬಾ ಸಿಪಿಯು ದುಬಾರಿಯಾಗಿದೆ.
  • OcrInput.EnhanceResolution - ಕಡಿಮೆ ಗುಣಮಟ್ಟದ ಚಿತ್ರಗಳ ರೆಸಲ್ಯೂಶನ್ ಅನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ. ಈ ಫಿಲ್ಟರ್ ಆಗಾಗ್ಗೆ ಅಗತ್ಯವಿಲ್ಲ ಏಕೆಂದರೆ OcrInput.MinimumDPI ಮತ್ತು OcrInput.TargetDPI ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಕಡಿಮೆ ರೆಸಲ್ಯೂಶನ್ ಇನ್‌ಪುಟ್‌ಗಳನ್ನು ಹಿಡಿಯುತ್ತದೆ ಮತ್ತು ಪರಿಹರಿಸುತ್ತದೆ.

ಕ್ಲೀನ್ಬ್ಯಾಕ್ಗ್ರೌಂಡ್ನೊಯಿಸ್. ಇದು ಸ್ವಲ್ಪ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುವ ಸೆಟ್ಟಿಂಗ್ ಆಗಿದೆ; ಆದಾಗ್ಯೂ, ಡಿಜಿಟಲ್ ಚಿತ್ರದೊಳಗಿನ ಡಿಜಿಟಲ್ ಶಬ್ದ, ಕಾಗದದ ಕುಸಿಯುವಿಕೆಗಳು ಮತ್ತು ಇತರ ಅಪೂರ್ಣತೆಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಸ್ವಚ್ clean ಗೊಳಿಸಲು ಇದು ಗ್ರಂಥಾಲಯವನ್ನು ಅನುಮತಿಸುತ್ತದೆ, ಅದು ಇತರ ಒಸಿಆರ್ ಗ್ರಂಥಾಲಯಗಳಿಂದ ಓದಲು ಅಸಮರ್ಥವಾಗುತ್ತದೆ.

ವರ್ಧಕ ಕಾಂಟ್ರಾಸ್ಟ್ ಎನ್ನುವುದು ಐರನ್ ಒಸಿಆರ್ ಚಿತ್ರದ ಹಿನ್ನೆಲೆಗೆ ವಿರುದ್ಧವಾಗಿ ಪಠ್ಯದ ವ್ಯತಿರಿಕ್ತತೆಯನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಹೆಚ್ಚಿಸಲು ಕಾರಣವಾಗುತ್ತದೆ, ಒಸಿಆರ್ನ ನಿಖರತೆಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಒಸಿಆರ್ ವೇಗವನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ.

ವರ್ಧಕ ಪರಿಹಾರವು ಕಡಿಮೆ-ರೆಸಲ್ಯೂಶನ್ ಚಿತ್ರಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಪತ್ತೆ ಮಾಡುತ್ತದೆ (ಇದು 275 ಡಿಪಿಐಗಿಂತ ಕಡಿಮೆ) ಮತ್ತು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಚಿತ್ರವನ್ನು ದುಬಾರಿ ಮಾಡುತ್ತದೆ ಮತ್ತು ನಂತರ ಎಲ್ಲಾ ಪಠ್ಯವನ್ನು ತೀಕ್ಷ್ಣಗೊಳಿಸುತ್ತದೆ ಆದ್ದರಿಂದ ಇದನ್ನು ಒಸಿಆರ್ ಲೈಬ್ರರಿಯಿಂದ ಸಂಪೂರ್ಣವಾಗಿ ಓದಬಹುದು. ಈ ಕಾರ್ಯಾಚರಣೆಯು ಸ್ವತಃ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತಿದ್ದರೂ, ಇದು ಸಾಮಾನ್ಯವಾಗಿ ಚಿತ್ರದ ಮೇಲೆ ಒಸಿಆರ್ ಕಾರ್ಯಾಚರಣೆಯ ಒಟ್ಟಾರೆ ಸಮಯವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ.

ಭಾಷಾ ಐರನ್ ಒಸಿಆರ್ 22 ಅಂತರರಾಷ್ಟ್ರೀಯ ಭಾಷಾ ಪ್ಯಾಕ್‌ಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ, ಮತ್ತು ಒಸಿಆರ್ ಕಾರ್ಯಾಚರಣೆಗೆ ಅನ್ವಯಿಸಲು ಒಂದು ಅಥವಾ ಹೆಚ್ಚಿನ ಬಹು ಭಾಷೆಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲು ಭಾಷಾ ಸೆಟ್ಟಿಂಗ್ ಅನ್ನು ಬಳಸಬಹುದು.

ಸ್ಟ್ರಾಟಜಿ ಐರನ್ ಒಸಿಆರ್ ಎರಡು ತಂತ್ರಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. ಡಾಕ್ಯುಮೆಂಟ್‌ನ ವೇಗವಾದ ಮತ್ತು ಕಡಿಮೆ ನಿಖರವಾದ ಸ್ಕ್ಯಾನ್‌ಗೆ ಹೋಗಲು ನಾವು ಆಯ್ಕೆ ಮಾಡಬಹುದು, ಅಥವಾ ಕೆಲವು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಮಾದರಿಗಳನ್ನು ಬಳಸುವ ಸುಧಾರಿತ ತಂತ್ರವನ್ನು ಬಳಸಿ ಒಸಿಆರ್ ಪಠ್ಯದ ನಿಖರತೆಯನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಸುಧಾರಿಸಲು ಪದಗಳ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಸಂಬಂಧವನ್ನು ಪರಸ್ಪರ ವಾಕ್ಯದಲ್ಲಿ ನೋಡುವ ಮೂಲಕ .

ಕಲರ್ ಸ್ಪೇಸ್ ಎನ್ನುವುದು ಗ್ರೇಸ್ಕೇಲ್ ಅಥವಾ ಬಣ್ಣದಲ್ಲಿ ಒಸಿಆರ್ ಅನ್ನು ನಾವು ಆರಿಸಿಕೊಳ್ಳಬಹುದು. ಸಾಮಾನ್ಯವಾಗಿ, ಗ್ರೇಸ್ಕೇಲ್ ಅತ್ಯುತ್ತಮ ಆಯ್ಕೆಯಾಗಿದೆ. ಆದಾಗ್ಯೂ, ಕೆಲವೊಮ್ಮೆ ಒಂದೇ ರೀತಿಯ ವರ್ಣದ ಪಠ್ಯಗಳು ಅಥವಾ ಹಿನ್ನೆಲೆಗಳು ಆದರೆ ವಿಭಿನ್ನ ಬಣ್ಣಗಳಿದ್ದಾಗ, ಪೂರ್ಣ-ಬಣ್ಣದ ಬಣ್ಣದ ಸ್ಥಳವು ಉತ್ತಮ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡುತ್ತದೆ.

ಡಿಟೆಕ್ಟ್ ವೈಟ್ ಟೆಕ್ಸ್ಟ್ಆನ್ಡಾರ್ಕ್ಬ್ಯಾಕ್ಗ್ರೌಂಡ್ಸ್. ಸಾಮಾನ್ಯವಾಗಿ, ಎಲ್ಲಾ ಒಸಿಆರ್ ಗ್ರಂಥಾಲಯಗಳು ಬಿಳಿ ಹಿನ್ನೆಲೆಯಲ್ಲಿ ಕಪ್ಪು ಪಠ್ಯವನ್ನು ನೋಡಲು ನಿರೀಕ್ಷಿಸುತ್ತವೆ. ಈ ಸೆಟ್ಟಿಂಗ್ ಐರನ್ ಒಸಿಆರ್ ಅನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನಿರಾಕರಣೆಗಳನ್ನು ಅಥವಾ ಬಿಳಿ ಪಠ್ಯವನ್ನು ಹೊಂದಿರುವ ಡಾರ್ಕ್ ಪುಟಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಮತ್ತು ಅವುಗಳನ್ನು ಓದಲು ಅನುಮತಿಸುತ್ತದೆ.

ಇನ್ಪುಟ್ಇಮೇಜ್ಟೈಪ್. ಈ ಸೆಟ್ಟಿಂಗ್ ಡೆವಲಪರ್‌ಗೆ ಒಸಿಆರ್ ಲೈಬ್ರರಿಯನ್ನು ಪೂರ್ಣ ಡಾಕ್ಯುಮೆಂಟ್ ಅಥವಾ ಸ್ಕ್ರೀನ್‌ಶಾಟ್‌ನಂತಹ ತುಣುಕನ್ನು ನೋಡುತ್ತಿದೆಯೇ ಎಂದು ಮಾರ್ಗದರ್ಶನ ಮಾಡಲು ಅನುಮತಿಸುತ್ತದೆ.

RotateAndStraighten ಎನ್ನುವುದು ಸುಧಾರಿತ ಸೆಟ್ಟಿಂಗ್ ಆಗಿದ್ದು, ಇದು ಐರನ್ ಒಸಿಆರ್ ಅನ್ನು ತಿರುಗಿಸಲು ಮಾತ್ರವಲ್ಲದೆ ಪಠ್ಯ ದಾಖಲೆಗಳ s ಾಯಾಚಿತ್ರಗಳಂತಹ ದೃಷ್ಟಿಕೋನವನ್ನು ಹೊಂದಿರುವ ದಾಖಲೆಗಳನ್ನು ಓದುವ ವಿಶಿಷ್ಟ ಸಾಮರ್ಥ್ಯವನ್ನು ಅನುಮತಿಸುತ್ತದೆ.

ರೀಡ್‌ಬಾರ್ಕೋಡ್‌ಗಳು ಒಂದು ಉಪಯುಕ್ತ ವೈಶಿಷ್ಟ್ಯವಾಗಿದ್ದು, ಐರನ್ ಒಸಿಆರ್ ಪುಟಗಳಲ್ಲಿ ಬಾರ್‌ಕೋಡ್‌ಗಳು ಮತ್ತು ಕ್ಯೂಆರ್ ಕೋಡ್‌ಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಓದಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ.

ಕಲರ್ ಡೆಪ್ತ್. ಬಣ್ಣಗಳ ಆಳವನ್ನು ನಿರ್ಧರಿಸಲು ಒಸಿಆರ್ ಗ್ರಂಥಾಲಯವು ಪ್ರತಿ ಪಿಕ್ಸೆಲ್‌ಗೆ ಎಷ್ಟು ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುತ್ತದೆ ಎಂಬುದನ್ನು ಈ ಸೆಟ್ಟಿಂಗ್ ನಿರ್ಧರಿಸುತ್ತದೆ. ಹೆಚ್ಚಿನ ಬಣ್ಣದ ಆಳವು ಒಸಿಆರ್ ಗುಣಮಟ್ಟವನ್ನು ಹೆಚ್ಚಿಸಬಹುದು, ಆದರೆ ಒಸಿಆರ್ ಕಾರ್ಯಾಚರಣೆಯನ್ನು ಪೂರ್ಣಗೊಳಿಸಲು ಬೇಕಾದ ಸಮಯವನ್ನು ಸಹ ಹೆಚ್ಚಿಸುತ್ತದೆ.

126 ಭಾಷಾ ಪ್ಯಾಕ್‌ಗಳು

ಐರನ್ ಒಸಿಆರ್ 126 ಅಂತರರಾಷ್ಟ್ರೀಯ ಭಾಷೆಗಳನ್ನು ಭಾಷಾ ಪ್ಯಾಕ್‌ಗಳ ಮೂಲಕ ಬೆಂಬಲಿಸುತ್ತದೆ, ಇದನ್ನು ಡಿಎಲ್‌ಎಲ್‌ಗಳಾಗಿ ವಿತರಿಸಲಾಗುತ್ತದೆ, ಇದನ್ನು ಈ ವೆಬ್‌ಸೈಟ್‌ನಿಂದ ಡೌನ್‌ಲೋಡ್ ಮಾಡಬಹುದು, ಅಥವಾ ನುಜೆಟ್ ಪ್ಯಾಕೇಜ್ ಮ್ಯಾನೇಜರ್‌ನಿಂದ ಕೂಡ ಡೌನ್‌ಲೋಡ್ ಮಾಡಬಹುದು.

ಭಾಷೆಗಳಲ್ಲಿ ಜರ್ಮನ್, ಫ್ರೆಂಚ್, ಇಂಗ್ಲಿಷ್, ಚೈನೀಸ್, ಜಪಾನೀಸ್ ಮತ್ತು ಇನ್ನೂ ಅನೇಕವು ಸೇರಿವೆ. ಪಾಸ್‌ಪೋರ್ಟ್ ಎಂಆರ್‌ Z ಡ್, ಎಂಐಸಿಆರ್ ಚೆಕ್, ಫೈನಾನ್ಷಿಯಲ್ ಡಾಟಾ, ಲೈಸೆನ್ಸ್ ಪ್ಲೇಟ್‌ಗಳು ಮತ್ತು ಇನ್ನೂ ಹಲವು ವಿಶೇಷ ಭಾಷಾ ಪ್ಯಾಕ್‌ಗಳಿವೆ. ನೀವೇ ರಚಿಸುವಂತಹವುಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ನೀವು ಯಾವುದೇ ಟೆಸ್ಸೆರಾಕ್ಟ್ ".ಟ್ರೇನ್ಡೇಟಾ" ಫೈಲ್ ಅನ್ನು ಸಹ ಬಳಸಬಹುದು.

ಭಾಷಾ ಉದಾಹರಣೆ

ಇತರ ಒಸಿಆರ್ ಭಾಷೆಗಳನ್ನು ಬಳಸುವುದು.

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// ಅಗತ್ಯವಿದ್ದರೆ ಇಮೇಜ್ ಫಿಲ್ಟರ್‌ಗಳನ್ನು ಸೇರಿಸಿ
// ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಚಿಂತನೆಯ ಇನ್ಪುಟ್ ಸಹ ಕಡಿಮೆ ಗುಣಮಟ್ಟದ್ದಾಗಿದೆ
// ಐರನ್ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಸಾಂಪ್ರದಾಯಿಕ ಟೆಸ್ಸೆರಾಕ್ಟ್ಗೆ ಸಾಧ್ಯವಾಗದದನ್ನು ಓದಬಹುದು.

var Result = Ocr.Read(input);

// ವಿಂಡೋಸ್‌ನಲ್ಲಿ ಕನ್ಸೋಲ್ ಅರೇಬಿಕ್ ಅನ್ನು ಸುಲಭವಾಗಿ ಮುದ್ರಿಸಲಾಗುವುದಿಲ್ಲ.
// ಬದಲಿಗೆ ಡಿಸ್ಕ್ನಲ್ಲಿ ಉಳಿಸೋಣ.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// ಅಗತ್ಯವಿದ್ದರೆ ಇಮೇಜ್ ಫಿಲ್ಟರ್‌ಗಳನ್ನು ಸೇರಿಸಿ
// ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಚಿಂತನೆಯ ಇನ್ಪುಟ್ ಸಹ ಕಡಿಮೆ ಗುಣಮಟ್ಟದ್ದಾಗಿದೆ
// ಐರನ್ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಸಾಂಪ್ರದಾಯಿಕ ಟೆಸ್ಸೆರಾಕ್ಟ್ಗೆ ಸಾಧ್ಯವಾಗದದನ್ನು ಓದಬಹುದು.

var Result = Ocr.Read(input);

// ವಿಂಡೋಸ್‌ನಲ್ಲಿ ಕನ್ಸೋಲ್ ಅರೇಬಿಕ್ ಅನ್ನು ಸುಲಭವಾಗಿ ಮುದ್ರಿಸಲಾಗುವುದಿಲ್ಲ.
// ಬದಲಿಗೆ ಡಿಸ್ಕ್ನಲ್ಲಿ ಉಳಿಸೋಣ.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' ಅಗತ್ಯವಿದ್ದರೆ ಇಮೇಜ್ ಫಿಲ್ಟರ್‌ಗಳನ್ನು ಸೇರಿಸಿ
' ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಚಿಂತನೆಯ ಇನ್ಪುಟ್ ಸಹ ಕಡಿಮೆ ಗುಣಮಟ್ಟದ್ದಾಗಿದೆ
' ಐರನ್ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಸಾಂಪ್ರದಾಯಿಕ ಟೆಸ್ಸೆರಾಕ್ಟ್ಗೆ ಸಾಧ್ಯವಾಗದದನ್ನು ಓದಬಹುದು.

Dim Result = Ocr.Read(input)

' ವಿಂಡೋಸ್‌ನಲ್ಲಿ ಕನ್ಸೋಲ್ ಅರೇಬಿಕ್ ಅನ್ನು ಸುಲಭವಾಗಿ ಮುದ್ರಿಸಲಾಗುವುದಿಲ್ಲ.
' ಬದಲಿಗೆ ಡಿಸ್ಕ್ನಲ್ಲಿ ಉಳಿಸೋಣ.
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

ಬಹು ಭಾಷಾ ಉದಾಹರಣೆ

ಒಂದೇ ಸಮಯದಲ್ಲಿ ಅನೇಕ ಭಾಷೆಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಒಸಿಆರ್ಗೆ ಸಹ ಸಾಧ್ಯವಿದೆ. ಯುನಿಕೋಡ್ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳಲ್ಲಿ ಇಂಗ್ಲಿಷ್ ಭಾಷೆಯ ಮೆಟಾಡೇಟಾ ಮತ್ತು URL ಗಳನ್ನು ಪಡೆಯಲು ಇದು ನಿಜವಾಗಿಯೂ ಸಹಾಯ ಮಾಡುತ್ತದೆ.

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Kannada);

// ನಾವು ಯಾವುದೇ ಭಾಷೆಗಳನ್ನು ಸೇರಿಸಬಹುದು

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Kannada);

// ನಾವು ಯಾವುದೇ ಭಾಷೆಗಳನ್ನು ಸೇರಿಸಬಹುದು

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Kannada)

' ನಾವು ಯಾವುದೇ ಭಾಷೆಗಳನ್ನು ಸೇರಿಸಬಹುದು

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

ವಿವರವಾದ ಒಸಿಆರ್ ಫಲಿತಾಂಶ ಆಬ್ಜೆಕ್ಟ್ಸ್

ಐರನ್ ಒಸಿಆರ್ ಪ್ರತಿ ಒಸಿಆರ್ ಕಾರ್ಯಾಚರಣೆಗೆ ಒಸಿಆರ್ ಫಲಿತಾಂಶದ ವಸ್ತುವನ್ನು ಹಿಂದಿರುಗಿಸುತ್ತದೆ. ಸಾಮಾನ್ಯವಾಗಿ, ಚಿತ್ರದಿಂದ ಪಠ್ಯವನ್ನು ಸ್ಕ್ಯಾನ್ ಮಾಡಲು ಅಭಿವರ್ಧಕರು ಈ ವಸ್ತುವಿನ ಪಠ್ಯ ಆಸ್ತಿಯನ್ನು ಮಾತ್ರ ಬಳಸುತ್ತಾರೆ. ಆದಾಗ್ಯೂ, ಒಸಿಆರ್ ಫಲಿತಾಂಶಗಳು ಡಿಒಎಂ ಇದಕ್ಕಿಂತ ಹೆಚ್ಚು ಸುಧಾರಿತವಾಗಿದೆ.

using IronOcr;
using System.Drawing; //ಅಸೆಂಬ್ಲಿ ಉಲ್ಲೇಖವನ್ನು ಸೇರಿಸಿ

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! ಪ್ರಮುಖ

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// ಬೃಹತ್, ವಿವರವಾದ API ಅನ್ನು ಕಂಡುಹಿಡಿಯಲು ಇಲ್ಲಿ ಅನ್ವೇಷಿಸಿ:
// - ಪುಟಗಳು, ನಿರ್ಬಂಧಗಳು, ಪ್ಯಾರಾಫಾಫ್‌ಗಳು, ರೇಖೆಗಳು, ಪದಗಳು, ಅಕ್ಷರಗಳು
// - ಚಿತ್ರ ರಫ್ತು, ಫಾಂಟ್ ಕಕ್ಷೆಗಳು, ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಡೇಟಾ
}
using IronOcr;
using System.Drawing; //ಅಸೆಂಬ್ಲಿ ಉಲ್ಲೇಖವನ್ನು ಸೇರಿಸಿ

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! ಪ್ರಮುಖ

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// ಬೃಹತ್, ವಿವರವಾದ API ಅನ್ನು ಕಂಡುಹಿಡಿಯಲು ಇಲ್ಲಿ ಅನ್ವೇಷಿಸಿ:
// - ಪುಟಗಳು, ನಿರ್ಬಂಧಗಳು, ಪ್ಯಾರಾಫಾಫ್‌ಗಳು, ರೇಖೆಗಳು, ಪದಗಳು, ಅಕ್ಷರಗಳು
// - ಚಿತ್ರ ರಫ್ತು, ಫಾಂಟ್ ಕಕ್ಷೆಗಳು, ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಡೇಟಾ
}
Imports IronOcr
Imports System.Drawing 'ಅಸೆಂಬ್ಲಿ ಉಲ್ಲೇಖವನ್ನು ಸೇರಿಸಿ

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '! ಪ್ರಮುಖ

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' ಬೃಹತ್, ವಿವರವಾದ API ಅನ್ನು ಕಂಡುಹಿಡಿಯಲು ಇಲ್ಲಿ ಅನ್ವೇಷಿಸಿ:
' - ಪುಟಗಳು, ನಿರ್ಬಂಧಗಳು, ಪ್ಯಾರಾಫಾಫ್‌ಗಳು, ರೇಖೆಗಳು, ಪದಗಳು, ಅಕ್ಷರಗಳು
' - ಚಿತ್ರ ರಫ್ತು, ಫಾಂಟ್ ಕಕ್ಷೆಗಳು, ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಡೇಟಾ
End Using
VB   C#

ಪ್ರದರ್ಶನ

ಕಾರ್ಯಕ್ಷಮತೆಯ ರಾಗ ಅಥವಾ ಇನ್ಪುಟ್ ಚಿತ್ರಗಳನ್ನು ಹೆಚ್ಚು ಮಾರ್ಪಡಿಸುವ ಅಗತ್ಯವಿಲ್ಲದೇ ಐರನ್ ಒಸಿಆರ್ ಪೆಟ್ಟಿಗೆಯಿಂದ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ.

ವೇಗವು ಬೆಳಗುತ್ತಿದೆ: ಐರನ್ಆಕ್.ಆರ್ .2020 + 10 ಪಟ್ಟು ವೇಗವಾಗಿರುತ್ತದೆ ಮತ್ತು ಹಿಂದಿನ ನಿರ್ಮಾಣಗಳಿಗಿಂತ 250% ಕಡಿಮೆ ದೋಷಗಳನ್ನು ಮಾಡುತ್ತದೆ.

ಇನ್ನಷ್ಟು ತಿಳಿಯಿರಿ

ಸಿ #, ವಿಬಿ, ಎಫ್ #, ಅಥವಾ ಇನ್ನಾವುದೇ .ನೆಟ್ ಭಾಷೆಯಲ್ಲಿ ಒಸಿಆರ್ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳಲು, ದಯವಿಟ್ಟು ನಮ್ಮ ಸಮುದಾಯ ಟ್ಯುಟೋರಿಯಲ್ ಗಳನ್ನು ಓದಿ , ಇದು ಕಬ್ಬಿಣದ ಒಸಿಆರ್ ಅನ್ನು ಹೇಗೆ ಬಳಸಬಹುದು ಎಂಬುದರ ನೈಜ ಪ್ರಪಂಚದ ಉದಾಹರಣೆಗಳನ್ನು ನೀಡುತ್ತದೆ ಮತ್ತು ಉತ್ತಮವಾದದನ್ನು ಹೇಗೆ ಪಡೆಯುವುದು ಎಂಬುದರ ಸೂಕ್ಷ್ಮ ವ್ಯತ್ಯಾಸಗಳನ್ನು ತೋರಿಸುತ್ತದೆ ಈ ಗ್ರಂಥಾಲಯ.

.NET ಡೆವಲಪರ್‌ಗಳಿಗಾಗಿ ಪೂರ್ಣ ವಸ್ತು ಉಲ್ಲೇಖವೂ ಲಭ್ಯವಿದೆ.