ಸಿ # ಮತ್ತು .ನೆಟ್ನಲ್ಲಿ ಕನ್ನಡ ಒಸಿಆರ್
ಈ ಡಾಕ್ಯುಮೆಂಟ್ನ ಇತರ ಆವೃತ್ತಿಗಳು:
ಐರನ್ಒಸಿಆರ್ ಎನ್ನುವುದು ಸಿ # ಸಾಫ್ಟ್ವೇರ್ ಘಟಕವಾಗಿದ್ದು, ಕನ್ನಡ ಸೇರಿದಂತೆ 126 ಭಾಷೆಯಲ್ಲಿ ಚಿತ್ರಗಳು ಮತ್ತು ಪಿಡಿಎಫ್ ದಾಖಲೆಗಳಿಂದ ಪಠ್ಯವನ್ನು ಓದಲು ನೆಟ್ ಕೋಡರ್ ಗಳು ಅವಕಾಶ ಮಾಡಿಕೊಡುತ್ತವೆ.
ಇದು ಟೆಸ್ಸೆರಾಕ್ಟ್ನ ಸುಧಾರಿತ ಫೋರ್ಕ್ ಆಗಿದೆ, ಇದನ್ನು .NET ಡೆವಲಪರ್ಗಳಿಗಾಗಿ ಪ್ರತ್ಯೇಕವಾಗಿ ನಿರ್ಮಿಸಲಾಗಿದೆ ಮತ್ತು ವೇಗ ಮತ್ತು ನಿಖರತೆ ಎರಡಕ್ಕೂ ನಿಯಮಿತವಾಗಿ ಇತರ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಎಂಜಿನ್ಗಳನ್ನು ಮೀರಿಸುತ್ತದೆ.
IronOcr.Languages.Kannada ನ ವಿಷಯಗಳು
ಈ ಪ್ಯಾಕೇಜ್ .NET ಗಾಗಿ 114 ಒಸಿಆರ್ ಭಾಷೆಗಳನ್ನು ಒಳಗೊಂಡಿದೆ:
- ಕನ್ನಡ
- ಕನ್ನಡಬೆಸ್ಟ್
- ಕನ್ನಡ ಫಾಸ್ಟ್
- ಕನ್ನಡ ಆಲ್ಫಾಬೆಟ್
- ಕನ್ನಡ ಆಲ್ಫಾಬೆಟ್ ಬೆಸ್ಟ್
- ಕನ್ನಡ ಆಲ್ಫಾಬೆಟ್ ಫಾಸ್ಟ್
ಡೌನ್ಲೋಡ್ ಮಾಡಿ
ಕನ್ನಡ ಭಾಷಾ ಪ್ಯಾಕ್ [
* Download as ಜಿಪ್
* Install with as https://www.nuget.org/packages/IronOcr.Languages.Kannada/'> ನುಜೆಟ್
ಅನುಸ್ಥಾಪನ
ನಾವು ಮಾಡಬೇಕಾಗಿರುವುದು ನಿಮ್ಮ ಕನ್ನಡ ಒಸಿಆರ್ ಪ್ಯಾಕೇಜ್ ಅನ್ನು ನಿಮ್ಮ .NET ಯೋಜನೆಗೆ ಸ್ಥಾಪಿಸುವುದು.
PM> Install-Package IronOCR.Languages.Kannada
ಕೋಡ್ ಉದಾಹರಣೆ
ಈ ಸಿ # ಕೋಡ್ ಉದಾಹರಣೆಯು ಚಿತ್ರ ಅಥವಾ ಪಿಡಿಎಫ್ ಡಾಕ್ಯುಮೆಂಟ್ನಿಂದ ಕನ್ನಡ ಪಠ್ಯವನ್ನು ಓದುತ್ತದೆ.
//PM> Install-Package IronOcr.Languages.Kannada
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput(@"images\Kannada.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Kannada
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput(@"images\Kannada.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Kannada
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using Input = New OcrInput("images\Kannada.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
ಐರನ್ಒಸಿಆರ್ ಅನ್ನು ಏಕೆ ಆರಿಸಬೇಕು?
ಐರನ್ ಒಸಿಆರ್ ಸ್ಥಾಪಿಸಲು ಸುಲಭ, ಸಂಪೂರ್ಣ ಮತ್ತು ಉತ್ತಮವಾಗಿ ದಾಖಲಿಸಲಾದ .ನೆಟ್ ಸಾಫ್ಟ್ವೇರ್ ಲೈಬ್ರರಿಯಾಗಿದೆ.
ಯಾವುದೇ ಬಾಹ್ಯ ವೆಬ್ ಸೇವೆಗಳು, ನಡೆಯುತ್ತಿರುವ ಶುಲ್ಕಗಳು ಅಥವಾ ಅಂತರ್ಜಾಲದಲ್ಲಿ ಗೌಪ್ಯ ದಾಖಲೆಗಳನ್ನು ಕಳುಹಿಸದೆ 99.8% + ಒಸಿಆರ್ ನಿಖರತೆಯನ್ನು ಸಾಧಿಸಲು ಐರನ್ಒಸಿಆರ್ ಆಯ್ಕೆಮಾಡಿ.
ಸಿ # ಡೆವಲಪರ್ಗಳು ವೆನಿಲ್ಲಾ ಟೆಸ್ಸೆರಾಕ್ಟ್ಗಿಂತ ಐರನ್ಒಸಿಆರ್ ಅನ್ನು ಏಕೆ ಆರಿಸುತ್ತಾರೆ:
- ಒಂದೇ ಡಿಎಲ್ಎಲ್ ಅಥವಾ ನುಜೆಟ್ ಆಗಿ ಸ್ಥಾಪಿಸಿ
- ಪೆಟ್ಟಿಗೆಯ ಹೊರಗೆ ಟೆಸ್ಸೆರಾಕ್ಟ್ 5, 4 ಮತ್ತು 3 ಎಂಜಿನ್ಗಳನ್ನು ಒಳಗೊಂಡಿದೆ.
- ನಿಖರತೆ 99.8% ಸಾಮಾನ್ಯ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಅನ್ನು ಗಮನಾರ್ಹವಾಗಿ ಮೀರಿಸುತ್ತದೆ.
- ಪ್ರಜ್ವಲಿಸುವ ವೇಗ ಮತ್ತು ಮಲ್ಟಿ ಥ್ರೆಡಿಂಗ್
- ಎಂವಿಸಿ, ವೆಬ್ಅಪ್, ಡೆಸ್ಕ್ಟಾಪ್, ಕನ್ಸೋಲ್ ಮತ್ತು ಸರ್ವರ್ ಅಪ್ಲಿಕೇಶನ್ ಹೊಂದಾಣಿಕೆಯಾಗಿದೆ
- ಕೆಲಸ ಮಾಡಲು ಎಕ್ಸೆಸ್ ಅಥವಾ ಸಿ ++ ಕೋಡ್ ಇಲ್ಲ
- ಪೂರ್ಣ ಪಿಡಿಎಫ್ ಒಸಿಆರ್ ಬೆಂಬಲ
- ಒಸಿಆರ್ ಅನ್ನು ಯಾವುದೇ ಇಮೇಜ್ ಫೈಲ್ ಅಥವಾ ಪಿಡಿಎಫ್ ಮಾಡಲು
- ಪೂರ್ಣ .ನೆಟ್ ಕೋರ್, ಸ್ಟ್ಯಾಂಡರ್ಡ್ ಮತ್ತು ಫ್ರೇಮ್ವರ್ಕ್ ಬೆಂಬಲ
- ವಿಂಡೋಸ್, ಮ್ಯಾಕ್, ಲಿನಕ್ಸ್, ಅಜುರೆ, ಡಾಕರ್, ಲ್ಯಾಂಬ್ಡಾ, ಎಡಬ್ಲ್ಯೂಎಸ್ನಲ್ಲಿ ನಿಯೋಜಿಸಿ
- ಬಾರ್ಕೋಡ್ಗಳು ಮತ್ತು ಕ್ಯೂಆರ್ ಕೋಡ್ಗಳನ್ನು ಓದಿ
- XHTML ಗೆ OCR ಅನ್ನು ರಫ್ತು ಮಾಡಿ
- ಹುಡುಕಬಹುದಾದ ಪಿಡಿಎಫ್ ದಾಖಲೆಗಳಿಗೆ ಒಸಿಆರ್ ಅನ್ನು ರಫ್ತು ಮಾಡಿ
- ಮಲ್ಟಿಥ್ರೆಡಿಂಗ್ ಬೆಂಬಲ
- 126 ಅಂತರರಾಷ್ಟ್ರೀಯ ಭಾಷೆಗಳನ್ನು ನುಜೆಟ್ ಅಥವಾ ಒಕ್ರ್ಡೇಟಾ ಫೈಲ್ಗಳ ಮೂಲಕ ನಿರ್ವಹಿಸಲಾಗುತ್ತದೆ
- ಚಿತ್ರಗಳು, ನಿರ್ದೇಶಾಂಕಗಳು, ಅಂಕಿಅಂಶಗಳು ಮತ್ತು ಫಾಂಟ್ಗಳನ್ನು ಹೊರತೆಗೆಯಿರಿ. ಕೇವಲ ಪಠ್ಯವಲ್ಲ.
- ವಾಣಿಜ್ಯ ಮತ್ತು ಸ್ವಾಮ್ಯದ ಅಪ್ಲಿಕೇಶನ್ಗಳಲ್ಲಿ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಒಸಿಆರ್ ಅನ್ನು ಮರುಹಂಚಿಕೆ ಮಾಡಲು ಬಳಸಬಹುದು.
ನೈಜ ಪ್ರಪಂಚದ ಚಿತ್ರಗಳು ಮತ್ತು s ಾಯಾಚಿತ್ರಗಳಂತಹ ಅಪೂರ್ಣ ದಾಖಲೆಗಳೊಂದಿಗೆ ಅಥವಾ ಡಿಜಿಟಲ್ ಶಬ್ದ ಅಥವಾ ಅಪೂರ್ಣತೆಗಳನ್ನು ಹೊಂದಿರುವ ಕಡಿಮೆ ರೆಸಲ್ಯೂಶನ್ನ ಸ್ಕ್ಯಾನ್ಗಳೊಂದಿಗೆ ಕೆಲಸ ಮಾಡುವಾಗ ಐರನ್ ಒಸಿಆರ್ ಹೊಳೆಯುತ್ತದೆ.
.NET ಪ್ಲಾಟ್ಫಾರ್ಮ್ಗಾಗಿ ಇತರ ಉಚಿತ ಒಸಿಆರ್ ಗ್ರಂಥಾಲಯಗಳು ಇತರ .ನೆಟ್ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಎಪಿಐಗಳು ಮತ್ತು ವೆಬ್ ಸೇವೆಗಳು ಈ ನೈಜ ಪ್ರಪಂಚದ ಬಳಕೆಯ ಸಂದರ್ಭಗಳಲ್ಲಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವುದಿಲ್ಲ.
ಟೆಸ್ಸೆರಾಕ್ಟ್ 5 ರೊಂದಿಗಿನ ಒಸಿಆರ್ - ಸಿ # ನಲ್ಲಿ ಕೋಡಿಂಗ್ ಪ್ರಾರಂಭಿಸಿ
ಕೆಳಗಿನ ಕೋಡ್ ಮಾದರಿಯು ಸಿ # ಅಥವಾ ವಿಬಿ .ನೆಟ್ ಬಳಸಿ ಚಿತ್ರದಿಂದ ಪಠ್ಯವನ್ನು ಓದುವುದು ಎಷ್ಟು ಸುಲಭ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ.
ಒನ್ಲೈನರ್
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
ಕಾನ್ಫಿಗರ್ ಮಾಡಬಹುದಾದ ಹಲೋ ವರ್ಲ್ಡ್
// PM> Install-Package IronOCR.Languages.Kannada
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... ನೀವು ಯಾವುದೇ ಸಂಖ್ಯೆಯ ಚಿತ್ರಗಳನ್ನು ಸೇರಿಸಬಹುದು
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Kannada
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... ನೀವು ಯಾವುದೇ ಸಂಖ್ಯೆಯ ಚಿತ್ರಗಳನ್ನು ಸೇರಿಸಬಹುದು
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Kannada
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ಸಿ # ಪಿಡಿಎಫ್ ಒಸಿಆರ್
ಯಾವುದೇ ಪಿಡಿಎಫ್ ಡಾಕ್ಯುಮೆಂಟ್ನಿಂದ ಪಠ್ಯವನ್ನು ಹೊರತೆಗೆಯಲು ಇದೇ ವಿಧಾನವನ್ನು ಬಳಸಬಹುದು.
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// ನಾವು ಒಸಿಆರ್ಗೆ ನಿರ್ದಿಷ್ಟ ಪಿಡಿಎಫ್ ಪುಟ ಸಂಖ್ಯೆಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಬಹುದು
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// ಪಿಡಿಎಫ್ನ ಪ್ರತಿ ಪುಟಕ್ಕೆ 1 ಪುಟ
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// ನಾವು ಒಸಿಆರ್ಗೆ ನಿರ್ದಿಷ್ಟ ಪಿಡಿಎಫ್ ಪುಟ ಸಂಖ್ಯೆಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಬಹುದು
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// ಪಿಡಿಎಫ್ನ ಪ್ರತಿ ಪುಟಕ್ಕೆ 1 ಪುಟ
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' ನಾವು ಒಸಿಆರ್ಗೆ ನಿರ್ದಿಷ್ಟ ಪಿಡಿಎಫ್ ಪುಟ ಸಂಖ್ಯೆಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಬಹುದು
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' ಪಿಡಿಎಫ್ನ ಪ್ರತಿ ಪುಟಕ್ಕೆ 1 ಪುಟ
End Using
ಮಲ್ಟಿಪೇಜ್ ಟಿಐಎಫ್ಎಫ್ಗಳಿಗಾಗಿ ಒಸಿಆರ್
ಒಸಿಆರ್ ಬಹು ಪುಟ ದಾಖಲೆಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ಟಿಐಎಫ್ಎಫ್ ಫೈಲ್ ಸ್ವರೂಪವನ್ನು ಓದುವುದು. ಹುಡುಕಬಹುದಾದ ಪಠ್ಯದೊಂದಿಗೆ ಟಿಐಎಫ್ಎಫ್ ಅನ್ನು ನೇರವಾಗಿ ಪಿಡಿಎಫ್ ಫೈಲ್ ಆಗಿ ಪರಿವರ್ತಿಸಬಹುದು.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ಬಾರ್ಕೋಡ್ಗಳು ಮತ್ತು ಕ್ಯೂಆರ್
ಐರನ್ ಒಸಿಆರ್ನ ಒಂದು ವಿಶಿಷ್ಟ ಲಕ್ಷಣವೆಂದರೆ ಅದು ಪಠ್ಯಕ್ಕಾಗಿ ಸ್ಕ್ಯಾನ್ ಮಾಡುವಾಗ ಡಾಕ್ಯುಮೆಂಟ್ಗಳಿಂದ ಬಾರ್ಕೋಡ್ಗಳು ಮತ್ತು ಕ್ಯೂಆರ್ ಕೋಡ್ಗಳನ್ನು ಓದಬಹುದು. OcrResult.OcrBarcode
ವರ್ಗದ ನಿದರ್ಶನಗಳು ಡೆವಲಪರ್ಗೆ ಪ್ರತಿ ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಬಾರ್ಕೋಡ್ ಬಗ್ಗೆ ವಿವರವಾದ ಮಾಹಿತಿಯನ್ನು ನೀಡುತ್ತದೆ.
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// ಪ್ರಕಾರ ಮತ್ತು ಸ್ಥಳ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಸಹ ಬಹಿರಂಗಪಡಿಸಲಾಗಿದೆ
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// ಪ್ರಕಾರ ಮತ್ತು ಸ್ಥಳ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಸಹ ಬಹಿರಂಗಪಡಿಸಲಾಗಿದೆ
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' ಪ್ರಕಾರ ಮತ್ತು ಸ್ಥಳ ಗುಣಲಕ್ಷಣಗಳನ್ನು ಸಹ ಬಹಿರಂಗಪಡಿಸಲಾಗಿದೆ
Next Barcode
End Using
ಚಿತ್ರಗಳ ನಿರ್ದಿಷ್ಟ ಪ್ರದೇಶಗಳಲ್ಲಿ ಒಸಿಆರ್
ಐರನ್ ಒಸಿಆರ್ನ ಎಲ್ಲಾ ಸ್ಕ್ಯಾನಿಂಗ್ ಮತ್ತು ಓದುವ ವಿಧಾನಗಳು ನಾವು ಪಠ್ಯವನ್ನು ಓದಲು ಬಯಸುವ ಪುಟ ಅಥವಾ ಪುಟಗಳ ಯಾವ ಭಾಗವನ್ನು ನಿಖರವಾಗಿ ಸೂಚಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಒದಗಿಸುತ್ತದೆ. ನಾವು ಪ್ರಮಾಣೀಕೃತ ರೂಪಗಳನ್ನು ನೋಡುತ್ತಿರುವಾಗ ಇದು ತುಂಬಾ ಉಪಯುಕ್ತವಾಗಿದೆ ಮತ್ತು ಸಾಕಷ್ಟು ಸಮಯವನ್ನು ಉಳಿಸಬಹುದು ಮತ್ತು ದಕ್ಷತೆಯನ್ನು ಸುಧಾರಿಸಬಹುದು.
ಬೆಳೆ ಪ್ರದೇಶಗಳನ್ನು ಬಳಸಲು, ನಾವು System.Drawing
ಸಿಸ್ಟಮ್ ರೆಫರೆನ್ಸ್ ಅನ್ನು ಸೇರಿಸುವ ಅಗತ್ಯವಿರುತ್ತದೆ ಇದರಿಂದ ನಾವು System.Drawing.Rectangle
ಆಬ್ಜೆಕ್ಟ್ ಅನ್ನು ಬಳಸಬಹುದು.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ಆಯಾಮಗಳು px ನಲ್ಲಿವೆ
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ಆಯಾಮಗಳು px ನಲ್ಲಿವೆ
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' ಆಯಾಮಗಳು px ನಲ್ಲಿವೆ
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ಕಡಿಮೆ ಗುಣಮಟ್ಟದ ಸ್ಕ್ಯಾನ್ಗಳಿಗಾಗಿ ಒಸಿಆರ್
ಐರನ್ ಒಸಿಆರ್ OcrInput
ವರ್ಗವು ಸಾಮಾನ್ಯ ಟೆಸ್ಸೆರಾಕ್ಟ್ OcrInput
ಸ್ಕ್ಯಾನ್ಗಳನ್ನು ಸರಿಪಡಿಸಬಹುದು.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ಡಿಜಿಟಲ್ ಶಬ್ದ ಮತ್ತು ಕಳಪೆ ಸ್ಕ್ಯಾನಿಂಗ್ ಅನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Input.Deskew(); // ತಿರುಗುವಿಕೆ ಮತ್ತು ದೃಷ್ಟಿಕೋನವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ಡಿಜಿಟಲ್ ಶಬ್ದ ಮತ್ತು ಕಳಪೆ ಸ್ಕ್ಯಾನಿಂಗ್ ಅನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Input.Deskew(); // ತಿರುಗುವಿಕೆ ಮತ್ತು ದೃಷ್ಟಿಕೋನವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ಡಿಜಿಟಲ್ ಶಬ್ದ ಮತ್ತು ಕಳಪೆ ಸ್ಕ್ಯಾನಿಂಗ್ ಅನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Input.Deskew() ' ತಿರುಗುವಿಕೆ ಮತ್ತು ದೃಷ್ಟಿಕೋನವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ಒಸಿಆರ್ ಫಲಿತಾಂಶಗಳನ್ನು ಹುಡುಕಬಹುದಾದ ಪಿಡಿಎಫ್ ಆಗಿ ರಫ್ತು ಮಾಡಿ
ನಕಲಿಸಬಹುದಾದ ಪಠ್ಯ ತಂತಿಗಳೊಂದಿಗೆ ಚಿತ್ರಕ್ಕೆ ಪಿಡಿಎಫ್. ಸರ್ಚ್ ಇಂಜಿನ್ಗಳು ಮತ್ತು ಡೇಟಾಬೇಸ್ಗಳಿಂದ ಸೂಚಿಕೆ ಮಾಡಬಹುದು.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")
Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
ಹುಡುಕಬಹುದಾದ ಪಿಡಿಎಫ್ ಪರಿವರ್ತನೆಗೆ ಟಿಐಎಫ್ಎಫ್
ಟಿಐಎಫ್ಎಫ್ ಡಾಕ್ಯುಮೆಂಟ್ ಅನ್ನು (ಅಥವಾ ಇಮೇಜ್ ಫೈಲ್ಗಳ ಯಾವುದೇ ಗುಂಪು) ನೇರವಾಗಿ ಹುಡುಕಬಹುದಾದ ಪಿಡಿಎಫ್ಗೆ ಪರಿವರ್ತಿಸಿ, ಅದನ್ನು ಅಂತರ್ಜಾಲ, ವೆಬ್ಸೈಟ್ ಮತ್ತು ಗೂಗಲ್ ಸರ್ಚ್ ಇಂಜಿನ್ಗಳಿಂದ ಸೂಚಿಸಬಹುದು.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
ಒಸಿಆರ್ ಫಲಿತಾಂಶಗಳನ್ನು HTML ಆಗಿ ರಫ್ತು ಮಾಡಿ
ಒಸಿಆರ್ ಚಿತ್ರ XHTML ಪರಿವರ್ತನೆಗೆ.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
ಒಸಿಆರ್ ಇಮೇಜ್ ವರ್ಧಕ ಫಿಲ್ಟರ್ಗಳು
ಒಸಿಆರ್ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಸುಧಾರಿಸಲು OcrInput
ವಸ್ತುಗಳಿಗೆ ಅನನ್ಯ ಫಿಲ್ಟರ್ಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ.
ಚಿತ್ರ ವರ್ಧಕ ಕೋಡ್ ಉದಾಹರಣೆ
ಉತ್ತಮ, ವೇಗವಾಗಿ ಒಸಿಆರ್ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡಲು ಒಸಿಆರ್ ಇನ್ಪುಟ್ ಚಿತ್ರಗಳನ್ನು ಉತ್ತಮ ಗುಣಮಟ್ಟವನ್ನು ಮಾಡುತ್ತದೆ.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ಡಿಜಿಟಲ್ ಶಬ್ದ ಮತ್ತು ಕಳಪೆ ಸ್ಕ್ಯಾನಿಂಗ್ ಅನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Input.Deskew(); // ತಿರುಗುವಿಕೆ ಮತ್ತು ದೃಷ್ಟಿಕೋನವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ಡಿಜಿಟಲ್ ಶಬ್ದ ಮತ್ತು ಕಳಪೆ ಸ್ಕ್ಯಾನಿಂಗ್ ಅನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Input.Deskew(); // ತಿರುಗುವಿಕೆ ಮತ್ತು ದೃಷ್ಟಿಕೋನವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ಡಿಜಿಟಲ್ ಶಬ್ದ ಮತ್ತು ಕಳಪೆ ಸ್ಕ್ಯಾನಿಂಗ್ ಅನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Input.Deskew() ' ತಿರುಗುವಿಕೆ ಮತ್ತು ದೃಷ್ಟಿಕೋನವನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ಒಸಿಆರ್ ಇಮೇಜ್ ಫಿಲ್ಟರ್ಗಳ ಪಟ್ಟಿ
ಐಸಿಒಒಸಿಆರ್ನಲ್ಲಿ ನಿರ್ಮಿಸಲಾದ ಒಸಿಆರ್ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಹೆಚ್ಚಿಸಲು ಇನ್ಪುಟ್ ಫಿಲ್ಟರ್ಗಳು ಸೇರಿವೆ:
- OcrInput.Rotate (ಡಬಲ್ ಡಿಗ್ರಿ) - ಚಿತ್ರಗಳನ್ನು ಪ್ರದಕ್ಷಿಣಾಕಾರವಾಗಿ ಹಲವಾರು ಡಿಗ್ರಿಗಳಿಂದ ತಿರುಗಿಸುತ್ತದೆ. ಪ್ರದಕ್ಷಿಣಾಕಾರವಾಗಿ, ನಕಾರಾತ್ಮಕ ಸಂಖ್ಯೆಗಳನ್ನು ಬಳಸಿ.
- OcrInput.Binarize () - ಈ ಇಮೇಜ್ ಫಿಲ್ಟರ್ ಪ್ರತಿ ಪಿಕ್ಸೆಲ್ ಅನ್ನು ಕಪ್ಪು ಅಥವಾ ಬಿಳಿ ಬಣ್ಣಕ್ಕೆ ತಿರುಗಿಸುತ್ತದೆ. ಪಠ್ಯಕ್ಕೆ ಹಿನ್ನೆಲೆಗೆ ತೀರಾ ಕಡಿಮೆ ವ್ಯತಿರಿಕ್ತತೆಯ ಒಸಿಆರ್ ಕಾರ್ಯಕ್ಷಮತೆ ಪ್ರಕರಣಗಳನ್ನು ಸುಧಾರಿಸಬಹುದು.
- OcrInput.ToGrayScale () - ಈ ಇಮೇಜ್ ಫಿಲ್ಟರ್ ಪ್ರತಿ ಪಿಕ್ಸೆಲ್ ಅನ್ನು ಗ್ರೇಸ್ಕೇಲ್ನ ನೆರಳುಗೆ ತಿರುಗಿಸುತ್ತದೆ. ಒಸಿಆರ್ ನಿಖರತೆಯನ್ನು ಸುಧಾರಿಸಲು ಅಸಂಭವ ಆದರೆ ವೇಗವನ್ನು ಸುಧಾರಿಸಬಹುದು
- OcrInput.Contrast () - ಕಾಂಟ್ರಾಸ್ಟ್ ಅನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಹೆಚ್ಚಿಸುತ್ತದೆ. ಈ ಫಿಲ್ಟರ್ ಕಡಿಮೆ ಕಾಂಟ್ರಾಸ್ಟ್ ಸ್ಕ್ಯಾನ್ಗಳಲ್ಲಿ ಒಸಿಆರ್ ವೇಗ ಮತ್ತು ನಿಖರತೆಯನ್ನು ಸುಧಾರಿಸುತ್ತದೆ.
- OcrInput.DeNoise () - ಡಿಜಿಟಲ್ ಶಬ್ದವನ್ನು ತೆಗೆದುಹಾಕುತ್ತದೆ. ಶಬ್ದವನ್ನು ನಿರೀಕ್ಷಿಸಿದಲ್ಲಿ ಮಾತ್ರ ಈ ಫಿಲ್ಟರ್ ಅನ್ನು ಬಳಸಬೇಕು.
- OcrInput.Invert () - ಪ್ರತಿ ಬಣ್ಣವನ್ನು ತಲೆಕೆಳಗಾಗಿಸುತ್ತದೆ . ಉದಾ ಬಿಳಿ ಬಿಳಿ ಆಗುತ್ತದೆ: ಕಪ್ಪು ಬಿಳಿ ಆಗುತ್ತದೆ.
- OcrInput.Dilate () - ಸುಧಾರಿತ ರೂಪವಿಜ್ಞಾನ. ಚಿತ್ರದಲ್ಲಿನ ವಸ್ತುಗಳ ಗಡಿಗಳಿಗೆ ಹಿಗ್ಗುವಿಕೆ ಪಿಕ್ಸೆಲ್ಗಳನ್ನು ಸೇರಿಸುತ್ತದೆ. ಈರೋಡ್ ಎದುರು
- OcrInput.Erode () - ಸುಧಾರಿತ ರೂಪವಿಜ್ಞಾನ. ಸವೆತವು ಆಬ್ಜೆಕ್ಟ್ ಗಡಿಗಳಲ್ಲಿನ ಪಿಕ್ಸೆಲ್ಗಳನ್ನು ತೆಗೆದುಹಾಕುತ್ತದೆ
- OcrInput.Deskew () - ಚಿತ್ರವನ್ನು ತಿರುಗಿಸುತ್ತದೆ ಆದ್ದರಿಂದ ಅದು ಸರಿಯಾದ ಮಾರ್ಗ ಮತ್ತು ಆರ್ಥೋಗೋನಲ್ ಆಗಿದೆ. ಒಸಿಆರ್ಗೆ ಇದು ತುಂಬಾ ಉಪಯುಕ್ತವಾಗಿದೆ ಏಕೆಂದರೆ ಓರೆಯಾದ ಸ್ಕ್ಯಾನ್ಗಳಿಗೆ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಸಹಿಷ್ಣುತೆ 5 ಡಿಗ್ರಿಗಳಷ್ಟು ಕಡಿಮೆ ಇರುತ್ತದೆ.
- OcrInput.DeepCleanBackgroundNoise () - ಭಾರಿ ಹಿನ್ನೆಲೆ ಶಬ್ದ ತೆಗೆಯುವಿಕೆ. ವಿಪರೀತ ಡಾಕ್ಯುಮೆಂಟ್ ಹಿನ್ನೆಲೆ ಶಬ್ದ ತಿಳಿದಿದ್ದರೆ ಮಾತ್ರ ಈ ಫಿಲ್ಟರ್ ಅನ್ನು ಬಳಸಿ, ಏಕೆಂದರೆ ಈ ಫಿಲ್ಟರ್ ಶುದ್ಧ ದಾಖಲೆಗಳ ಒಸಿಆರ್ ನಿಖರತೆಯನ್ನು ಕಡಿಮೆ ಮಾಡುವ ಅಪಾಯವನ್ನುಂಟುಮಾಡುತ್ತದೆ ಮತ್ತು ಇದು ತುಂಬಾ ಸಿಪಿಯು ದುಬಾರಿಯಾಗಿದೆ.
- OcrInput.EnhanceResolution - ಕಡಿಮೆ ಗುಣಮಟ್ಟದ ಚಿತ್ರಗಳ ರೆಸಲ್ಯೂಶನ್ ಅನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ. ಈ ಫಿಲ್ಟರ್ ಆಗಾಗ್ಗೆ ಅಗತ್ಯವಿಲ್ಲ ಏಕೆಂದರೆ OcrInput.MinimumDPI ಮತ್ತು OcrInput.TargetDPI ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಕಡಿಮೆ ರೆಸಲ್ಯೂಶನ್ ಇನ್ಪುಟ್ಗಳನ್ನು ಹಿಡಿಯುತ್ತದೆ ಮತ್ತು ಪರಿಹರಿಸುತ್ತದೆ.
ಕ್ಲೀನ್ಬ್ಯಾಕ್ಗ್ರೌಂಡ್ನೊಯಿಸ್. ಇದು ಸ್ವಲ್ಪ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುವ ಸೆಟ್ಟಿಂಗ್ ಆಗಿದೆ; ಆದಾಗ್ಯೂ, ಡಿಜಿಟಲ್ ಚಿತ್ರದೊಳಗಿನ ಡಿಜಿಟಲ್ ಶಬ್ದ, ಕಾಗದದ ಕುಸಿಯುವಿಕೆಗಳು ಮತ್ತು ಇತರ ಅಪೂರ್ಣತೆಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಸ್ವಚ್ clean ಗೊಳಿಸಲು ಇದು ಗ್ರಂಥಾಲಯವನ್ನು ಅನುಮತಿಸುತ್ತದೆ, ಅದು ಇತರ ಒಸಿಆರ್ ಗ್ರಂಥಾಲಯಗಳಿಂದ ಓದಲು ಅಸಮರ್ಥವಾಗುತ್ತದೆ.
ವರ್ಧಕ ಕಾಂಟ್ರಾಸ್ಟ್ ಎನ್ನುವುದು ಐರನ್ ಒಸಿಆರ್ ಚಿತ್ರದ ಹಿನ್ನೆಲೆಗೆ ವಿರುದ್ಧವಾಗಿ ಪಠ್ಯದ ವ್ಯತಿರಿಕ್ತತೆಯನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಹೆಚ್ಚಿಸಲು ಕಾರಣವಾಗುತ್ತದೆ, ಒಸಿಆರ್ನ ನಿಖರತೆಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಒಸಿಆರ್ ವೇಗವನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ.
ವರ್ಧಕ ಪರಿಹಾರವು ಕಡಿಮೆ-ರೆಸಲ್ಯೂಶನ್ ಚಿತ್ರಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಪತ್ತೆ ಮಾಡುತ್ತದೆ (ಇದು 275 ಡಿಪಿಐಗಿಂತ ಕಡಿಮೆ) ಮತ್ತು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಚಿತ್ರವನ್ನು ದುಬಾರಿ ಮಾಡುತ್ತದೆ ಮತ್ತು ನಂತರ ಎಲ್ಲಾ ಪಠ್ಯವನ್ನು ತೀಕ್ಷ್ಣಗೊಳಿಸುತ್ತದೆ ಆದ್ದರಿಂದ ಇದನ್ನು ಒಸಿಆರ್ ಲೈಬ್ರರಿಯಿಂದ ಸಂಪೂರ್ಣವಾಗಿ ಓದಬಹುದು. ಈ ಕಾರ್ಯಾಚರಣೆಯು ಸ್ವತಃ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತಿದ್ದರೂ, ಇದು ಸಾಮಾನ್ಯವಾಗಿ ಚಿತ್ರದ ಮೇಲೆ ಒಸಿಆರ್ ಕಾರ್ಯಾಚರಣೆಯ ಒಟ್ಟಾರೆ ಸಮಯವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ.
ಭಾಷಾ ಐರನ್ ಒಸಿಆರ್ 22 ಅಂತರರಾಷ್ಟ್ರೀಯ ಭಾಷಾ ಪ್ಯಾಕ್ಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ, ಮತ್ತು ಒಸಿಆರ್ ಕಾರ್ಯಾಚರಣೆಗೆ ಅನ್ವಯಿಸಲು ಒಂದು ಅಥವಾ ಹೆಚ್ಚಿನ ಬಹು ಭಾಷೆಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲು ಭಾಷಾ ಸೆಟ್ಟಿಂಗ್ ಅನ್ನು ಬಳಸಬಹುದು.
ಸ್ಟ್ರಾಟಜಿ ಐರನ್ ಒಸಿಆರ್ ಎರಡು ತಂತ್ರಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. ಡಾಕ್ಯುಮೆಂಟ್ನ ವೇಗವಾದ ಮತ್ತು ಕಡಿಮೆ ನಿಖರವಾದ ಸ್ಕ್ಯಾನ್ಗೆ ಹೋಗಲು ನಾವು ಆಯ್ಕೆ ಮಾಡಬಹುದು, ಅಥವಾ ಕೆಲವು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಮಾದರಿಗಳನ್ನು ಬಳಸುವ ಸುಧಾರಿತ ತಂತ್ರವನ್ನು ಬಳಸಿ ಒಸಿಆರ್ ಪಠ್ಯದ ನಿಖರತೆಯನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಸುಧಾರಿಸಲು ಪದಗಳ ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಸಂಬಂಧವನ್ನು ಪರಸ್ಪರ ವಾಕ್ಯದಲ್ಲಿ ನೋಡುವ ಮೂಲಕ .
ಕಲರ್ ಸ್ಪೇಸ್ ಎನ್ನುವುದು ಗ್ರೇಸ್ಕೇಲ್ ಅಥವಾ ಬಣ್ಣದಲ್ಲಿ ಒಸಿಆರ್ ಅನ್ನು ನಾವು ಆರಿಸಿಕೊಳ್ಳಬಹುದು. ಸಾಮಾನ್ಯವಾಗಿ, ಗ್ರೇಸ್ಕೇಲ್ ಅತ್ಯುತ್ತಮ ಆಯ್ಕೆಯಾಗಿದೆ. ಆದಾಗ್ಯೂ, ಕೆಲವೊಮ್ಮೆ ಒಂದೇ ರೀತಿಯ ವರ್ಣದ ಪಠ್ಯಗಳು ಅಥವಾ ಹಿನ್ನೆಲೆಗಳು ಆದರೆ ವಿಭಿನ್ನ ಬಣ್ಣಗಳಿದ್ದಾಗ, ಪೂರ್ಣ-ಬಣ್ಣದ ಬಣ್ಣದ ಸ್ಥಳವು ಉತ್ತಮ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡುತ್ತದೆ.
ಡಿಟೆಕ್ಟ್ ವೈಟ್ ಟೆಕ್ಸ್ಟ್ಆನ್ಡಾರ್ಕ್ಬ್ಯಾಕ್ಗ್ರೌಂಡ್ಸ್. ಸಾಮಾನ್ಯವಾಗಿ, ಎಲ್ಲಾ ಒಸಿಆರ್ ಗ್ರಂಥಾಲಯಗಳು ಬಿಳಿ ಹಿನ್ನೆಲೆಯಲ್ಲಿ ಕಪ್ಪು ಪಠ್ಯವನ್ನು ನೋಡಲು ನಿರೀಕ್ಷಿಸುತ್ತವೆ. ಈ ಸೆಟ್ಟಿಂಗ್ ಐರನ್ ಒಸಿಆರ್ ಅನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ನಿರಾಕರಣೆಗಳನ್ನು ಅಥವಾ ಬಿಳಿ ಪಠ್ಯವನ್ನು ಹೊಂದಿರುವ ಡಾರ್ಕ್ ಪುಟಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಮತ್ತು ಅವುಗಳನ್ನು ಓದಲು ಅನುಮತಿಸುತ್ತದೆ.
ಇನ್ಪುಟ್ಇಮೇಜ್ಟೈಪ್. ಈ ಸೆಟ್ಟಿಂಗ್ ಡೆವಲಪರ್ಗೆ ಒಸಿಆರ್ ಲೈಬ್ರರಿಯನ್ನು ಪೂರ್ಣ ಡಾಕ್ಯುಮೆಂಟ್ ಅಥವಾ ಸ್ಕ್ರೀನ್ಶಾಟ್ನಂತಹ ತುಣುಕನ್ನು ನೋಡುತ್ತಿದೆಯೇ ಎಂದು ಮಾರ್ಗದರ್ಶನ ಮಾಡಲು ಅನುಮತಿಸುತ್ತದೆ.
RotateAndStraighten ಎನ್ನುವುದು ಸುಧಾರಿತ ಸೆಟ್ಟಿಂಗ್ ಆಗಿದ್ದು, ಇದು ಐರನ್ ಒಸಿಆರ್ ಅನ್ನು ತಿರುಗಿಸಲು ಮಾತ್ರವಲ್ಲದೆ ಪಠ್ಯ ದಾಖಲೆಗಳ s ಾಯಾಚಿತ್ರಗಳಂತಹ ದೃಷ್ಟಿಕೋನವನ್ನು ಹೊಂದಿರುವ ದಾಖಲೆಗಳನ್ನು ಓದುವ ವಿಶಿಷ್ಟ ಸಾಮರ್ಥ್ಯವನ್ನು ಅನುಮತಿಸುತ್ತದೆ.
ರೀಡ್ಬಾರ್ಕೋಡ್ಗಳು ಒಂದು ಉಪಯುಕ್ತ ವೈಶಿಷ್ಟ್ಯವಾಗಿದ್ದು, ಐರನ್ ಒಸಿಆರ್ ಪುಟಗಳಲ್ಲಿ ಬಾರ್ಕೋಡ್ಗಳು ಮತ್ತು ಕ್ಯೂಆರ್ ಕೋಡ್ಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಓದಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ.
ಕಲರ್ ಡೆಪ್ತ್. ಬಣ್ಣಗಳ ಆಳವನ್ನು ನಿರ್ಧರಿಸಲು ಒಸಿಆರ್ ಗ್ರಂಥಾಲಯವು ಪ್ರತಿ ಪಿಕ್ಸೆಲ್ಗೆ ಎಷ್ಟು ಬಿಟ್ಗಳನ್ನು ಬಳಸುತ್ತದೆ ಎಂಬುದನ್ನು ಈ ಸೆಟ್ಟಿಂಗ್ ನಿರ್ಧರಿಸುತ್ತದೆ. ಹೆಚ್ಚಿನ ಬಣ್ಣದ ಆಳವು ಒಸಿಆರ್ ಗುಣಮಟ್ಟವನ್ನು ಹೆಚ್ಚಿಸಬಹುದು, ಆದರೆ ಒಸಿಆರ್ ಕಾರ್ಯಾಚರಣೆಯನ್ನು ಪೂರ್ಣಗೊಳಿಸಲು ಬೇಕಾದ ಸಮಯವನ್ನು ಸಹ ಹೆಚ್ಚಿಸುತ್ತದೆ.
126 ಭಾಷಾ ಪ್ಯಾಕ್ಗಳು
ಐರನ್ ಒಸಿಆರ್ 126 ಅಂತರರಾಷ್ಟ್ರೀಯ ಭಾಷೆಗಳನ್ನು ಭಾಷಾ ಪ್ಯಾಕ್ಗಳ ಮೂಲಕ ಬೆಂಬಲಿಸುತ್ತದೆ, ಇದನ್ನು ಡಿಎಲ್ಎಲ್ಗಳಾಗಿ ವಿತರಿಸಲಾಗುತ್ತದೆ, ಇದನ್ನು ಈ ವೆಬ್ಸೈಟ್ನಿಂದ ಡೌನ್ಲೋಡ್ ಮಾಡಬಹುದು, ಅಥವಾ ನುಜೆಟ್ ಪ್ಯಾಕೇಜ್ ಮ್ಯಾನೇಜರ್ನಿಂದ ಕೂಡ ಡೌನ್ಲೋಡ್ ಮಾಡಬಹುದು.
ಭಾಷೆಗಳಲ್ಲಿ ಜರ್ಮನ್, ಫ್ರೆಂಚ್, ಇಂಗ್ಲಿಷ್, ಚೈನೀಸ್, ಜಪಾನೀಸ್ ಮತ್ತು ಇನ್ನೂ ಅನೇಕವು ಸೇರಿವೆ. ಪಾಸ್ಪೋರ್ಟ್ ಎಂಆರ್ Z ಡ್, ಎಂಐಸಿಆರ್ ಚೆಕ್, ಫೈನಾನ್ಷಿಯಲ್ ಡಾಟಾ, ಲೈಸೆನ್ಸ್ ಪ್ಲೇಟ್ಗಳು ಮತ್ತು ಇನ್ನೂ ಹಲವು ವಿಶೇಷ ಭಾಷಾ ಪ್ಯಾಕ್ಗಳಿವೆ. ನೀವೇ ರಚಿಸುವಂತಹವುಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ನೀವು ಯಾವುದೇ ಟೆಸ್ಸೆರಾಕ್ಟ್ ".ಟ್ರೇನ್ಡೇಟಾ" ಫೈಲ್ ಅನ್ನು ಸಹ ಬಳಸಬಹುದು.
ಭಾಷಾ ಉದಾಹರಣೆ
ಇತರ ಒಸಿಆರ್ ಭಾಷೆಗಳನ್ನು ಬಳಸುವುದು.
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// ಅಗತ್ಯವಿದ್ದರೆ ಇಮೇಜ್ ಫಿಲ್ಟರ್ಗಳನ್ನು ಸೇರಿಸಿ
// ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಚಿಂತನೆಯ ಇನ್ಪುಟ್ ಸಹ ಕಡಿಮೆ ಗುಣಮಟ್ಟದ್ದಾಗಿದೆ
// ಐರನ್ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಸಾಂಪ್ರದಾಯಿಕ ಟೆಸ್ಸೆರಾಕ್ಟ್ಗೆ ಸಾಧ್ಯವಾಗದದನ್ನು ಓದಬಹುದು.
var Result = Ocr.Read(input);
// ವಿಂಡೋಸ್ನಲ್ಲಿ ಕನ್ಸೋಲ್ ಅರೇಬಿಕ್ ಅನ್ನು ಸುಲಭವಾಗಿ ಮುದ್ರಿಸಲಾಗುವುದಿಲ್ಲ.
// ಬದಲಿಗೆ ಡಿಸ್ಕ್ನಲ್ಲಿ ಉಳಿಸೋಣ.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// ಅಗತ್ಯವಿದ್ದರೆ ಇಮೇಜ್ ಫಿಲ್ಟರ್ಗಳನ್ನು ಸೇರಿಸಿ
// ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಚಿಂತನೆಯ ಇನ್ಪುಟ್ ಸಹ ಕಡಿಮೆ ಗುಣಮಟ್ಟದ್ದಾಗಿದೆ
// ಐರನ್ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಸಾಂಪ್ರದಾಯಿಕ ಟೆಸ್ಸೆರಾಕ್ಟ್ಗೆ ಸಾಧ್ಯವಾಗದದನ್ನು ಓದಬಹುದು.
var Result = Ocr.Read(input);
// ವಿಂಡೋಸ್ನಲ್ಲಿ ಕನ್ಸೋಲ್ ಅರೇಬಿಕ್ ಅನ್ನು ಸುಲಭವಾಗಿ ಮುದ್ರಿಸಲಾಗುವುದಿಲ್ಲ.
// ಬದಲಿಗೆ ಡಿಸ್ಕ್ನಲ್ಲಿ ಉಳಿಸೋಣ.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' ಅಗತ್ಯವಿದ್ದರೆ ಇಮೇಜ್ ಫಿಲ್ಟರ್ಗಳನ್ನು ಸೇರಿಸಿ
' ಈ ಸಂದರ್ಭದಲ್ಲಿ, ಚಿಂತನೆಯ ಇನ್ಪುಟ್ ಸಹ ಕಡಿಮೆ ಗುಣಮಟ್ಟದ್ದಾಗಿದೆ
' ಐರನ್ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಸಾಂಪ್ರದಾಯಿಕ ಟೆಸ್ಸೆರಾಕ್ಟ್ಗೆ ಸಾಧ್ಯವಾಗದದನ್ನು ಓದಬಹುದು.
Dim Result = Ocr.Read(input)
' ವಿಂಡೋಸ್ನಲ್ಲಿ ಕನ್ಸೋಲ್ ಅರೇಬಿಕ್ ಅನ್ನು ಸುಲಭವಾಗಿ ಮುದ್ರಿಸಲಾಗುವುದಿಲ್ಲ.
' ಬದಲಿಗೆ ಡಿಸ್ಕ್ನಲ್ಲಿ ಉಳಿಸೋಣ.
Result.SaveAsTextFile("arabic.txt")
End Using
ಬಹು ಭಾಷಾ ಉದಾಹರಣೆ
ಒಂದೇ ಸಮಯದಲ್ಲಿ ಅನೇಕ ಭಾಷೆಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಒಸಿಆರ್ಗೆ ಸಹ ಸಾಧ್ಯವಿದೆ. ಯುನಿಕೋಡ್ ಡಾಕ್ಯುಮೆಂಟ್ಗಳಲ್ಲಿ ಇಂಗ್ಲಿಷ್ ಭಾಷೆಯ ಮೆಟಾಡೇಟಾ ಮತ್ತು URL ಗಳನ್ನು ಪಡೆಯಲು ಇದು ನಿಜವಾಗಿಯೂ ಸಹಾಯ ಮಾಡುತ್ತದೆ.
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Kannada);
// ನಾವು ಯಾವುದೇ ಭಾಷೆಗಳನ್ನು ಸೇರಿಸಬಹುದು
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Kannada);
// ನಾವು ಯಾವುದೇ ಭಾಷೆಗಳನ್ನು ಸೇರಿಸಬಹುದು
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Kannada)
' ನಾವು ಯಾವುದೇ ಭಾಷೆಗಳನ್ನು ಸೇರಿಸಬಹುದು
Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
ವಿವರವಾದ ಒಸಿಆರ್ ಫಲಿತಾಂಶ ಆಬ್ಜೆಕ್ಟ್ಸ್
ಐರನ್ ಒಸಿಆರ್ ಪ್ರತಿ ಒಸಿಆರ್ ಕಾರ್ಯಾಚರಣೆಗೆ ಒಸಿಆರ್ ಫಲಿತಾಂಶದ ವಸ್ತುವನ್ನು ಹಿಂದಿರುಗಿಸುತ್ತದೆ. ಸಾಮಾನ್ಯವಾಗಿ, ಚಿತ್ರದಿಂದ ಪಠ್ಯವನ್ನು ಸ್ಕ್ಯಾನ್ ಮಾಡಲು ಅಭಿವರ್ಧಕರು ಈ ವಸ್ತುವಿನ ಪಠ್ಯ ಆಸ್ತಿಯನ್ನು ಮಾತ್ರ ಬಳಸುತ್ತಾರೆ. ಆದಾಗ್ಯೂ, ಒಸಿಆರ್ ಫಲಿತಾಂಶಗಳು ಡಿಒಎಂ ಇದಕ್ಕಿಂತ ಹೆಚ್ಚು ಸುಧಾರಿತವಾಗಿದೆ.
using IronOcr;
using System.Drawing; //ಅಸೆಂಬ್ಲಿ ಉಲ್ಲೇಖವನ್ನು ಸೇರಿಸಿ
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! ಪ್ರಮುಖ
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// ಬೃಹತ್, ವಿವರವಾದ API ಅನ್ನು ಕಂಡುಹಿಡಿಯಲು ಇಲ್ಲಿ ಅನ್ವೇಷಿಸಿ:
// - ಪುಟಗಳು, ನಿರ್ಬಂಧಗಳು, ಪ್ಯಾರಾಫಾಫ್ಗಳು, ರೇಖೆಗಳು, ಪದಗಳು, ಅಕ್ಷರಗಳು
// - ಚಿತ್ರ ರಫ್ತು, ಫಾಂಟ್ ಕಕ್ಷೆಗಳು, ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಡೇಟಾ
}
using IronOcr;
using System.Drawing; //ಅಸೆಂಬ್ಲಿ ಉಲ್ಲೇಖವನ್ನು ಸೇರಿಸಿ
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Kannada;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! ಪ್ರಮುಖ
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// ಬೃಹತ್, ವಿವರವಾದ API ಅನ್ನು ಕಂಡುಹಿಡಿಯಲು ಇಲ್ಲಿ ಅನ್ವೇಷಿಸಿ:
// - ಪುಟಗಳು, ನಿರ್ಬಂಧಗಳು, ಪ್ಯಾರಾಫಾಫ್ಗಳು, ರೇಖೆಗಳು, ಪದಗಳು, ಅಕ್ಷರಗಳು
// - ಚಿತ್ರ ರಫ್ತು, ಫಾಂಟ್ ಕಕ್ಷೆಗಳು, ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಡೇಟಾ
}
Imports IronOcr
Imports System.Drawing 'ಅಸೆಂಬ್ಲಿ ಉಲ್ಲೇಖವನ್ನು ಸೇರಿಸಿ
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Kannada
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '! ಪ್ರಮುಖ
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' ಬೃಹತ್, ವಿವರವಾದ API ಅನ್ನು ಕಂಡುಹಿಡಿಯಲು ಇಲ್ಲಿ ಅನ್ವೇಷಿಸಿ:
' - ಪುಟಗಳು, ನಿರ್ಬಂಧಗಳು, ಪ್ಯಾರಾಫಾಫ್ಗಳು, ರೇಖೆಗಳು, ಪದಗಳು, ಅಕ್ಷರಗಳು
' - ಚಿತ್ರ ರಫ್ತು, ಫಾಂಟ್ ಕಕ್ಷೆಗಳು, ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ ಡೇಟಾ
End Using
ಪ್ರದರ್ಶನ
ಕಾರ್ಯಕ್ಷಮತೆಯ ರಾಗ ಅಥವಾ ಇನ್ಪುಟ್ ಚಿತ್ರಗಳನ್ನು ಹೆಚ್ಚು ಮಾರ್ಪಡಿಸುವ ಅಗತ್ಯವಿಲ್ಲದೇ ಐರನ್ ಒಸಿಆರ್ ಪೆಟ್ಟಿಗೆಯಿಂದ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ.
ವೇಗವು ಬೆಳಗುತ್ತಿದೆ: ಐರನ್ಆಕ್.ಆರ್ .2020 + 10 ಪಟ್ಟು ವೇಗವಾಗಿರುತ್ತದೆ ಮತ್ತು ಹಿಂದಿನ ನಿರ್ಮಾಣಗಳಿಗಿಂತ 250% ಕಡಿಮೆ ದೋಷಗಳನ್ನು ಮಾಡುತ್ತದೆ.
ಇನ್ನಷ್ಟು ತಿಳಿಯಿರಿ
ಸಿ #, ವಿಬಿ, ಎಫ್ #, ಅಥವಾ ಇನ್ನಾವುದೇ .ನೆಟ್ ಭಾಷೆಯಲ್ಲಿ ಒಸಿಆರ್ ಬಗ್ಗೆ ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳಲು, ದಯವಿಟ್ಟು ನಮ್ಮ ಸಮುದಾಯ ಟ್ಯುಟೋರಿಯಲ್ ಗಳನ್ನು ಓದಿ , ಇದು ಕಬ್ಬಿಣದ ಒಸಿಆರ್ ಅನ್ನು ಹೇಗೆ ಬಳಸಬಹುದು ಎಂಬುದರ ನೈಜ ಪ್ರಪಂಚದ ಉದಾಹರಣೆಗಳನ್ನು ನೀಡುತ್ತದೆ ಮತ್ತು ಉತ್ತಮವಾದದನ್ನು ಹೇಗೆ ಪಡೆಯುವುದು ಎಂಬುದರ ಸೂಕ್ಷ್ಮ ವ್ಯತ್ಯಾಸಗಳನ್ನು ತೋರಿಸುತ್ತದೆ ಈ ಗ್ರಂಥಾಲಯ.
.NET ಡೆವಲಪರ್ಗಳಿಗಾಗಿ ಪೂರ್ಣ ವಸ್ತು ಉಲ್ಲೇಖವೂ ಲಭ್ಯವಿದೆ.