Lao OCR ໃນ C#ແລະ .NET
ສະບບອນໆຂອງເອກະສານນ:
IronOCR ແມນສວນປະກອບຂອງຊອບແວ C#ທອະນຍາດໃຫ .NET coders ສາມາດອານຂຄວາມຈາກຮບພາບແລະເອກະສານ PDF ເປນ 126 ພາສາ, ລວມທງພາສາລາວ.
ມນແມນຄວາມຍາວຂອງສອມທກາວ ໜາ ຂອງ Tesseract, ສາງສະເພາະ ສຳ ລບນກພດທະນາ. ສດທແລະເປນເຄອງຈກ Tesseract ອນໆທກາວ ໜາ ຂນເລອຍໆ ສຳ ລບທງຄວາມໄວແລະຄວາມຖກຕອງ.
ເນອໃນຂອງ IronOcr.Languages.Lao
ຊດນມ 90 ພາສາ OCR ສຳ ລບ .NET:
- ລາວ
- LaoBest
- LaoFast
- LaoAlphabet
- LaoAlphabetBest
- LaoAlphabetFast
ດາວໂຫລດ
ຊດ ພາສາລາວ [ພາສາລາວ]
* Download as ຫດໄປສະນ
* Install
with as https://www.nuget.org/packages/IronOcr.Languages.Lao/'>
NuGet
ການຕດຕງ
ສງ ທຳ ອດທພວກເຮາຕອງເຮດແມນຕດຕງຊດ OCR Lao ຂອງພວກເຮາເຂາໃນໂຄງການ. ສດທຂອງທານ.
PM> Install Package IronOCR.Languages.Lao
ຕວຢາງລະຫດ
ຕວຢາງລະຫດ C#ນອານຕວ ໜງ ສລາວຈາກເອກະສານ Image ຫ PDF.
//PM> Install Package IronOcr.Languages.Lao
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput(@"images\Lao.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install Package IronOcr.Languages.Lao
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput(@"images\Lao.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
Imports IronOcr
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using Input = New OcrInput("images\Lao.png")
Dim Result = Ocr.Read(Input)
Dim AllText = Result.Text
End Using
ເປນຫຍງເລອກ IronOCR?
IronOCR ແມນຫອງສະຫມດຊອບແວທງາຍຕການຕດຕງ, ຄບຖວນແລະມເອກະສານທດ.
ເລອກ IronOCR ເພອບນລ ຄວາມຖກຕອງ 99,8% + OCR ໂດຍບຕອງໃຊບລການເວບນອກ, ຄາ ທຳ ນຽມຕເນອງຫສງເອກະສານທເປນຄວາມລບຜານອນເຕເນດ.
ເປນຫຍງນກພດທະນາ C#ເລອກ IronOCR ໃນໄລຍະ Vanilla Tesseract:
- ຕດຕງເປນ DLL ຫ Nuget ດຽວ
- ປະກອບມ ສຳ ລບເຄອງຈກໃນການຂນສງເຄອງຈກ Tesseract 5, 4 ແລະ 3 ອອກຈາກຫອງດງກາວ.
- ຄວາມຖກຕອງ 99,8% ຫາຍກວາຜນໄດຮບທແທຈງ Tesseract.
- ຄວາມໄວ Blazing ແລະ MultiThreading
- MVC, WebApp, Desktop, Console & Server Application ເຂາກນໄດ
- ບມລະຫດ Exes ຫ C ++ ເພອເຮດວຽກກບ
- ສະຫນບສະຫນນ PDF OCR ເຕມຮບແບບ
- ເພອປະຕບດ OCR ເກອບທກເອກະສານຮບພາບຫ PDF
- ເຕມ .NET Core, ມາດຕະຖານແລະ FrameWork ສະຫນບສະຫນນ
- ໃຊງານເທງ Windows, Mac, Linux, Azure, Docker, Lambda, AWS
- ອານລະຫດບາໂຄດແລະ QR
- ສງອອກ OCR ເປນ XHTML
- ສງອອກ OCR ເພອຊອກຫາເອກະສານ PDF
- ສະຫນບສະຫນນ Multithreading
- 126 ພາສາສາກນທຄມຄອງໂດຍຜານໄຟລ Nuget ຫ OcrData
- ສະກດຮບພາບ, ການປະສານງານ, ສະຖຕແລະຕວອກສອນ. ບພຽງແຕຂຄວາມເທານນ.
- ສາມາດຖກ ນຳ ໃຊເພອແຈກຈາຍ Tesseract OCR ພາຍໃນ ຄຳ ຮອງສະຫມກດານການຄາແລະເປນເຈາຂອງ.
ທາດເຫກ OCR ເຫລອມເມອເຮດວຽກກບຮບພາບຂອງໂລກແທແລະເອກະສານທບສມບນແບບເຊນ: ຮບຖາຍ, ຫລສະແກນຄວາມລະອຽດຕ ຳ ເຊງອາດຈະມສຽງດງຫລບສມບນແບບ.
ຫອງສະຫມດ OCR ອນໆທ ບເສຍຄາ ສຳ ລບແພລະຕະຟອມສດທ .NET ແລະການບລການເວບໄຊຕອນໆ.
OCR ກບ Tesseract 5 - ເລມຕນລະຫດໃນ C #
ຕວຢາງລະຫດຂາງລມນສະແດງໃຫເຫນວາມນງາຍທຈະອານຂຄວາມຈາກຮບໃດ ໜງ ໂດຍໃຊ C#ຫ VB .NET.
OneLiner
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
ຕງຄາສະບາຍດໂລກ
// PM> Install Package IronOCR.Languages.Lao
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... ທານສາມາດເພມ ຈຳ ນວນຮບພາບໃດໆ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install Package IronOCR.Languages.Lao
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... ທານສາມາດເພມ ຈຳ ນວນຮບພາບໃດໆ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Dim Ocr As New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using Input As New OcrInput()
Input.AddImage("images/sample.jpeg")
'... ທານສາມາດເພມ ຈຳ ນວນຮບພາບໃດໆ
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
C#PDF OCR
ວທການແບບດຽວກນນສາມາດຖກ ນຳ ໃຊເພອສະກດຂຄວາມຈາກເອກະສານ PDF ໃດໆ.
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// ພວກເຮາຍງສາມາດເລອກ ໝາຍ ເລກ ໜາ PDF ທແນນອນໃຫ OCR
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 ໜາ ສຳ ລບທກໆ ໜາ ຂອງ PDF
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// ພວກເຮາຍງສາມາດເລອກ ໝາຍ ເລກ ໜາ PDF ທແນນອນໃຫ OCR
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 ໜາ ສຳ ລບທກໆ ໜາ ຂອງ PDF
}
Imports IronOcr
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using input As New OcrInput()
input.AddPdf("example.pdf", "password")
' ພວກເຮາຍງສາມາດເລອກ ໝາຍ ເລກ ໜາ PDF ທແນນອນໃຫ OCR
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' 1 ໜາ ສຳ ລບທກໆ ໜາ ຂອງ PDF
End Using
OCR ສຳ ລບ MultiPage TIFFs
OCR ອານ TIFF ຮບແບບເອກະສານລວມທງເອກະສານຫາຍ ໜາ. TIFF ຍງສາມາດປຽນເປນເອກະສານ PDF ໂດຍກງດວຍຂຄວາມທສາມາດຄນຫາໄດ.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ລະຫດບາໂຄດແລະ QR
ຄນລກສະນະທເປນເອກະລກຂອງ IronOCR ແມນມນສາມາດອານລະຫດແລະລະຫດ QR ຈາກເອກະສານໃນຂະນະທມນ ກຳ ລງສະແກນຫາຕວ ໜງ
ສ. ຕວຢາງຂອງ OcrResult.OcrBarcode Class ໃຫຂມນລະອຽດແກນກພດທະນາກຽວກບແຕລະ
OcrResult.OcrBarcode ສະແກນ.
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// ປະເພດແລະຄນສມບດຂອງສະຖານທໄດຮບ
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// ປະເພດແລະຄນສມບດຂອງສະຖານທໄດຮບ
}
}
Imports IronOcr
Dim Ocr As New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input As New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' ປະເພດແລະຄນສມບດຂອງສະຖານທໄດຮບ
Next
End Using
OCR ກຽວກບພນທສະເພາະຂອງຮບພາບ
ທກໆວທການສະແກນແລະອານຂອງ IronOCR ໃຫຄວາມສາມາດລະບຢາງແນນອນວາພາກໃດຂອງ ໜາ ເວບຫລ ໜາ ເວບທພວກເຮາຕອງການອານຂຄວາມຈາກ. ນແມນສງທມປະໂຫຍດຫາຍເມອພວກເຮາ ກຳ ລງຊອກຫາຮບແບບທໄດມາດຕະຖານແລະສາມາດປະຫຍດເວລາແລະເຮດໃຫປະສດຕພາບດຂນ.
ເພອໃຊພນທປກພດ, ພວກເຮາຈະຕອງເພມເອກະສານອາງອງລະບບເຂາໃນ System.Drawing ເພອໃຫພວກເຮາສາມາດ
ນຳ ໃຊວດຖ System.Drawing.Rectangle .
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ຂະ ໜາດ ແມນຢໃນ px
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ຂະ ໜາດ ແມນຢໃນ px
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {.X = 215, .Y = 1250, .Height = 280, .Width = 1335}
' ຂະ ໜາດ ແມນຢໃນ px
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR ສຳ ລບການສະແກນຄນນະພາບຕ ຳ
ຫອງຮຽນ IronOCR OcrInput ສາມາດແກໄຂການສະແກນທ Tesseract ປກກະຕບສາມາດອານໄດ.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ແກໄຂສງລບກວນດຈຕອນແລະການສະແກນບດ
Input.Deskew(); // ແກໄຂການ ໝນ ວຽນແລະທດສະນະ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ແກໄຂສງລບກວນດຈຕອນແລະການສະແກນບດ
Input.Deskew(); // ແກໄຂການ ໝນ ວຽນແລະທດສະນະ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Dim Ocr As New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using Input As New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ແກໄຂສງລບກວນດຈຕອນແລະການສະແກນບດ
Input.Deskew() ' ແກໄຂການ ໝນ ວຽນແລະທດສະນະ
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ສງອອກຜນ OCR ເປນ PDF ທສາມາດຄນຫາໄດ
ຮບພາບເຖງ PDF ດວຍບນດາຂຄວາມທສາມາດຄດລອກໄດ. ສາມາດຖກດດສະນໂດຍເຄອງຈກຊອກຫາແລະຖານຂມນ.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")
Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
TIFF ເພອການຊອກຫາການປຽນໃຈເຫລອມໃສ PDF
Convert ເອກະສານ TIFF (ຫກມຂອງເອກະສານຮບພາບໃດ ໜງ) ໂດຍກງກບເອກະສານ PDF ທສາມາດຄນຫາເຊງສາມາດຖກດດສະນໂດຍອນທະເນດ, ເວບໄຊທແລະເຄອງຈກຊອກຫາ google.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
ສງອອກຜນ OCR ເປນ HTML
ຮບພາບ OCR ກບ XHTML ປຽນໃຈເຫລອມໃສ.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
ການກນຕອງການປບປງຮບພາບ OCR
IronOCR ໃຫຕວກອງທເປນເອກະລກ ສຳ ລບວດຖ OcrInput ເພອປບປງການເຮດວຽກຂອງ OCR.
ຕວຢາງລະຫດເສມສາງຮບພາບ
ເຮດໃຫ OCR ປະກອບຮບພາບທມຄນນະພາບສງຂນເພອໃຫຜນໄດຮບທດກວາແລະໄວກວາ OCR.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ແກໄຂສງລບກວນດຈຕອນແລະການສະແກນບດ
Input.Deskew(); // ແກໄຂການ ໝນ ວຽນແລະທດສະນະ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ແກໄຂສງລບກວນດຈຕອນແລະການສະແກນບດ
Input.Deskew(); // ແກໄຂການ ໝນ ວຽນແລະທດສະນະ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Dim Ocr As New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using Input As New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ແກໄຂສງລບກວນດຈຕອນແລະການສະແກນບດ
Input.Deskew() ' ແກໄຂການ ໝນ ວຽນແລະທດສະນະ
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ລາຍຊເຄອງກນຕອງຮບພາບ OCR
ການກນຕອງຂາເຂາເພອເພມປະສດທພາບ OCR ທຖກສາງຂນໃນ IronOCR ລວມມ:
- OcrInput.Rotate (ສອງອງສາ) - ໝນ ຮບພາບຕາມ ຈຳ ນວນຂອງອງສາຕາມເຂມໂມງ. ສຳ ລບຕານໂມງເຂມໂມງ, ໃຊເລກລບ.
- OcrInput.Binarize () - ຕວກອງຮບພາບນປຽນທກສແດງຫລສຂາວແລະບມພນ. ອາດຈະປບປງກລະນການປະຕບດ OCR ຂອງກງກນຂາມຕ ຳ ຫາຍຂອງຂຄວາມເຖງພນຫລງ.
- OcrInput.ToGrayScale () - ຕວກອງຮບພາບນເຮດໃຫທກໆ pixel ເປນຮມຂອງສຂເຖາ. ບຫນາຈະເປນການປບປງຄວາມຖກຕອງຂອງ OCR ແຕອາດຈະປບປງຄວາມໄວ
- OcrInput.Contrast () - ເພມຄວາມກງກນຂາມໂດຍອດຕະໂນມດ. ການກນຕອງນມກຈະປບປງຄວາມໄວ OCR ແລະຄວາມຖກຕອງໃນການສະແກນກງກນຂາມຕ ຳ.
- OcrInput.DeNoise () - ລບສຽງລບກວນດຈຕອລ. ການກນຕອງນຄວນຈະຖກ ນຳ ໃຊໃນບອນທມສຽງດງ.
- OcrInput.Invert () - ປຽນທກສ. ຕວຢາງຂາວກາຍເປນສ ດຳ: ສ ດຳ ກາຍເປນສຂາວ.
- OcrInput.Dilate () - Advanced Morphology. Dilation ເພມ pixels ໃຫເຂດແດນຂອງວດຖໃນພາບ. ກງກນຂາມຂອງ Erode
- OcrInput.Erode () - Advanced Morphology. ການເຊາະເຈອນ ກຳ ຈດ pixels ລວງໃນຂອບເຂດແດນວດຖ .Pososite ຂອງ Dilate
- OcrInput.Deskew () - ໝນ ຮບພາບເພອໃຫມນເປນທາງຂນແລະທາງຂວາ. ນແມນມປະໂຫຍດຫາຍ ສຳ ລບ OCR ເພາະວາຄວາມອດທນຂອງເສນເລອດ ສຳ ລບການສະແກນສະເກດຈະຢໃນລະດບຕາເຖງ 5 ອງສາ.
- OcrInput.DeepCleanBackgroundNoise () - ການ ກຳ ຈດສງລບກວນໃນພນຫລງຢາງ ໜກ. ໃຊພຽງແຕຕວກອງນໃນກລະນທມສຽງດງໃນເບອງຫລງຂອງເອກະສານທເປນທຮຈກ, ເພາະວາຕວກອງນຍງຈະສຽງຕການຫດຜອນຄວາມຖກຕອງຂອງ OCR ຂອງເອກະສານທສະອາດ, ແລະມລາຄາແພງຫາຍຕ CPU.
- OcrInput.EnhanceResolution - ຊວຍເພມຄວາມລະອຽດຂອງພາບທມຄນນະພາບຕ ຳ. ຕວກອງນບ ຈຳ ເປນຕອງໃຊເລອຍໆເພາະວາ OcrInput.MinimumDPI ແລະ OcrInput.TargetDPI ຈະອດຕະໂນມດຈບແລະແກໄຂບນຫາການ ນຳ ເຂາທມຄວາມລະອຽດຕ ຳ.
CleanBackgroundNoise. ນແມນການຕງຄາທໃຊເວລາຫລາຍສມຄວນ; ເຖງຢາງໃດກຕາມ, ມນຊວຍໃຫຫອງສະ ໝດ ສາມາດອະນາໄມສງລບກວນດຈຕອລ, ອດເອກະສານເຈຍແລະຂບກຜອງອນໆໂດຍອດຕະໂນມດພາຍໃນຮບພາບດຈຕອນເຊງຖາບດງນນມນຈະບສາມາດອານໄດຈາກຫອງສະ ໝດ OCR ອນໆ.
EnhanceContrast ແມນການຕງຄາທເຮດໃຫ IronOCR ເພມຄວາມກງກນຂາມຂອງຂຄວາມທຽບໃສພນຫລງຂອງຮບພາບ, ເພມຄວາມຖກຕອງຂອງ OCR ແລະໂດຍທວໄປຈະເພມປະສດທພາບແລະຄວາມໄວຂອງ OCR.
EnhanceResolution ແມນການຕງຄາເຊງຈະກວດພບຮບພາບທມຄວາມລະອຽດຕ ຳ ໂດຍອດຕະໂນມດ (ເຊງຢພາຍໃຕ 275 dpi) ແລະປບປງຮບພາບໂດຍອດຕະໂນມດແລະຫງຈາກນນເຮດໃຫເນອໃນທງ ໝດ ເລກຂນເພອໃຫມນສາມາດອານໄດໂດຍຫອງສະ ໝດ OCR. ເຖງແມນວາການປະຕບດງານນແມນໃຊເວລາໃນຕວມນເອງ, ມນໂດຍທວໄປຊວຍຫດຜອນເວລາໂດຍລວມ ສຳ ລບການປະຕບດງານຂອງ OCR ໃນພາບ.
Language IronOCR ສະ ໜບ ສະ ໜນ 22 ຊອງພາສາສາກນ, ແລະການຕງຄາພາສາສາມາດໃຊເພອເລອກ ໜງ ຫລຫລາຍພາສາທຈະໃຊເພອປະຕບດງານ OCR.
ຍດທະສາດ IronOCR ສະຫນບສະຫນນທງສອງຍດທະສາດ. ພວກເຮາອາດຈະເລອກທຈະສະແກນເອກະສານໄດໄວແລະບຖກຕອງ, ຫລໃຊກນລະຍດທກາວ ໜາ ເຊງໃຊຮບແບບທາງປນຍາປະດດບາງຢາງເພອປບປງຄວາມຖກຕອງຂອງຂຄວາມ OCR ໂດຍອດຕະໂນມດໂດຍການເບງການພວພນທາງສະຖຕຂອງ ຄຳ ສບກບກນແລະກນໃນປະໂຫຍກ .
ColorSpace ແມນການຕງຄາທພວກເຮາສາມາດເລອກທຈະເລອກເອາ OCR ດວຍສເທາຫສ. ໂດຍທວໄປແລວ, grayscale ແມນຕວເລອກທດທສດ. ເຖງຢາງໃດກຕາມ, ບາງຄງເມອມບດເລອງຫລພນຫລງຂອງສທຄາຍຄກນແຕມສແຕກຕາງກນຫາຍ, ພນທສເຕມຮບແບບຈະໃຫຜນໄດຮບທດກວາ.
ກວດສອບWhiteTextOnDarkBackgrounds. ໂດຍທວໄປແລວ, ຫອງສະ ໝດ OCR ທງ ໝດ ຄາດວາຈະເຫນຂຄວາມສ ດຳ ໃນພນຖານສຂາວ. ການຕງຄານຊວຍໃຫ IronOCR ສາມາດກວດພບຂເສຍ, ຫ ໜາ ຊ ຳ ໂດຍອດຕະໂນມດດວຍຂຄວາມຂາວແລະອານມນ.
InputImageType. ການຕງຄານຊວຍໃຫນກພດທະນາສາມາດ ນຳ ພາຫອງສະມດ OCR ວາມນ ກຳ ລງເບງເອກະສານເຕມຮບແບບຫລ snippet ເຊນ screenshot.
RotateAndStraighten ແມນການຕງຄາຂນສງເຊງຊວຍໃຫ IronOCR ມຄວາມສາມາດອານເອກະສານທບພຽງແຕ ໝນ ວຽນເທານນ, ແຕບາງທອາດມມມມອງເຊນການຖາຍຮບເອກະສານຂຄວາມ.
ReadBarcodes ແມນຄນລກສະນະທເປນປະໂຫຍດເຊງຊວຍໃຫ IronOCR ສາມາດອານລະຫດແລະລະຫດ QR ໂດຍອດຕະໂນມດໃນ ໜາ ຕາງໆເພາະມນຍງອານຕວ ໜງ ສ, ໂດຍບຕອງເພມພາລະເວລາເພມເຕມໃຫຍ.
ColorDepth. ການຕງຄານຈະ ກຳ ນດ ຈຳ ນວນບດຕ pixels ຂະ ໜາດ ໃດທຫສະ ໝດ OCR ຈະໃຊເພອ ກຳ ນດຄວາມເລກຂອງສ. ຄວາມເລກສທສງຂນອາດຈະເຮດໃຫຄນນະພາບຂອງ OCR ເພມຂນ, ແຕຍງຈະເຮດໃຫເວລາທ ຈຳ ເປນ ສຳ ລບການ ດຳ ເນນງານຂອງ OCR ສຳ ເລດ.
126 ຊອງພາສາ
IronOCR ສະ ໜບ ສະ ໜນ 126 ພາສາຕາງປະເທດ ຜານແພກພາສາເຊງແຈກຢາຍເປນ DLL, ເຊງສາມາດ ດາວໂຫລດໄດຈາກເວບໄຊທນ , ຫຈາກ ຜຈດການ Package NuGet .
ພາສາຕາງໆປະກອບມພາສາເຢຍລະມນ, ຝຣງ, ອງກດ, ຈນ, ຍປນແລະອນໆ. ຊອງພາສາພເສດມຢ ສຳ ລບ ໜງ ສຜານແດນ MRZ, ໃບກວດສອບ MICR, ຂມນການເງນ, ປາຍທະບຽນແລະອກຫລາຍໆຢາງ. ທານຍງສາມາດໃຊເອກະສານໃດກໄດ. ". traineddata" - ລວມທງເອກະສານທທານສາງເອງ.
ຕວຢາງພາສາ
ການ ນຳ ໃຊພາສາ OCR ອນໆ.
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// ຕມການກນຕອງຮບພາບຖາ ຈຳ ເປນ
// ໃນກລະນດງກາວນ, ແມນແຕຄວາມຄດທປອນເຂາແມນມຄນນະພາບຕາຫາຍ
// IronTesseract ສາມາດອານສງທ Tesseract ທຳ ມະດາບສາມາດເຮດໄດ.
var Result = Ocr.Read(input);
// Console ບສາມາດພມພາສາອາຫລບໃນ Windows ໄດງາຍ.
// ໃຫເຮາເກບຂມນໃສແຜນອນແທນ.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// ຕມການກນຕອງຮບພາບຖາ ຈຳ ເປນ
// ໃນກລະນດງກາວນ, ແມນແຕຄວາມຄດທປອນເຂາແມນມຄນນະພາບຕາຫາຍ
// IronTesseract ສາມາດອານສງທ Tesseract ທຳ ມະດາບສາມາດເຮດໄດ.
var Result = Ocr.Read(input);
// Console ບສາມາດພມພາສາອາຫລບໃນ Windows ໄດງາຍ.
// ໃຫເຮາເກບຂມນໃສແຜນອນແທນ.
Result.SaveAsTextFile("arabic.txt");
}
Imports IronOcr
Dim Ocr As New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input As New OcrInput()
input.AddImage("img/arabic.gif")
' ຕມການກນຕອງຮບພາບຖາ ຈຳ ເປນ
' ໃນກລະນດງກາວນ, ແມນແຕຄວາມຄດທປອນເຂາແມນມຄນນະພາບຕາຫາຍ
' IronTesseract ສາມາດອານສງທ Tesseract ທຳ ມະດາບສາມາດເຮດໄດ.
Dim Result = Ocr.Read(input)
' Console ບສາມາດພມພາສາອາຫລບໃນ Windows ໄດງາຍ.
' ໃຫເຮາເກບຂມນໃສແຜນອນແທນ.
Result.SaveAsTextFile("arabic.txt")
End Using
ຕວຢາງຫລາຍພາສາ
ມນຍງເປນໄປໄດທ OCR ໃຊຫລາຍພາສາໃນເວລາດຽວກນ. ສງນສາມາດຊວຍໃຫມ metadata ແລະ url ທເປນພາສາອງກດໃນເອກະສານ Unicode.
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Lao);
// ພວກເຮາສາມາດເພມ ຈຳ ນວນພາສາໃດໆ
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Lao);
// ພວກເຮາສາມາດເພມ ຈຳ ນວນພາສາໃດໆ
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
Imports IronOcr
Dim Ocr As New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Lao)
' ພວກເຮາສາມາດເພມ ຈຳ ນວນພາສາໃດໆ
Using input As New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
ຈດປະສງຜນໄດຮບລະອຽດຂອງ OCR
ທາດເຫກ OCR ສງຄນວດຖຜນຂອງ OCR ສຳ ລບການ ດຳ ເນນງານແຕລະ OCR. ໂດຍທວໄປ, ນກພດທະນາພຽງແຕໃຊຄນສມບດຕວ ໜງ ສຂອງວດຖນເພອໃຫຂຄວາມສະແກນຈາກພາບ. ເຖງຢາງໃດກຕາມ, OCR ຜນໄດຮບ DOM ແມນກາວ ໜາ ຫາຍກວານ.
using IronOcr;
using System.Drawing; //ເພມເອກະສານອາງອງການປະຊມ
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //ທ ສຳ ຄນ
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// ສຳ ຫວດທນເພອຊອກຫາລາຍລະອຽດທໃຫຍແລະ API:
// - ໜາ ຕາງໆ, ທອນໄມ, ພາສາ Paraphaphs, ເສນ, ຄຳ ສບ, Chars
// - ການສງອອກຮບພາບ, ການປະສານງານແບບອກສອນ, ຂມນສະຖຕ
}
using IronOcr;
using System.Drawing; //ເພມເອກະສານອາງອງການປະຊມ
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //ທ ສຳ ຄນ
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// ສຳ ຫວດທນເພອຊອກຫາລາຍລະອຽດທໃຫຍແລະ API:
// - ໜາ ຕາງໆ, ທອນໄມ, ພາສາ Paraphaphs, ເສນ, ຄຳ ສບ, Chars
// - ການສງອອກຮບພາບ, ການປະສານງານແບບອກສອນ, ຂມນສະຖຕ
}
Imports IronOcr
Imports System.Drawing 'ເພມເອກະສານອາງອງການປະຊມ
Dim Ocr As New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'ທ ສຳ ຄນ
Using Input As New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' ສຳ ຫວດທນເພອຊອກຫາລາຍລະອຽດທໃຫຍແລະ API:
' - ໜາ ຕາງໆ, ທອນໄມ, ພາສາ Paraphaphs, ເສນ, ຄຳ ສບ, Chars
' - ການສງອອກຮບພາບ, ການປະສານງານແບບອກສອນ, ຂມນສະຖຕ
End Using
ການປະຕບດ
IronOCR ເຮດວຽກອອກຈາກຫອງໂດຍບ ຈຳ ເປນຕອງປບແຕງການປະຕບດຫດດແປງຮບພາບການປອນຂມນເຂາ.
ຄວາມໄວແມນໄຟ ໄໝ: IronOCR.2020 + ໄວກວາ 10 ເທາແລະເຮດຜດພາດຫລາຍກວາ 250% ໜອຍ ກວາການກສາງທຜານມາ.
ຮຽນຮເພມເຕມ
ເພອຮຽນຮເພມເຕມກຽວກບ OCR ໃນພາສາ C #, VB, F #, ຫພາສາອນໆ. ກະລນາ ອານການສອນຊມຊນຂອງພວກເຮາ , ເຊງໃຫຕວຢາງຕວຈງຂອງໂລກກຽວກບວທການໃຊ IronOCR ແລະສາມາດສະແດງໃຫເຫນເຖງວທການທດທສດ. ຫອງສະຫມດນ.
ການ ອາງອງວດຖ ເຕມຮບແບບ ສຳ ລບນກພດທະນາ. ສດທ .

