Lao OCR ໃນ C#ແລະ .NET

ສະບບອນໆຂອງເອກະສານນ:

IronOCR ແມນສວນປະກອບຂອງຊອບແວ C#ທອະນຍາດໃຫ .NET coders ສາມາດອານຂຄວາມຈາກຮບພາບແລະເອກະສານ PDF ເປນ 126 ພາສາ, ລວມທງພາສາລາວ.

ມນແມນຄວາມຍາວຂອງສອມທກາວ ໜາ ຂອງ Tesseract, ສາງສະເພາະ ສຳ ລບນກພດທະນາ. ສດທແລະເປນເຄອງຈກ Tesseract ອນໆທກາວ ໜາ ຂນເລອຍໆ ສຳ ລບທງຄວາມໄວແລະຄວາມຖກຕອງ.

ເນອໃນຂອງ IronOcr.Languages.Lao

ຊດນມ 90 ພາສາ OCR ສຳ ລບ .NET:

  • ລາວ
  • LaoBest
  • LaoFast
  • LaoAlphabet
  • LaoAlphabetBest
  • LaoAlphabetFast

ດາວໂຫລດ

ຊດ ພາສາລາວ [ພາສາລາວ]
* Download as ຫດໄປສະນ
* Install with as
https://www.nuget.org/packages/IronOcr.Languages.Lao/'> NuGet

ການຕດຕງ

ສງ ທຳ ອດທພວກເຮາຕອງເຮດແມນຕດຕງຊດ OCR Lao ຂອງພວກເຮາເຂາໃນໂຄງການ. ສດທຂອງທານ.

PM> Install Package IronOCR.Languages.Lao

ຕວຢາງລະຫດ

ຕວຢາງລະຫດ C#ນອານຕວ ໜງ ສລາວຈາກເອກະສານ Image ຫ PDF.

//PM> Install Package IronOcr.Languages.Lao
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput(@"images\Lao.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install Package IronOcr.Languages.Lao
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput(@"images\Lao.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
Imports IronOcr

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using Input = New OcrInput("images\Lao.png")
    Dim Result = Ocr.Read(Input)
    Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel

ເປນຫຍງເລອກ IronOCR?

IronOCR ແມນຫອງສະຫມດຊອບແວທງາຍຕການຕດຕງ, ຄບຖວນແລະມເອກະສານທດ.

ເລອກ IronOCR ເພອບນລ ຄວາມຖກຕອງ 99,8% + OCR ໂດຍບຕອງໃຊບລການເວບນອກ, ຄາ ທຳ ນຽມຕເນອງຫສງເອກະສານທເປນຄວາມລບຜານອນເຕເນດ.

ເປນຫຍງນກພດທະນາ C#ເລອກ IronOCR ໃນໄລຍະ Vanilla Tesseract:

  • ຕດຕງເປນ DLL ຫ Nuget ດຽວ
  • ປະກອບມ ສຳ ລບເຄອງຈກໃນການຂນສງເຄອງຈກ Tesseract 5, 4 ແລະ 3 ອອກຈາກຫອງດງກາວ.
  • ຄວາມຖກຕອງ 99,8% ຫາຍກວາຜນໄດຮບທແທຈງ Tesseract.
  • ຄວາມໄວ Blazing ແລະ MultiThreading
  • MVC, WebApp, Desktop, Console & Server Application ເຂາກນໄດ
  • ບມລະຫດ Exes ຫ C ++ ເພອເຮດວຽກກບ
  • ສະຫນບສະຫນນ PDF OCR ເຕມຮບແບບ
  • ເພອປະຕບດ OCR ເກອບທກເອກະສານຮບພາບຫ PDF
  • ເຕມ .NET Core, ມາດຕະຖານແລະ FrameWork ສະຫນບສະຫນນ
  • ໃຊງານເທງ Windows, Mac, Linux, Azure, Docker, Lambda, AWS
  • ອານລະຫດບາໂຄດແລະ QR
  • ສງອອກ OCR ເປນ XHTML
  • ສງອອກ OCR ເພອຊອກຫາເອກະສານ PDF
  • ສະຫນບສະຫນນ Multithreading
  • 126 ພາສາສາກນທຄມຄອງໂດຍຜານໄຟລ Nuget ຫ OcrData
  • ສະກດຮບພາບ, ການປະສານງານ, ສະຖຕແລະຕວອກສອນ. ບພຽງແຕຂຄວາມເທານນ.
  • ສາມາດຖກ ນຳ ໃຊເພອແຈກຈາຍ Tesseract OCR ພາຍໃນ ຄຳ ຮອງສະຫມກດານການຄາແລະເປນເຈາຂອງ.

ທາດເຫກ OCR ເຫລອມເມອເຮດວຽກກບຮບພາບຂອງໂລກແທແລະເອກະສານທບສມບນແບບເຊນ: ຮບຖາຍ, ຫລສະແກນຄວາມລະອຽດຕ ຳ ເຊງອາດຈະມສຽງດງຫລບສມບນແບບ.

ຫອງສະຫມດ OCR ອນໆທ ບເສຍຄາ ສຳ ລບແພລະຕະຟອມສດທ .NET ແລະການບລການເວບໄຊຕອນໆ.

OCR ກບ Tesseract 5 - ເລມຕນລະຫດໃນ C #

ຕວຢາງລະຫດຂາງລມນສະແດງໃຫເຫນວາມນງາຍທຈະອານຂຄວາມຈາກຮບໃດ ໜງ ໂດຍໃຊ C#ຫ VB .NET.

OneLiner

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
$vbLabelText   $csharpLabel

ຕງຄາສະບາຍດໂລກ

// PM> Install Package IronOCR.Languages.Lao
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... ທານສາມາດເພມ ຈຳ ນວນຮບພາບໃດໆ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install Package IronOCR.Languages.Lao
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... ທານສາມາດເພມ ຈຳ ນວນຮບພາບໃດໆ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Dim Ocr As New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using Input As New OcrInput()
    Input.AddImage("images/sample.jpeg")
    '... ທານສາມາດເພມ ຈຳ ນວນຮບພາບໃດໆ
    Dim Result = Ocr.Read(Input)
    Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

C#PDF OCR

ວທການແບບດຽວກນນສາມາດຖກ ນຳ ໃຊເພອສະກດຂຄວາມຈາກເອກະສານ PDF ໃດໆ.

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// ພວກເຮາຍງສາມາດເລອກ ໝາຍ ເລກ ໜາ PDF ທແນນອນໃຫ OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 ໜາ ສຳ ລບທກໆ ໜາ ຂອງ PDF
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// ພວກເຮາຍງສາມາດເລອກ ໝາຍ ເລກ ໜາ PDF ທແນນອນໃຫ OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 ໜາ ສຳ ລບທກໆ ໜາ ຂອງ PDF
}
Imports IronOcr

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using input As New OcrInput()
    input.AddPdf("example.pdf", "password")
    ' ພວກເຮາຍງສາມາດເລອກ ໝາຍ ເລກ ໜາ PDF ທແນນອນໃຫ OCR

    Dim Result = Ocr.Read(input)

    Console.WriteLine(Result.Text)
    Console.WriteLine($"{Result.Pages.Count()} Pages")
    ' 1 ໜາ ສຳ ລບທກໆ ໜາ ຂອງ PDF
End Using
$vbLabelText   $csharpLabel

OCR ສຳ ລບ MultiPage TIFFs

OCR ອານ TIFF ຮບແບບເອກະສານລວມທງເອກະສານຫາຍ ໜາ. TIFF ຍງສາມາດປຽນເປນເອກະສານ PDF ໂດຍກງດວຍຂຄວາມທສາມາດຄນຫາໄດ.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

ລະຫດບາໂຄດແລະ QR

ຄນລກສະນະທເປນເອກະລກຂອງ IronOCR ແມນມນສາມາດອານລະຫດແລະລະຫດ QR ຈາກເອກະສານໃນຂະນະທມນ ກຳ ລງສະແກນຫາຕວ ໜງ ສ. ຕວຢາງຂອງ OcrResult.OcrBarcode Class ໃຫຂມນລະອຽດແກນກພດທະນາກຽວກບແຕລະ OcrResult.OcrBarcode ສະແກນ.

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// ປະເພດແລະຄນສມບດຂອງສະຖານທໄດຮບ
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// ປະເພດແລະຄນສມບດຂອງສະຖານທໄດຮບ
}
}
Imports IronOcr

Dim Ocr As New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input As New OcrInput()
    input.AddImage("img/Barcode.png")
    Dim Result = Ocr.Read(input)
    For Each Barcode In Result.Barcodes
        Console.WriteLine(Barcode.Value)
        ' ປະເພດແລະຄນສມບດຂອງສະຖານທໄດຮບ
    Next
End Using
$vbLabelText   $csharpLabel

OCR ກຽວກບພນທສະເພາະຂອງຮບພາບ

ທກໆວທການສະແກນແລະອານຂອງ IronOCR ໃຫຄວາມສາມາດລະບຢາງແນນອນວາພາກໃດຂອງ ໜາ ເວບຫລ ໜາ ເວບທພວກເຮາຕອງການອານຂຄວາມຈາກ. ນແມນສງທມປະໂຫຍດຫາຍເມອພວກເຮາ ກຳ ລງຊອກຫາຮບແບບທໄດມາດຕະຖານແລະສາມາດປະຫຍດເວລາແລະເຮດໃຫປະສດຕພາບດຂນ.

ເພອໃຊພນທປກພດ, ພວກເຮາຈະຕອງເພມເອກະສານອາງອງລະບບເຂາໃນ System.Drawing ເພອໃຫພວກເຮາສາມາດ ນຳ ໃຊວດຖ System.Drawing.Rectangle .

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ຂະ ໜາດ ແມນຢໃນ px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// ຂະ ໜາດ ແມນຢໃນ px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao

Using Input = New OcrInput()
    Dim ContentArea = New System.Drawing.Rectangle() With {.X = 215, .Y = 1250, .Height = 280, .Width = 1335}
    ' ຂະ ໜາດ ແມນຢໃນ px

    Input.Add("document.png", ContentArea)

    Dim Result = Ocr.Read(Input)
    Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

OCR ສຳ ລບການສະແກນຄນນະພາບຕ ຳ

ຫອງຮຽນ IronOCR OcrInput ສາມາດແກໄຂການສະແກນທ Tesseract ປກກະຕບສາມາດອານໄດ.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ແກໄຂສງລບກວນດຈຕອນແລະການສະແກນບດ
Input.Deskew(); // ແກໄຂການ ໝນ ວຽນແລະທດສະນະ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ແກໄຂສງລບກວນດຈຕອນແລະການສະແກນບດ
Input.Deskew(); // ແກໄຂການ ໝນ ວຽນແລະທດສະນະ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Dim Ocr As New IronTesseract()
Ocr.Language = OcrLanguage.Lao

Using Input As New OcrInput("img\Potter.LowQuality.tiff")
    Input.DeNoise() ' ແກໄຂສງລບກວນດຈຕອນແລະການສະແກນບດ
    Input.Deskew() ' ແກໄຂການ ໝນ ວຽນແລະທດສະນະ
    Dim Result = Ocr.Read(Input)
    Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

ສງອອກຜນ OCR ເປນ PDF ທສາມາດຄນຫາໄດ

ຮບພາບເຖງ PDF ດວຍບນດາຂຄວາມທສາມາດຄດລອກໄດ. ສາມາດຖກດດສະນໂດຍເຄອງຈກຊອກຫາແລະຖານຂມນ.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

TIFF ເພອການຊອກຫາການປຽນໃຈເຫລອມໃສ PDF

Convert ເອກະສານ TIFF (ຫກມຂອງເອກະສານຮບພາບໃດ ໜງ) ໂດຍກງກບເອກະສານ PDF ທສາມາດຄນຫາເຊງສາມາດຖກດດສະນໂດຍອນທະເນດ, ເວບໄຊທແລະເຄອງຈກຊອກຫາ google.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

ສງອອກຜນ OCR ເປນ HTML

ຮບພາບ OCR ກບ XHTML ປຽນໃຈເຫລອມໃສ.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
$vbLabelText   $csharpLabel

ການກນຕອງການປບປງຮບພາບ OCR

IronOCR ໃຫຕວກອງທເປນເອກະລກ ສຳ ລບວດຖ OcrInput ເພອປບປງການເຮດວຽກຂອງ OCR.

ຕວຢາງລະຫດເສມສາງຮບພາບ

ເຮດໃຫ OCR ປະກອບຮບພາບທມຄນນະພາບສງຂນເພອໃຫຜນໄດຮບທດກວາແລະໄວກວາ OCR.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ແກໄຂສງລບກວນດຈຕອນແລະການສະແກນບດ
Input.Deskew(); // ແກໄຂການ ໝນ ວຽນແລະທດສະນະ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ແກໄຂສງລບກວນດຈຕອນແລະການສະແກນບດ
Input.Deskew(); // ແກໄຂການ ໝນ ວຽນແລະທດສະນະ
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Dim Ocr As New IronTesseract()
Ocr.Language = OcrLanguage.Lao

Using Input As New OcrInput("LowQuality.jpeg")
    Input.DeNoise() ' ແກໄຂສງລບກວນດຈຕອນແລະການສະແກນບດ
    Input.Deskew() ' ແກໄຂການ ໝນ ວຽນແລະທດສະນະ
    Dim Result = Ocr.Read(Input)
    Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

ລາຍຊເຄອງກນຕອງຮບພາບ OCR

ການກນຕອງຂາເຂາເພອເພມປະສດທພາບ OCR ທຖກສາງຂນໃນ IronOCR ລວມມ:

  • OcrInput.Rotate (ສອງອງສາ) - ໝນ ຮບພາບຕາມ ຈຳ ນວນຂອງອງສາຕາມເຂມໂມງ. ສຳ ລບຕານໂມງເຂມໂມງ, ໃຊເລກລບ.
  • OcrInput.Binarize () - ຕວກອງຮບພາບນປຽນທກສແດງຫລສຂາວແລະບມພນ. ອາດຈະປບປງກລະນການປະຕບດ OCR ຂອງກງກນຂາມຕ ຳ ຫາຍຂອງຂຄວາມເຖງພນຫລງ.
  • OcrInput.ToGrayScale () - ຕວກອງຮບພາບນເຮດໃຫທກໆ pixel ເປນຮມຂອງສຂເຖາ. ບຫນາຈະເປນການປບປງຄວາມຖກຕອງຂອງ OCR ແຕອາດຈະປບປງຄວາມໄວ
  • OcrInput.Contrast () - ເພມຄວາມກງກນຂາມໂດຍອດຕະໂນມດ. ການກນຕອງນມກຈະປບປງຄວາມໄວ OCR ແລະຄວາມຖກຕອງໃນການສະແກນກງກນຂາມຕ ຳ.
  • OcrInput.DeNoise () - ລບສຽງລບກວນດຈຕອລ. ການກນຕອງນຄວນຈະຖກ ນຳ ໃຊໃນບອນທມສຽງດງ.
  • OcrInput.Invert () - ປຽນທກສ. ຕວຢາງຂາວກາຍເປນສ ດຳ: ສ ດຳ ກາຍເປນສຂາວ.
  • OcrInput.Dilate () - Advanced Morphology. Dilation ເພມ pixels ໃຫເຂດແດນຂອງວດຖໃນພາບ. ກງກນຂາມຂອງ Erode
  • OcrInput.Erode () - Advanced Morphology. ການເຊາະເຈອນ ກຳ ຈດ pixels ລວງໃນຂອບເຂດແດນວດຖ .Pososite ຂອງ Dilate
  • OcrInput.Deskew () - ໝນ ຮບພາບເພອໃຫມນເປນທາງຂນແລະທາງຂວາ. ນແມນມປະໂຫຍດຫາຍ ສຳ ລບ OCR ເພາະວາຄວາມອດທນຂອງເສນເລອດ ສຳ ລບການສະແກນສະເກດຈະຢໃນລະດບຕາເຖງ 5 ອງສາ.
  • OcrInput.DeepCleanBackgroundNoise () - ການ ກຳ ຈດສງລບກວນໃນພນຫລງຢາງ ໜກ. ໃຊພຽງແຕຕວກອງນໃນກລະນທມສຽງດງໃນເບອງຫລງຂອງເອກະສານທເປນທຮຈກ, ເພາະວາຕວກອງນຍງຈະສຽງຕການຫດຜອນຄວາມຖກຕອງຂອງ OCR ຂອງເອກະສານທສະອາດ, ແລະມລາຄາແພງຫາຍຕ CPU.
  • OcrInput.EnhanceResolution - ຊວຍເພມຄວາມລະອຽດຂອງພາບທມຄນນະພາບຕ ຳ. ຕວກອງນບ ຈຳ ເປນຕອງໃຊເລອຍໆເພາະວາ OcrInput.MinimumDPI ແລະ OcrInput.TargetDPI ຈະອດຕະໂນມດຈບແລະແກໄຂບນຫາການ ນຳ ເຂາທມຄວາມລະອຽດຕ ຳ.

CleanBackgroundNoise. ນແມນການຕງຄາທໃຊເວລາຫລາຍສມຄວນ; ເຖງຢາງໃດກຕາມ, ມນຊວຍໃຫຫອງສະ ໝດ ສາມາດອະນາໄມສງລບກວນດຈຕອລ, ອດເອກະສານເຈຍແລະຂບກຜອງອນໆໂດຍອດຕະໂນມດພາຍໃນຮບພາບດຈຕອນເຊງຖາບດງນນມນຈະບສາມາດອານໄດຈາກຫອງສະ ໝດ OCR ອນໆ.

EnhanceContrast ແມນການຕງຄາທເຮດໃຫ IronOCR ເພມຄວາມກງກນຂາມຂອງຂຄວາມທຽບໃສພນຫລງຂອງຮບພາບ, ເພມຄວາມຖກຕອງຂອງ OCR ແລະໂດຍທວໄປຈະເພມປະສດທພາບແລະຄວາມໄວຂອງ OCR.

EnhanceResolution ແມນການຕງຄາເຊງຈະກວດພບຮບພາບທມຄວາມລະອຽດຕ ຳ ໂດຍອດຕະໂນມດ (ເຊງຢພາຍໃຕ 275 dpi) ແລະປບປງຮບພາບໂດຍອດຕະໂນມດແລະຫງຈາກນນເຮດໃຫເນອໃນທງ ໝດ ເລກຂນເພອໃຫມນສາມາດອານໄດໂດຍຫອງສະ ໝດ OCR. ເຖງແມນວາການປະຕບດງານນແມນໃຊເວລາໃນຕວມນເອງ, ມນໂດຍທວໄປຊວຍຫດຜອນເວລາໂດຍລວມ ສຳ ລບການປະຕບດງານຂອງ OCR ໃນພາບ.

Language IronOCR ສະ ໜບ ສະ ໜນ 22 ຊອງພາສາສາກນ, ແລະການຕງຄາພາສາສາມາດໃຊເພອເລອກ ໜງ ຫລຫລາຍພາສາທຈະໃຊເພອປະຕບດງານ OCR.

ຍດທະສາດ IronOCR ສະຫນບສະຫນນທງສອງຍດທະສາດ. ພວກເຮາອາດຈະເລອກທຈະສະແກນເອກະສານໄດໄວແລະບຖກຕອງ, ຫລໃຊກນລະຍດທກາວ ໜາ ເຊງໃຊຮບແບບທາງປນຍາປະດດບາງຢາງເພອປບປງຄວາມຖກຕອງຂອງຂຄວາມ OCR ໂດຍອດຕະໂນມດໂດຍການເບງການພວພນທາງສະຖຕຂອງ ຄຳ ສບກບກນແລະກນໃນປະໂຫຍກ .

ColorSpace ແມນການຕງຄາທພວກເຮາສາມາດເລອກທຈະເລອກເອາ OCR ດວຍສເທາຫສ. ໂດຍທວໄປແລວ, grayscale ແມນຕວເລອກທດທສດ. ເຖງຢາງໃດກຕາມ, ບາງຄງເມອມບດເລອງຫລພນຫລງຂອງສທຄາຍຄກນແຕມສແຕກຕາງກນຫາຍ, ພນທສເຕມຮບແບບຈະໃຫຜນໄດຮບທດກວາ.

ກວດສອບWhiteTextOnDarkBackgrounds. ໂດຍທວໄປແລວ, ຫອງສະ ໝດ OCR ທງ ໝດ ຄາດວາຈະເຫນຂຄວາມສ ດຳ ໃນພນຖານສຂາວ. ການຕງຄານຊວຍໃຫ IronOCR ສາມາດກວດພບຂເສຍ, ຫ ໜາ ຊ ຳ ໂດຍອດຕະໂນມດດວຍຂຄວາມຂາວແລະອານມນ.

InputImageType. ການຕງຄານຊວຍໃຫນກພດທະນາສາມາດ ນຳ ພາຫອງສະມດ OCR ວາມນ ກຳ ລງເບງເອກະສານເຕມຮບແບບຫລ snippet ເຊນ screenshot.

RotateAndStraighten ແມນການຕງຄາຂນສງເຊງຊວຍໃຫ IronOCR ມຄວາມສາມາດອານເອກະສານທບພຽງແຕ ໝນ ວຽນເທານນ, ແຕບາງທອາດມມມມອງເຊນການຖາຍຮບເອກະສານຂຄວາມ.

ReadBarcodes ແມນຄນລກສະນະທເປນປະໂຫຍດເຊງຊວຍໃຫ IronOCR ສາມາດອານລະຫດແລະລະຫດ QR ໂດຍອດຕະໂນມດໃນ ໜາ ຕາງໆເພາະມນຍງອານຕວ ໜງ ສ, ໂດຍບຕອງເພມພາລະເວລາເພມເຕມໃຫຍ.

ColorDepth. ການຕງຄານຈະ ກຳ ນດ ຈຳ ນວນບດຕ pixels ຂະ ໜາດ ໃດທຫສະ ໝດ OCR ຈະໃຊເພອ ກຳ ນດຄວາມເລກຂອງສ. ຄວາມເລກສທສງຂນອາດຈະເຮດໃຫຄນນະພາບຂອງ OCR ເພມຂນ, ແຕຍງຈະເຮດໃຫເວລາທ ຈຳ ເປນ ສຳ ລບການ ດຳ ເນນງານຂອງ OCR ສຳ ເລດ.

126 ຊອງພາສາ

IronOCR ສະ ໜບ ສະ ໜນ 126 ພາສາຕາງປະເທດ ຜານແພກພາສາເຊງແຈກຢາຍເປນ DLL, ເຊງສາມາດ ດາວໂຫລດໄດຈາກເວບໄຊທນ , ຫຈາກ ຜຈດການ Package NuGet .

ພາສາຕາງໆປະກອບມພາສາເຢຍລະມນ, ຝຣງ, ອງກດ, ຈນ, ຍປນແລະອນໆ. ຊອງພາສາພເສດມຢ ສຳ ລບ ໜງ ສຜານແດນ MRZ, ໃບກວດສອບ MICR, ຂມນການເງນ, ປາຍທະບຽນແລະອກຫລາຍໆຢາງ. ທານຍງສາມາດໃຊເອກະສານໃດກໄດ. ". traineddata" - ລວມທງເອກະສານທທານສາງເອງ.

ຕວຢາງພາສາ

ການ ນຳ ໃຊພາສາ OCR ອນໆ.

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// ຕມການກນຕອງຮບພາບຖາ ຈຳ ເປນ
// ໃນກລະນດງກາວນ, ແມນແຕຄວາມຄດທປອນເຂາແມນມຄນນະພາບຕາຫາຍ
// IronTesseract ສາມາດອານສງທ Tesseract ທຳ ມະດາບສາມາດເຮດໄດ.

var Result = Ocr.Read(input);

// Console ບສາມາດພມພາສາອາຫລບໃນ Windows ໄດງາຍ.
// ໃຫເຮາເກບຂມນໃສແຜນອນແທນ.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// ຕມການກນຕອງຮບພາບຖາ ຈຳ ເປນ
// ໃນກລະນດງກາວນ, ແມນແຕຄວາມຄດທປອນເຂາແມນມຄນນະພາບຕາຫາຍ
// IronTesseract ສາມາດອານສງທ Tesseract ທຳ ມະດາບສາມາດເຮດໄດ.

var Result = Ocr.Read(input);

// Console ບສາມາດພມພາສາອາຫລບໃນ Windows ໄດງາຍ.
// ໃຫເຮາເກບຂມນໃສແຜນອນແທນ.
Result.SaveAsTextFile("arabic.txt");
}
Imports IronOcr

Dim Ocr As New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input As New OcrInput()
    input.AddImage("img/arabic.gif")
    ' ຕມການກນຕອງຮບພາບຖາ ຈຳ ເປນ
    ' ໃນກລະນດງກາວນ, ແມນແຕຄວາມຄດທປອນເຂາແມນມຄນນະພາບຕາຫາຍ
    ' IronTesseract ສາມາດອານສງທ Tesseract ທຳ ມະດາບສາມາດເຮດໄດ.

    Dim Result = Ocr.Read(input)

    ' Console ບສາມາດພມພາສາອາຫລບໃນ Windows ໄດງາຍ.
    ' ໃຫເຮາເກບຂມນໃສແຜນອນແທນ.
    Result.SaveAsTextFile("arabic.txt")
End Using
$vbLabelText   $csharpLabel

ຕວຢາງຫລາຍພາສາ

ມນຍງເປນໄປໄດທ OCR ໃຊຫລາຍພາສາໃນເວລາດຽວກນ. ສງນສາມາດຊວຍໃຫມ metadata ແລະ url ທເປນພາສາອງກດໃນເອກະສານ Unicode.

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Lao);

// ພວກເຮາສາມາດເພມ ຈຳ ນວນພາສາໃດໆ

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Lao);

// ພວກເຮາສາມາດເພມ ຈຳ ນວນພາສາໃດໆ

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
Imports IronOcr

Dim Ocr As New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Lao)

' ພວກເຮາສາມາດເພມ ຈຳ ນວນພາສາໃດໆ

Using input As New OcrInput()
    input.Add("multi - language.pdf")
    Dim Result = Ocr.Read(input)
    Result.SaveAsTextFile("results.txt")
End Using
$vbLabelText   $csharpLabel

ຈດປະສງຜນໄດຮບລະອຽດຂອງ OCR

ທາດເຫກ OCR ສງຄນວດຖຜນຂອງ OCR ສຳ ລບການ ດຳ ເນນງານແຕລະ OCR. ໂດຍທວໄປ, ນກພດທະນາພຽງແຕໃຊຄນສມບດຕວ ໜງ ສຂອງວດຖນເພອໃຫຂຄວາມສະແກນຈາກພາບ. ເຖງຢາງໃດກຕາມ, OCR ຜນໄດຮບ DOM ແມນກາວ ໜາ ຫາຍກວານ.

using IronOcr;
using System.Drawing; //ເພມເອກະສານອາງອງການປະຊມ

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //ທ ສຳ ຄນ

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// ສຳ ຫວດທນເພອຊອກຫາລາຍລະອຽດທໃຫຍແລະ API:
// - ໜາ ຕາງໆ, ທອນໄມ, ພາສາ Paraphaphs, ເສນ, ຄຳ ສບ, Chars
// - ການສງອອກຮບພາບ, ການປະສານງານແບບອກສອນ, ຂມນສະຖຕ
}
using IronOcr;
using System.Drawing; //ເພມເອກະສານອາງອງການປະຊມ

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Lao;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //ທ ສຳ ຄນ

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// ສຳ ຫວດທນເພອຊອກຫາລາຍລະອຽດທໃຫຍແລະ API:
// - ໜາ ຕາງໆ, ທອນໄມ, ພາສາ Paraphaphs, ເສນ, ຄຳ ສບ, Chars
// - ການສງອອກຮບພາບ, ການປະສານງານແບບອກສອນ, ຂມນສະຖຕ
}
Imports IronOcr
Imports System.Drawing 'ເພມເອກະສານອາງອງການປະຊມ

Dim Ocr As New IronTesseract()
Ocr.Language = OcrLanguage.Lao
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'ທ ສຳ ຄນ

Using Input As New OcrInput("images\sample.tiff")
    Dim Result As OcrResult = Ocr.Read(Input)
    Dim Pages = Result.Pages
    Dim Words = Pages(0).Words
    Dim Barcodes = Result.Barcodes
    ' ສຳ ຫວດທນເພອຊອກຫາລາຍລະອຽດທໃຫຍແລະ API:
    ' - ໜາ ຕາງໆ, ທອນໄມ, ພາສາ Paraphaphs, ເສນ, ຄຳ ສບ, Chars
    ' - ການສງອອກຮບພາບ, ການປະສານງານແບບອກສອນ, ຂມນສະຖຕ
End Using
$vbLabelText   $csharpLabel

ການປະຕບດ

IronOCR ເຮດວຽກອອກຈາກຫອງໂດຍບ ຈຳ ເປນຕອງປບແຕງການປະຕບດຫດດແປງຮບພາບການປອນຂມນເຂາ.

ຄວາມໄວແມນໄຟ ໄໝ: IronOCR.2020 + ໄວກວາ 10 ເທາແລະເຮດຜດພາດຫລາຍກວາ 250% ໜອຍ ກວາການກສາງທຜານມາ.

ຮຽນຮເພມເຕມ

ເພອຮຽນຮເພມເຕມກຽວກບ OCR ໃນພາສາ C #, VB, F #, ຫພາສາອນໆ. ກະລນາ ອານການສອນຊມຊນຂອງພວກເຮາ , ເຊງໃຫຕວຢາງຕວຈງຂອງໂລກກຽວກບວທການໃຊ IronOCR ແລະສາມາດສະແດງໃຫເຫນເຖງວທການທດທສດ. ຫອງສະຫມດນ.

ການ ອາງອງວດຖ ເຕມຮບແບບ ສຳ ລບນກພດທະນາ. ສດທ .