OCR na hÉireann i C#agus .NET

Leaganacha eile den doiciméad seo:

Is comhpháirt bogearraí C#é IronOCR a ligeann do chódaitheoirí .NET téacs a léamh ó íomhánna agus ó dhoiciméid PDF i 126 teanga, an Ghaeilge san áireamh.

Is forc ardteicneolaíochta de Tesseract é, a tógadh go heisiach d’fhorbróirí .NET agus a dhéanann feidhmíocht níos fearr ná innill Tesseract eile go rialta maidir le luas agus cruinneas.

Clár ábhair IronOcr.Languages.Irish

Tá 40 teanga OCR sa phacáiste seo le haghaidh .NET:

  • Gaeilge
  • IrishBest
  • IrishFast

Íoslódáil

Pacáiste Gaeilge [Gaeilge]
* Download as Zip
* Install with as
https://www.nuget.org/packages/IronOcr.Languages.Irish/'> NuGet

Suiteáil

Is é an chéad rud a chaithfimid a dhéanamh ná ár bpacáiste OCR Éireannach a shuiteáil ar do thionscadal .NET.

PM> Install-Package IronOCR.Languages.Irish

Sampla Cód

Léann an sampla seo de chód C#téacs Gaeilge ó dhoiciméad Íomhá nó PDF.

//PM> Install-Package IronOcr.Languages.Irish
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;
using (var Input = new OcrInput(@"images\Irish.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Irish
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;
using (var Input = new OcrInput(@"images\Irish.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Irish
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Irish
Using Input = New OcrInput("images\Irish.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

Cén fáth Roghnaigh IronOCR?

Is leabharlann bogearraí .NET atá éasca le suiteáil, iomlán agus doiciméadaithe go maith é IronOCR.

Roghnaigh IronOCR chun cruinneas 99.8% + OCR a bhaint amach gan aon seirbhísí seachtracha gréasáin, táillí leanúnacha a úsáid nó doiciméid rúnda a sheoladh ar an idirlíon.

Cén fáth a roghnaíonn forbróirí C#IronOCR thar Vanilla Tesseract:

  • Suiteáil mar DLL nó NuGet amháin
  • Áirítear le haghaidh Innill Tesseract 5, 4 agus 3 as an mbosca.
  • Cruinneas Tá 99.8% níos fearr ná Tesseract rialta.
  • Luas Blazing agus MultiThreading
  • MVC, WebApp, Deisce, Consól & Feidhmchlár Freastalaí comhoiriúnach
  • Gan cód Exes nó C ++ a bheith ag obair leis
  • Tacaíocht iomlán PDF OCR
  • Chun OCR a dhéanamh beagnach aon chomhad Íomhá nó PDF
  • Tacaíocht iomlán .NET Core, Standard agus FrameWork
  • Imscaradh ar Windows, Mac, Linux, Azure, Docker, Lambda, AWS
  • Léigh barrachód agus cóid QR
  • OCR a easpórtáil maidir le XHTML
  • OCR a easpórtáil chuig cáipéisí PDF inchuardaithe
  • Tacaíocht multithreading
  • 126 teanga idirnáisiúnta ar fad á mbainistiú trí chomhaid NuGet nó OcrData
  • Íomhánna Sliocht, Comhordanáidí, Staitisticí agus Clónna. Ní amháin téacs.
  • Is féidir é a úsáid chun Tesseract OCR a athdháileadh taobh istigh d’iarratais tráchtála agus dílseánaigh.

Sciorrann IronOCR agus é ag obair le híomhánna ón bhfíorshaol agus le cáipéisí neamhfhoirfe mar ghrianghraif, nó scananna le réiteach íseal a bhféadfadh torann digiteach nó neamhfhoirfeachtaí a bheith acu.

Ní fheidhmíonn leabharlanna OCR eile saor in aisce don ardán .NET den sórt sin .net tesseract APIs agus seirbhísí gréasáin chomh maith sna cásanna úsáide fíor-domhain seo.

OCR le Tesseract 5 - Tosaigh Códú i C #

Taispeánann an sampla cód thíos cé chomh furasta agus atá sé téacs a léamh ó íomhá ag úsáid C#nó VB .NET.

OneLiner

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

Dia duit Cumraíochta

// PM> Install-Package IronOCR.Languages.Irish
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... is féidir leat líon ar bith íomhánna a chur leis
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Irish
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... is féidir leat líon ar bith íomhánna a chur leis
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Irish
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Irish
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

C#PDF OCR

Is féidir an cur chuige céanna a úsáid ar an gcaoi chéanna chun téacs a bhaint as aon doiciméad PDF.

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Is féidir linn uimhreacha leathanaigh PDF ar leith a roghnú chuig OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 leathanach do gach leathanach den PDF
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Is féidir linn uimhreacha leathanaigh PDF ar leith a roghnú chuig OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 leathanach do gach leathanach den PDF
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Irish
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' Is féidir linn uimhreacha leathanaigh PDF ar leith a roghnú chuig OCR

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' 1 leathanach do gach leathanach den PDF
End Using
VB   C#

OCR le haghaidh TIFFanna Il-Pacáiste

Formáid comhaid OCR Reading TIFF lena n-áirítear cáipéisí il leathanaigh. Is féidir TIFF a thiontú go díreach i gcomhad PDF le téacs inchuardaithe.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Irish

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Barrachóid agus QR

Gné uathúil de IronOCR is ea gur féidir leis barrachód agus cóid QR a léamh ó dhoiciméid agus é ag scanadh le haghaidh téacs. Tugann cásanna den Aicme OcrResult.OcrBarcode faisnéis mhionsonraithe don fhorbróir faoi gach barrachód scanta.

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// airíonna cineál agus suímh nochtaithe freisin
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// airíonna cineál agus suímh nochtaithe freisin
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' airíonna cineál agus suímh nochtaithe freisin
Next Barcode
End Using
VB   C#

OCR ar Réimsí Sonracha Íomhánna

Soláthraíonn gach ceann de mhodhanna scanadh agus léitheoireachta IronOCR an cumas a shonrú go díreach cén chuid de leathanach nó leathanaigh ar mian linn téacs a léamh astu. Tá sé seo an-úsáideach agus muid ag féachaint ar fhoirmeacha caighdeánaithe agus is féidir go leor ama a shábháil agus éifeachtúlacht a fheabhsú.

Chun réigiúin barr a úsáid, beidh orainn tagairt chórais a chur le System.Drawing ionas gur féidir linn an réad System.Drawing.Rectangle a úsáid.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Tá toisí istigh i px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Tá toisí istigh i px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Irish

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' Tá toisí istigh i px

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR le haghaidh Scanadh Cáilíochta Íseal

Is féidir leis an rang IronOCR OcrInput a shocrú nach féidir le gnáth-Tesseract a léamh.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // socraíonn sé torann digiteach agus droch-scanadh
Input.Deskew(); // socraíonn rothlú agus peirspictíocht
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // socraíonn sé torann digiteach agus droch-scanadh
Input.Deskew(); // socraíonn rothlú agus peirspictíocht
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Irish

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' socraíonn sé torann digiteach agus droch-scanadh
Input.Deskew() ' socraíonn rothlú agus peirspictíocht
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Easpórtáil torthaí OCR mar PDF Inchuardaithe

Íomhá go PDF le teaghráin téacs in-chóipeáilte. Is féidir é a innéacsú ag innill chuardaigh agus bunachair sonraí.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Irish

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

TIFF chun Comhshó PDF inchuardaithe

Cuir doiciméad TIFF (nó aon ghrúpa de chomhaid íomhá) ar ais go díreach chuig PDF inchuardaithe ar féidir é a innéacsú le hinlíon, suíomh Gréasáin agus innill chuardaigh google.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Irish

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

Easpórtáil torthaí OCR mar HTML

Íomhá OCR go tiontú XHTML.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Irish
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

Scagairí Feabhsú Íomhá OCR

Soláthraíonn IronOCR scagairí uathúla d’earraí OcrInput chun feidhmíocht OCR a fheabhsú.

Cód Feabhsúcháin Íomhá Sampla

Déanann íomhánna ionchuir OCR ar chaighdeán níos airde chun torthaí OCR níos fearr agus níos gasta a sholáthar.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // socraíonn sé torann digiteach agus droch-scanadh
Input.Deskew(); // socraíonn rothlú agus peirspictíocht
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // socraíonn sé torann digiteach agus droch-scanadh
Input.Deskew(); // socraíonn rothlú agus peirspictíocht
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Irish

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' socraíonn sé torann digiteach agus droch-scanadh
Input.Deskew() ' socraíonn rothlú agus peirspictíocht
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Liosta Scagairí Íomhá OCR

I measc na scagairí ionchuir chun feidhmíocht OCR a fheabhsú atá mar chuid de IronOCR tá:

  • OcrInput.Rotate (céimeanna dúbailte) - Rothlaíonn íomhánna de réir roinnt céimeanna deiseal. Úsáid uimhreacha diúltacha i gcoinne deiseal.
  • OcrInput.Binarize () - Casann an scagaire íomhá seo gach picteilín dubh nó bán gan aon talamh lár. Féadfaidh sé cásanna feidhmíochta OCR a fheabhsú ina bhfuil codarsnacht an-íseal idir an téacs agus an cúlra.
  • OcrInput.ToGrayScale () - Tiontaíonn an scagaire íomhá seo gach picteilín ina scáth liathscála. Ní dócha go bhfeabhsóidh sé cruinneas OCR ach d’fhéadfadh sé luas a fheabhsú
  • OcrInput.Contrast () - Méadaíonn an chodarsnacht go huathoibríoch. Is minic a fheabhsaíonn an scagaire seo luas agus cruinneas OCR i scananna codarsnachta íseal.
  • OcrInput.DeNoise () - Baintear an torann digiteach as. Níor cheart an scagaire seo a úsáid ach amháin nuair a bhíonn súil le torann.
  • OcrInput.Invert () - inbhéartaíonn gach dath. Eg Éiríonn dubh dubh: éiríonn dubh bán.
  • OcrInput.Dilate () - Ard-mhoirfeolaíocht. Cuireann díleá picteilíní le teorainneacha rudaí in íomhá. Os coinne Erode
  • OcrInput.Erode () - Ard-mhoirfeolaíocht. Cuireann creimeadh picteilíní ar theorainneacha réada Os cionn Dilate
  • OcrInput.Deskew () - Rothlaíonn íomhá ionas gurb í an bealach ceart í suas agus orthogonal. Tá sé seo an-úsáideach do OCR toisc go bhféadfadh lamháltas Tesseract maidir le scananna sceabhacha a bheith chomh híseal le 5 céim.
  • OcrInput.DeepCleanBackgroundNoise () - Deireadh a chur le torann cúlra trom. Ná húsáid an scagaire seo ach amháin i gcás go bhfuil torann cúlra doiciméad an-mhór ar eolas, toisc go mbeidh an scagaire seo i mbaol cruinneas OCR na ndoiciméad glan a laghdú, agus go bhfuil sé an-chostasach don LAP.
  • OcrInput.EnhanceResolution - Feabhsaíonn réiteach íomhánna ar chaighdeán íseal. Ní bhíonn an scagaire seo de dhíth go minic mar go nglacfaidh OcrInput.MinimumDPI agus OcrInput.TargetDPI ionchuir réitigh íseal go huathoibríoch.

CleanBackgroundNoise. Is suíomh é seo a thógann go leor ama; áfach, tugann sé deis don leabharlann torann digiteach, crumples páipéir, agus neamhfhoirfeachtaí eile a ghlanadh go huathoibríoch laistigh d’íomhá dhigiteach a d’fhágfadh nach mbeadh ar chumas leabharlanna OCR eile í a léamh.

Is suíomh é EnhanceContrast a fhágann go gcuireann IronOCR codarsnacht an téacs i gcoinne chúlra íomhá go huathoibríoch, ag méadú cruinneas OCR agus ag méadú feidhmíochta agus luas OCR go ginearálta.

Is suíomh é EnhanceResolution a bhrathfaidh íomhánna ísealtaifigh go huathoibríoch (atá faoi 275 dpi) agus a dhéanfaidh an íomhá a uasghrádú go huathoibríoch agus ansin an téacs go léir a ghéarú ionas gur féidir le leabharlann OCR é a léamh go foirfe. Cé go dtógann an oibríocht seo an-chuid ama ann féin, de ghnáth laghdaíonn sí an t-am foriomlán d’oibríocht OCR ar íomhá.

Tacaíonn Language IronOCR le 22 phacáiste teanga idirnáisiúnta, agus is féidir an suíomh teanga a úsáid chun teanga iolrach amháin nó níos mó a roghnú le cur i bhfeidhm ar oibríocht OCR.

Straitéis Tacaíonn OCR Iarainn le dhá straitéis. B’fhéidir go roghnóimid scanadh tapa agus nach bhfuil chomh cruinn ar dhoiciméad, nó ardstraitéis a úsáid a úsáideann roinnt samhlacha faisnéise saorga chun cruinneas téacs OCR a fheabhsú go huathoibríoch trí bhreathnú ar an ngaol staitistiúil atá ag focail lena chéile in abairt .

Is suíomh é ColorSpace trínar féidir linn OCR a roghnú i liathscála nó i ndath. Go ginearálta, is é liathscála an rogha is fearr. Mar sin féin, uaireanta nuair a bhíonn téacsanna nó cúlraí ar a bhfuil dath cosúil leo ach dath an-difriúil, soláthróidh spás dathanna lándaite torthaí níos fearr.

DetectWhiteTextOnDarkBackgrounds. De ghnáth, bíonn gach leabharlann OCR ag súil go bhfeicfidh siad téacs dubh ar chúlraí bána. Ligeann an socrú seo do IronOCR claonchlónna, nó leathanaigh dhorcha le téacs bán a bhrath go huathoibríoch, agus iad a léamh.

InputImageType. Ligeann an socrú seo don fhorbróir leabharlann OCR a threorú i dtaobh an bhfuil sé ag féachaint ar dhoiciméad iomlán nó ar chnuasach, mar shampla pictiúr.

Is suíomh ardteicneolaíochta é RotateAndStraighten a thugann an cumas uathúil do IronOCR cáipéisí a léamh nach bhfuil rothlaithe ach a bhfuil peirspictíocht iontu b’fhéidir, mar shampla grianghraif de dhoiciméid téacs.

Is gné úsáideach é ReadBarcodes a ligeann do IronOCR barrachóid agus cóid QR a léamh go huathoibríoch ar leathanaigh mar go léann sé téacs freisin, gan ualach mór ama breise a chur leis.

ColorDepth. Cinneann an socrú seo cé mhéad giotán in aghaidh an picteilín a úsáidfidh leabharlann OCR chun doimhneacht datha a chinneadh. Féadfaidh doimhneacht datha níos airde cáilíocht OCR a mhéadú, ach méadóidh sé freisin an t-am a theastaíonn chun an oibríocht OCR a chríochnú.

126 Pacáiste Teanga

Tacaíonn IronOCR le 126 teanga idirnáisiúnta trí phacáistí teanga a dháiltear mar DLLanna, ar féidir iad a íoslódáil ón suíomh Gréasáin seo , nó freisin ó Bhainisteoir Pacáiste NuGet .

I measc na dteangacha tá Gearmáinis, Fraincis, Béarla, Sínis, Seapáinis agus go leor eile. Tá pacáistí speisialtóra teanga ann le haghaidh pas MRZ, seiceálacha MICR, Sonraí Airgeadais, plátaí Ceadúnais agus go leor eile. Is féidir leat aon chomhad tesseract ".traineddata" a úsáid freisin - lena n-áirítear cinn a chruthaíonn tú féin.

Sampla Teanga

Teangacha OCR Eile a Úsáid.

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Cuir scagairí íomhá leis más gá
// Sa chás seo, tá fiú ionchur smaoinimh ar chaighdeán an-íseal
// Is féidir le IronTesseract an rud nach féidir le Tesseract traidisiúnta a léamh.

var Result = Ocr.Read(input);

// Ní féidir le consól Araibis a phriontáil ar Windows go héasca.
// Sábhálfaidh muid ar dhiosca ina ionad.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Cuir scagairí íomhá leis más gá
// Sa chás seo, tá fiú ionchur smaoinimh ar chaighdeán an-íseal
// Is féidir le IronTesseract an rud nach féidir le Tesseract traidisiúnta a léamh.

var Result = Ocr.Read(input);

// Ní féidir le consól Araibis a phriontáil ar Windows go héasca.
// Sábhálfaidh muid ar dhiosca ina ionad.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Cuir scagairí íomhá leis más gá
' Sa chás seo, tá fiú ionchur smaoinimh ar chaighdeán an-íseal
' Is féidir le IronTesseract an rud nach féidir le Tesseract traidisiúnta a léamh.

Dim Result = Ocr.Read(input)

' Ní féidir le consól Araibis a phriontáil ar Windows go héasca.
' Sábhálfaidh muid ar dhiosca ina ionad.
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

Sampla Il-Teanga

Is féidir freisin OCR ag úsáid iliomad teangacha ag an am céanna. Is féidir leis seo cabhrú i ndáiríre meiteashonraí agus urls Béarla a fháil i ndoiciméid Unicode.

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Irish);

// Is féidir linn líon ar bith teangacha a chur leis

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Irish);

// Is féidir linn líon ar bith teangacha a chur leis

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Irish)

' Is féidir linn líon ar bith teangacha a chur leis

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

Réada Mionsonraithe ar Thorthaí OCR

Tugann IronOCR réad toradh OCR ar ais do gach oibríocht OCR. De ghnáth, ní úsáideann forbróirí ach maoin téacs an ruda seo chun an téacs a scanadh ón íomhá. Mar sin féin, tá torthaí OCR DOM i bhfad níos airde ná seo.

using IronOcr;
using System.Drawing; //Cuir Tagairt Tionóil leis

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //Tábhachtach

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// Déan iniúchadh anseo chun API ollmhór, mionsonraithe a fháil:
// - Leathanaigh, Bloic, Paraphaphs, Línte, Focail, Chars
// - Easpórtáil Íomhá, Comhordanáidí Clónna, Sonraí Staidrimh
}
using IronOcr;
using System.Drawing; //Cuir Tagairt Tionóil leis

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Irish;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //Tábhachtach

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// Déan iniúchadh anseo chun API ollmhór, mionsonraithe a fháil:
// - Leathanaigh, Bloic, Paraphaphs, Línte, Focail, Chars
// - Easpórtáil Íomhá, Comhordanáidí Clónna, Sonraí Staidrimh
}
Imports IronOcr
Imports System.Drawing 'Cuir Tagairt Tionóil leis

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Irish
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'Tábhachtach

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' Déan iniúchadh anseo chun API ollmhór, mionsonraithe a fháil:
' - Leathanaigh, Bloic, Paraphaphs, Línte, Focail, Chars
' - Easpórtáil Íomhá, Comhordanáidí Clónna, Sonraí Staidrimh
End Using
VB   C#

Feidhmíocht

Oibríonn IronOCR as an mbosca gan aon ghá tiúnadh a dhéanamh nó íomhánna ionchuir a mhodhnú go mór.

Speed is Blazing: Tá IronOcr.2020 + suas le 10 n-uaire níos tapa agus déanann sé os cionn 250% níos lú earráidí ná mar a tógadh roimhe seo.

Foghlaim níos mó

Chun níos mó a fhoghlaim faoi OCR i C #, VB, F #, nó in aon teanga .NET eile, léigh ár ranganna teagaisc pobail le do thoil, a thugann samplaí den saol fíor faoin gcaoi ar féidir IronOCR a úsáid agus a thaispeánfaidh an nuáil maidir le conas an leas is fearr a bhaint as an leabharlann seo.

tagairt réad iomlán d’fhorbróirí .NET ar fáil freisin.