OCR Cymru yn C#a .NET

Fersiynau eraill o'r ddogfen hon:

Mae IronOCR yn gydran meddalwedd C#sy'n caniatáu i godwyr. NET ddarllen testun o ddelweddau a dogfennau PDF mewn 126 iaith, gan gynnwys y Gymraeg.

Mae'n fforc datblygedig o Tesseract, wedi'i adeiladu'n benodol ar gyfer datblygwyr. NET ac mae'n perfformio'n well na pheiriannau Tesseract eraill yn rheolaidd ar gyfer cyflymder a chywirdeb.

Cynnwys IronOcr.Languages.Welsh

Mae'r pecyn hwn yn cynnwys 40 o ieithoedd OCR ar gyfer. NET:

  • Cymraeg
  • Cymraeg
  • Cymraeg

Dadlwythwch

Pecyn Cymraeg [Cymraeg]
* Download as Zip
* Install with as
https://www.nuget.org/packages/IronOcr.Languages.Welsh/'> NuGet

Gosod

Y peth cyntaf sy'n rhaid i ni ei wneud yw gosod ein pecyn OCR Cymreig yn eich prosiect .NET.

PM> Install-Package IronOCR.Languages.Welsh

Enghraifft Cod

Mae'r enghraifft hon o god C#yn darllen testun Cymraeg o ddogfen Delwedd neu PDF.

//PM> Install-Package IronOcr.Languages.Welsh
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;
using (var Input = new OcrInput(@"images\Welsh.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Welsh
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;
using (var Input = new OcrInput(@"images\Welsh.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Welsh
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Welsh
Using Input = New OcrInput("images\Welsh.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

Pam Dewis IronOCR?

Mae IronOCR yn llyfrgell feddalwedd NET hawdd ei gosod, cyflawn a'i dogfennu'n dda.

Dewiswch IronOCR i gyflawni cywirdeb 99.8% + OCR heb ddefnyddio unrhyw wasanaethau gwe allanol, ffioedd parhaus nac anfon dogfennau cyfrinachol dros y rhyngrwyd.

Pam mae datblygwyr C#yn dewis IronOCR dros Vanilla Tesseract:

  • Gosod fel DLL neu NuGet sengl
  • Yn cynnwys ar gyfer Peiriannau Tesseract 5, 4 a 3 allan o'r bocs.
  • Cywirdeb Mae 99.8% yn perfformio'n well na Tesseract rheolaidd.
  • Cyflymder Chwyddo ac Aml-Ddarllen
  • MVC, WebApp, Desktop, Console & Server Application yn gydnaws
  • Dim cod Exes na C ++ i weithio gyda nhw
  • Cefnogaeth OCR PDF llawn
  • I berfformio OCR, bron unrhyw ffeil Delwedd neu PDF
  • Cefnogaeth lawn .NET Craidd, Safonol a FrameWork
  • Defnyddiwch ar Windows, Mac, Linux, Azure, Docker, Lambda, AWS
  • Darllenwch godau bar a chodau QR
  • Allforio OCR ynghylch XHTML
  • Allforio OCR i ddogfennau PDF chwiliadwy
  • Cefnogaeth multithreading
  • 126 o ieithoedd rhyngwladol i gyd yn cael eu rheoli trwy ffeiliau NuGet neu OcrData
  • Detholiad Delweddau, Cyfesurynnau, Ystadegau a Ffontiau. Nid testun yn unig.
  • Gellir ei ddefnyddio i ailddosbarthu Tesseract OCR y tu mewn i gymwysiadau masnachol a pherchnogol.

Mae OCR Haearn yn disgleirio wrth weithio gyda delweddau'r byd go iawn a dogfennau amherffaith fel ffotograffau, neu sganiau cydraniad isel a allai fod â sŵn digidol neu ddiffygion.

Nid yw llyfrgelloedd OCR eraill am ddim ar gyfer y platfform .NET fel APIs tesseract .net eraill a gwasanaethau gwe yn perfformio cystal ar yr achosion defnydd byd go iawn hyn.

OCR gyda Tesseract 5 - Dechreuwch Codio yn C #

Mae'r sampl cod isod yn dangos pa mor hawdd yw darllen testun o ddelwedd gan ddefnyddio C#neu VB .NET.

OneLiner

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

Helo Byd Ffurfweddu

// PM> Install-Package IronOCR.Languages.Welsh
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... gallwch ychwanegu unrhyw nifer o ddelweddau
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Welsh
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... gallwch ychwanegu unrhyw nifer o ddelweddau
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Welsh
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Welsh
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

C#PDF OCR

Yn yr un modd gellir defnyddio'r un dull i dynnu testun o unrhyw ddogfen PDF.

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Gallwn hefyd ddewis rhifau tudalennau PDF penodol i OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 dudalen ar gyfer pob tudalen o'r PDF
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Gallwn hefyd ddewis rhifau tudalennau PDF penodol i OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 dudalen ar gyfer pob tudalen o'r PDF
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Welsh
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' Gallwn hefyd ddewis rhifau tudalennau PDF penodol i OCR

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' 1 dudalen ar gyfer pob tudalen o'r PDF
End Using
VB   C#

OCR ar gyfer TIFFs MultiPage

Fformat ffeil OCR Reading TIFF gan gynnwys dogfennau tudalen lluosog. Gellir trosi TIFF yn uniongyrchol yn ffeil PDF gyda thestun chwiliadwy.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Welsh

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Codau bar a QR

Nodwedd unigryw o IronOCR yw ei fod yn gallu darllen codau bar a chodau QR o ddogfennau wrth sganio am destun. Mae enghreifftiau o'r Dosbarth OcrResult.OcrBarcode rhoi gwybodaeth fanwl i'r datblygwr am bob cod bar wedi'i sganio.

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// eiddo math a lleoliad hefyd yn agored
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// eiddo math a lleoliad hefyd yn agored
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' eiddo math a lleoliad hefyd yn agored
Next Barcode
End Using
VB   C#

OCR ar Feysydd Delweddau Penodol

Mae pob un o ddulliau sganio a darllen IronOCR yn darparu'r gallu i nodi'n union pa ran o dudalen neu dudalennau yr ydym yn dymuno darllen testun ohoni. Mae hyn yn ddefnyddiol iawn pan fyddwn yn edrych ar ffurflenni safonedig a gall arbed llawer iawn o amser a gwella effeithlonrwydd.

I ddefnyddio rhanbarthau cnwd, bydd angen i ni ychwanegu cyfeirnod system at System.Drawing fel y gallwn ddefnyddio'r gwrthrych System.Drawing.Rectangle .

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Mae'r dimensiynau mewn px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Mae'r dimensiynau mewn px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Welsh

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' Mae'r dimensiynau mewn px

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR ar gyfer Sganiau Ansawdd Isel

Gall y dosbarth OcrInput Haearn OCR OcrInput sganiau na all Tesseract arferol eu darllen.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // yn trwsio sŵn digidol a sganio gwael
Input.Deskew(); // yn trwsio cylchdro a phersbectif
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // yn trwsio sŵn digidol a sganio gwael
Input.Deskew(); // yn trwsio cylchdro a phersbectif
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Welsh

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' yn trwsio sŵn digidol a sganio gwael
Input.Deskew() ' yn trwsio cylchdro a phersbectif
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Allforio canlyniadau OCR fel PDF Chwiliadwy

Delwedd i PDF gyda llinynnau testun y gellir eu copïo. Gellir ei fynegeio gan beiriannau chwilio a chronfeydd data.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Welsh

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

TIFF i Drosi PDF chwiliadwy

Trosglwyddwch ddogfen TIFF (neu unrhyw grŵp o ffeiliau delwedd) yn uniongyrchol i PDF chwiliadwy y gellir ei fynegeio gan fewnrwyd, gwefan a pheiriannau chwilio google.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Welsh

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

Allforio canlyniadau OCR fel HTML

Delwedd OCR i drosi XHTML.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Welsh
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

Hidlau Gwella Delwedd OCR

Mae IronOCR yn darparu hidlwyr unigryw ar gyfer gwrthrychau OcrInput i wella perfformiad OCR.

Enghraifft o'r Cod Gwella Delwedd

Yn gwneud delweddau mewnbwn OCR o ansawdd uwch i gynhyrchu canlyniadau OCR gwell a chyflymach.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // yn trwsio sŵn digidol a sganio gwael
Input.Deskew(); // yn trwsio cylchdro a phersbectif
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // yn trwsio sŵn digidol a sganio gwael
Input.Deskew(); // yn trwsio cylchdro a phersbectif
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Welsh

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' yn trwsio sŵn digidol a sganio gwael
Input.Deskew() ' yn trwsio cylchdro a phersbectif
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Rhestr o Hidlau Delwedd OCR

Mae hidlwyr mewnbwn i wella perfformiad OCR sy'n rhan o IronOCR yn cynnwys:

  • OcrInput.Rotate (graddau dwbl) - Yn cylchdroi delweddau gan nifer o raddau clocwedd. Ar gyfer gwrthglocwedd, defnyddiwch rifau negyddol.
  • OcrInput.Binarize () - Mae'r hidlydd delwedd hwn yn troi pob picsel yn ddu neu'n wyn heb dir canol. Gall Wella achosion perfformiad OCR o gyferbyniad isel iawn o'r testun i'r cefndir.
  • OcrInput.ToGrayScale () - Mae'r hidlydd delwedd hwn yn troi pob picsel yn gysgod graddlwyd. Annhebygol o wella cywirdeb OCR ond gallai wella cyflymder
  • OcrInput.Contrast () - Yn cynyddu cyferbyniad yn awtomatig. Mae'r hidlydd hwn yn aml yn gwella cyflymder a chywirdeb OCR mewn sganiau cyferbyniad isel.
  • OcrInput.DeNoise () - Yn dileu sŵn digidol. Dim ond lle mae disgwyl sŵn y dylid defnyddio'r hidlydd hwn.
  • OcrInput.Invert () - Yn gwrthdroi pob lliw. Ee Gwyn yn dod yn ddu: du yn dod yn wyn.
  • OcrInput.Dilate () - Morffoleg Uwch. Mae ymlediad yn ychwanegu picseli at ffiniau gwrthrychau mewn delwedd. Gyferbyn ag Erode
  • OcrInput.Erode () - Morffoleg Uwch. Mae erydiad yn dileu picseli ar ffiniau gwrthrychauOpposite of Dilate
  • OcrInput.Deskew () - Yn cylchdroi delwedd felly dyma'r ffordd iawn i fyny ac yn orthogonal. Mae hyn yn ddefnyddiol iawn ar gyfer OCR oherwydd gall goddefgarwch Tesseract ar gyfer sganiau sgiw fod mor isel â 5 gradd.
  • OcrInput.DeepCleanBackgroundNoise () - Tynnu sŵn cefndir trwm. Defnyddiwch yr hidlydd hwn dim ond rhag ofn bod sŵn cefndir dogfen eithafol yn hysbys, oherwydd bydd yr hidlydd hwn hefyd mewn perygl o leihau cywirdeb OCR mewn dogfennau glân, ac mae'n ddrud iawn i'r CPU.
  • OcrInput.EnhanceResolution - Yn gwella datrysiad delweddau o ansawdd isel. Nid oes angen yr hidlydd hwn yn aml oherwydd bydd OcrInput.MinimumDPI ac OcrInput.TargetDPI yn dal ac yn datrys mewnbynnau cydraniad isel yn awtomatig.

CleanBackgroundNoise. Mae hwn yn osodiad sy'n cymryd llawer o amser; fodd bynnag, mae'n caniatáu i'r llyfrgell lanhau sŵn digidol, briwsion papur, ac amherffeithrwydd eraill o fewn delwedd ddigidol a fyddai fel arall yn ei gwneud yn analluog i gael ei ddarllen gan lyfrgelloedd OCR eraill.

Mae EnhanceContrast yn osodiad sy'n achosi i OCR Haearn gynyddu cyferbyniad testun yn awtomatig yn erbyn cefndir delwedd, gan gynyddu cywirdeb OCR a chynyddu perfformiad a chyflymder OCR yn gyffredinol.

Mae EnhanceResolution yn osodiad a fydd yn canfod delweddau cydraniad isel yn awtomatig (sydd o dan 275 dpi) ac yn uwchraddio'r ddelwedd yn awtomatig ac yna'n miniogi'r holl destun fel y gall llyfrgell OCR ei ddarllen yn berffaith. Er bod y llawdriniaeth hon ynddo'i hun yn cymryd llawer o amser, yn gyffredinol mae'n lleihau'r amser cyffredinol ar gyfer gweithrediad OCR ar ddelwedd.

Mae Language IronOCR yn cefnogi 22 o becynnau iaith rhyngwladol, a gellir defnyddio'r gosodiad iaith i ddewis un neu fwy o ieithoedd lluosog i'w defnyddio ar gyfer gweithrediad OCR.

Strategaeth Mae OCR Haearn yn cefnogi dwy strategaeth. Efallai y byddwn yn dewis naill ai mynd am sgan cyflym a llai cywir o ddogfen, neu ddefnyddio strategaeth ddatblygedig sy'n defnyddio rhai modelau deallusrwydd artiffisial i wella cywirdeb testun OCR yn awtomatig trwy edrych ar berthynas ystadegol geiriau â'i gilydd mewn brawddeg. .

Mae ColorSpace yn osodiad lle gallwn ddewis OCR mewn graddlwyd neu liw. Yn gyffredinol, graddlwyd yw'r opsiwn gorau. Fodd bynnag, weithiau pan fydd testunau neu gefndiroedd o liw tebyg ond lliw gwahanol iawn, bydd gofod lliw lliw llawn yn darparu canlyniadau gwell.

DetectWhiteTextOnDarkBackgrounds. Yn gyffredinol, mae pob llyfrgell OCR yn disgwyl gweld testun du ar gefndiroedd gwyn. Mae'r gosodiad hwn yn caniatáu i IronOCR ganfod negatifau, neu dudalennau tywyll gyda thestun gwyn yn awtomatig, a'u darllen.

InputImageType. Mae'r gosodiad hwn yn caniatáu i'r datblygwr arwain llyfrgell OCR ynghylch a yw'n edrych ar ddogfen lawn neu bip, fel screenshot.

Mae RotateAndStraighten yn osodiad datblygedig sy'n caniatáu i IronOCR y gallu unigryw i ddarllen dogfennau sydd nid yn unig yn cylchdroi, ond efallai'n cynnwys persbectif, fel ffotograffau o ddogfennau testun.

Mae ReadBarcodes yn nodwedd ddefnyddiol sy'n caniatáu i IronOCR ddarllen codau bar a chodau QR yn awtomatig ar dudalennau gan ei fod hefyd yn darllen testun, heb ychwanegu baich amser ychwanegol mawr.

LliwDepth. Mae'r gosodiad hwn yn penderfynu faint o ddarnau fesul picsel y bydd y llyfrgell OCR yn eu defnyddio i bennu dyfnder lliw. Efallai y bydd dyfnder lliw uwch yn cynyddu ansawdd OCR, ond bydd hefyd yn cynyddu'r amser sy'n ofynnol i'r gweithrediad OCR ei gwblhau.

126 Pecyn Iaith

Mae IronOCR yn cefnogi 126 o ieithoedd rhyngwladol trwy becynnau iaith sy'n cael eu dosbarthu fel DLLs, y gellir eu lawrlwytho o'r wefan hon , neu hefyd gan Reolwr Pecynnau NuGet .

Ymhlith yr ieithoedd mae Almaeneg, Ffrangeg, Saesneg, Tsieineaidd, Japaneaidd a llawer mwy. Mae pecynnau iaith arbenigol yn bodoli ar gyfer pasbort MRZ, gwiriadau MICR, Data Ariannol, platiau Trwydded a llawer mwy. Gallwch hefyd ddefnyddio unrhyw ffeil tesseract ".traineddata" - gan gynnwys rhai rydych chi'n eu creu eich hun.

Enghraifft Iaith

Defnyddio ieithoedd OCR Eraill.

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Ychwanegwch hidlwyr delwedd os oes angen
// Yn yr achos hwn, mae mewnbwn meddwl hyd yn oed o ansawdd isel iawn
// Gall IronTesseract ddarllen yr hyn na all Tesseract confensiynol ei wneud.

var Result = Ocr.Read(input);

// Ni all consol argraffu Arabeg ar Windows yn hawdd.
// Gadewch i ni arbed ar ddisg yn lle.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Ychwanegwch hidlwyr delwedd os oes angen
// Yn yr achos hwn, mae mewnbwn meddwl hyd yn oed o ansawdd isel iawn
// Gall IronTesseract ddarllen yr hyn na all Tesseract confensiynol ei wneud.

var Result = Ocr.Read(input);

// Ni all consol argraffu Arabeg ar Windows yn hawdd.
// Gadewch i ni arbed ar ddisg yn lle.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Ychwanegwch hidlwyr delwedd os oes angen
' Yn yr achos hwn, mae mewnbwn meddwl hyd yn oed o ansawdd isel iawn
' Gall IronTesseract ddarllen yr hyn na all Tesseract confensiynol ei wneud.

Dim Result = Ocr.Read(input)

' Ni all consol argraffu Arabeg ar Windows yn hawdd.
' Gadewch i ni arbed ar ddisg yn lle.
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

Enghraifft Iaith Lluosog

Mae hefyd yn bosibl i OCR ddefnyddio sawl iaith ar yr un pryd. Gall hyn helpu i gael metadata ac urls iaith Saesneg mewn dogfennau Unicode.

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Welsh);

// Gallwn ychwanegu unrhyw nifer o ieithoedd

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Welsh);

// Gallwn ychwanegu unrhyw nifer o ieithoedd

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Welsh)

' Gallwn ychwanegu unrhyw nifer o ieithoedd

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

Gwrthrychau Canlyniadau OCR manwl

Mae OCR Haearn yn dychwelyd gwrthrych canlyniad OCR ar gyfer pob gweithrediad OCR. Yn gyffredinol, dim ond i gael sganio'r testun o'r ddelwedd y mae datblygwyr yn defnyddio eiddo testun y gwrthrych hwn. Fodd bynnag, mae canlyniadau OCR DOM yn llawer mwy datblygedig na hyn.

using IronOcr;
using System.Drawing; //Ychwanegu Cyfeirnod y Cynulliad

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //Pwysig

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// Archwiliwch yma i ddod o hyd i API enfawr, manwl:
// - Tudalennau, Blociau, Paraffaphau, Llinellau, Geiriau, Siantiau
// - Allforio Delweddau, Cyfesurynnau Bedyddfeini, Data Ystadegol
}
using IronOcr;
using System.Drawing; //Ychwanegu Cyfeirnod y Cynulliad

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Welsh;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //Pwysig

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// Archwiliwch yma i ddod o hyd i API enfawr, manwl:
// - Tudalennau, Blociau, Paraffaphau, Llinellau, Geiriau, Siantiau
// - Allforio Delweddau, Cyfesurynnau Bedyddfeini, Data Ystadegol
}
Imports IronOcr
Imports System.Drawing 'Ychwanegu Cyfeirnod y Cynulliad

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Welsh
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'Pwysig

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' Archwiliwch yma i ddod o hyd i API enfawr, manwl:
' - Tudalennau, Blociau, Paraffaphau, Llinellau, Geiriau, Siantiau
' - Allforio Delweddau, Cyfesurynnau Bedyddfeini, Data Ystadegol
End Using
VB   C#

Perfformiad

Mae IronOCR yn gweithio allan o'r bocs heb fod angen tiwnio perfformiad nac addasu delweddau mewnbwn yn drwm.

Speed is Blazing: mae IronOcr.2020 + hyd at 10 gwaith yn gyflymach ac yn gwneud dros 250% yn llai o wallau nag adeiladu blaenorol.

Dysgu mwy

I ddysgu mwy am OCR yn C #, VB, F #, neu unrhyw iaith. NET arall, darllenwch ein tiwtorialau cymunedol , sy'n rhoi enghreifftiau o'r byd go iawn o sut y gellir defnyddio IronOCR ac a allai ddangos naws sut i gael y gorau o y llyfrgell hon.

Mae cyfeirnod gwrthrych llawn ar gyfer datblygwyr. NET hefyd ar gael.