OCR corsu in C#è .Net

Altre versioni di stu documentu:

IronOCR hè un cumpunente di software C#chì permette à i codificatori .NET di leghje testu da imaghjini è ducumenti PDF in 126 lingue, cumpresu u corsu.

Hè una forchetta avanzata di Tesseract, custruita solu per i sviluppatori .NET è supera di modu regulare l'altri mutori Tesseract sia per a velocità sia per a precisione.

Cuntenutu di IronOcr.Languages.Corsican

Stu pacchettu cuntene 49 lingue OCR per .NET:

  • Corsu
  • CorsuMiglior
  • CorsicanFast

Scaricà

Pack de langue corse [corsu]
* Download as Zip
* Install with as
https://www.nuget.org/packages/IronOcr.Languages.Corsican/'> NuGet

Stallazione

A prima cosa avemu à fà hè fatta in u nostru pacchettu Corsican ICT à u vostru prughjettu .com.

PM> Install-Package IronOCR.Languages.Corsican

Esempiu di Codice

Questu esempiu di codice C#leghje u testu corsu da un documentu Image o PDF.

//PM> Install-Package IronOcr.Languages.Corsican
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput(@"images\Corsican.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Corsican
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput(@"images\Corsican.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Corsican
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput("images\Corsican.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

Perchè Sceglite IronOCR?

Iron OCR hè una libreria di software .NET faciule da installà, cumpleta è ben documentata.

Sceglite IronOCR per uttene 99,8% + precisione OCR senza aduprà alcun serviziu web esternu, tasse in corsu o inviu di documenti cunfidenziali nantu à Internet.

Perchè i sviluppatori C#scelenu IronOCR sopra Vanilla Tesseract:

  • Installa cum'è una sola DLL o Nuget
  • Include per i Motori Tesseract 5, 4 è 3 fora di scatula.
  • A precisione 99,8% supera significativamente à u Tesseract regulare.
  • Velocità Blazing è MultiThreading
  • Compatibile MVC, WebApp, Desktop, Console & Server
  • Nisun codice Exes o C ++ per travaglià
  • Supportu PDF OCR cumpletu
  • Per fà OCR un guasgi qualsiasi fugliale Image o PDF
  • Supportu Full .Net Core, Standard è FrameWork
  • Distribuite nantu à Windows, Mac, Linux, Azure, Docker, Lambda, AWS
  • Leghje i codici a barre è i codici QR
  • Esporta OCR in quantu à XHTML
  • Esporta OCR in documenti PDF ricercabili
  • Supportu multithreading
  • 126 lingue internaziunali tutte gestite via i fugliali Nuget o OcrData
  • Estrae Immagini, Coordinate, Statistiche è Caratteri. Micca solu testu.
  • Pò esse adupratu per ridistribuisce Tesseract OCR in applicazioni commerciali è proprietarie.

OCR di Ferru brilla quandu si travaglia cù immagini di u mondu reale è documenti imperfetti cume e fotografie, o scans di bassa risoluzione chì pò avè rumore digitale o imperfezzioni.

Altre biblioteche OCR gratuite per a piattaforma .NET tali altre API .net tesseract è servizii web ùn si comportanu micca bè in questi casi d'usu di u mondu reale.

OCR cù Tesseract 5 - Avvia a Codificazione in C #

U campione di codice sottu mostra quantu hè faciule di leghje u testu da una maghjina cù C#o VB .NET.

OneLiner

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

Configurabile Hello World

// PM> Install-Package IronOCR.Languages.Corsican
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... pudete aghjunghje un numeru numeru di immagini
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Corsican
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... pudete aghjunghje un numeru numeru di immagini
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Corsican
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

C#PDF OCR

U listessu approcciu pò esse adupratu ancu per estrarre testu da qualsiasi documentu PDF.

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Pudemu ancu selezziunà numeri di pagine PDF specifici à OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 pagina per ogni pagina di u PDF
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Pudemu ancu selezziunà numeri di pagine PDF specifici à OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 pagina per ogni pagina di u PDF
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' Pudemu ancu selezziunà numeri di pagine PDF specifici à OCR

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' 1 pagina per ogni pagina di u PDF
End Using
VB   C#

OCR per TIFF MultiPage

OCR Reading Format di fugliale TIFF cumprese documenti di pagine multiple. U TIFF pò ancu esse cunvertitu direttamente in un schedariu PDF cù testu ricercabile.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Codici a barre e QR

Una caratteristica unica di Iron OCR hè chì pò leghje codici a barre è codici QR da documenti mentre scansiona per u testu. Istanze di a Classe OcrResult.OcrBarcode danu à u sviluppatore informazioni dettagliate nantu à ogni codice à OcrResult.OcrBarcode .

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// pruprietà di tippu è di situazione ancu esposte
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// pruprietà di tippu è di situazione ancu esposte
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' pruprietà di tippu è di situazione ancu esposte
Next Barcode
End Using
VB   C#

OCR nantu à Aree Specifiche di Immagini

Tutti i metudi di scansione è lettura di Iron OCR furniscenu a capacità di specificà esattamente da chì parte di una pagina o pagine vulemu leghje testu. Questu hè assai utile quandu guardemu à e forme standardizate è ponu risparmià assai tempu è migliurà l'efficienza.

Per aduprà e regioni di System.Drawing aghjunghje un riferimentu di sistema à System.Drawing modu da pudè aduprà l'ughjettu System.Drawing.Rectangle

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// E dimensioni sò in px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// E dimensioni sò in px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' E dimensioni sò in px

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR per Scans di Bassa Qualità

A classa Iron OCR OcrInput pò risolve scans chì Tesseract normale ùn pò micca leghje.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // risolve u rumore digitale è a scansione scarsa
Input.Deskew(); // ripara a rotazione è a perspettiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // risolve u rumore digitale è a scansione scarsa
Input.Deskew(); // ripara a rotazione è a perspettiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' risolve u rumore digitale è a scansione scarsa
Input.Deskew() ' ripara a rotazione è a perspettiva
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Esporta risultati OCR cum'è PDF ricercabile

Immagine in PDF cù stringhe di testu cupiate. Pò esse indiziatu da i motori di ricerca è e basi di dati.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

TIFF à Cunversione PDF ricercabile

Cunvertite un documentu TIFF (o qualsiasi gruppu di fugliali d'imagine) direttamente in un PDF ricercabile chì pò esse indiziatu da intranet, situ web è motori di ricerca google.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

Esporta risultati OCR cum'è HTML

Conversione Image OCR in XHTML.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

Filtri di Migliurazione di l'immagine OCR

IronOCR furnisce filtri unichi per OcrInput oggetti OcrInput per migliurà e prestazioni OCR.

Esempiu di Codice di Migliurazione di l'Imagine

Rende l'imagine di input OCR di qualità superiore per pruduce risultati OCR megliu è più veloci.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // risolve u rumore digitale è a scansione scarsa
Input.Deskew(); // ripara a rotazione è a perspettiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // risolve u rumore digitale è a scansione scarsa
Input.Deskew(); // ripara a rotazione è a perspettiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' risolve u rumore digitale è a scansione scarsa
Input.Deskew() ' ripara a rotazione è a perspettiva
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Elencu di Filtri Image OCR

I filtri di input per migliorà e prestazioni OCR chì sò integrate in IronOCR includenu:

  • OcrInput.Rotate (doppia gradu) - Gira l'imaghjini da un numeru di gradi in sensu urariu. Per u sensu antiurariu, aduprate numeri negativi.
  • OcrInput.Binarize () - Stu filtru di l'immagine trasforma ogni pixel in neru o biancu senza nisun mezu. Puderà Migliurà i casi di prestazione OCR di cuntrastu assai bassu di u testu à u fondu.
  • OcrInput.ToGrayScale () - Stu filtru d'imaghjini trasforma ogni pixel in un ombra di scala di grisgiu. Improbabile di migliurà a precisione OCR ma pò migliurà a velocità
  • OcrInput.Contrast () - Aumenta u cuntrastu automaticamente. Stu filtru migliora spessu a velocità è a precisione OCR in scans à bassu cuntrastu.
  • OcrInput.DeNoise () - Elimina u rumore digitale. Stu filtru deve esse adupratu solu induve si prevede rumore.
  • OcrInput.Invert () - Inverte ogni culore. Es. Biancu diventa neru: u neru diventa biancu.
  • OcrInput.Dilate () - Morfologia Avanzata. A dilatazione aghjusta pixel à i cunfini di l'uggetti in una maghjina. Oppostu di Erode
  • OcrInput.Erode () - Morfologia Avanzata. L'erosione elimina i pixel nantu à i limiti di l'ughjettu Opposite di Dilate
  • OcrInput.Deskew () - Gira una maghjina per chì sia a strada ghjusta è ortogonale. Questu hè assai utile per OCR perchè a tolleranza Tesseract per scans distorsioni pò esse bassu 5 gradi.
  • OcrInput.DeepCleanBackgroundNoise () - Rimozione di rumore di fondu pesante. Aduprate solu stu filtru in casu chì u rumore di fondu di u documentu estremu sia cunnisciutu, perchè stu filtru risicherà ancu di riduce a precisione OCR di documenti puliti, è hè assai caru in CPU.
  • OcrInput.EnhanceResolution - Migliora a risoluzione di l'imagine di bassa qualità. Stu filtru ùn hè micca spessu necessariu perchè OcrInput.MinimumDPI è OcrInput.TargetDPI catturerà è risolverà automaticamente input di bassa risoluzione.

CleanBackgroundNoise. Questu hè un ambiente chì cunsuma un pocu di tempu; in ogni modu, permette à a biblioteca di pulisce automaticamente u rumore digitale, a carta sgretolata, è altre imperfezzioni in una maghjina digitale chì altrimente a renderebbe incapace di esse letta da altre biblioteche OCR.

EnhanceContrast hè un paràmetru chì face chì Iron OCR aumenterà automaticamente u cuntrastu di u testu nantu à u fondu di una maghjina, aumentendu a precisione di OCR è generalmente aumentendu e prestazioni è a velocità di OCR.

EnhanceResolution hè un paràmetru chì hà da rilevà automaticamente e immagini à bassa risoluzione (chì sò menu di 275 dpi) è arricchisce automaticamente l'immagine è poi affina tuttu u testu in modu da pudè leghje perfettamente una libreria OCR. Benchì questa operazione sia di per sé lunga, riduce generalmente u tempu generale per un'operazione OCR nantu à una maghjina.

Language Iron OCR supporta 22 pacchetti di lingue internaziunali, è l'impostazione linguistica pò esse aduprata per selezziunà una o più lingue multiple da applicà per un'operazione OCR.

Strategy Iron OCR sustene duie strategie. Puderemu sceglie di andà per una scansione rapida è menu precisa di un documentu, o aduprà una strategia avanzata chì utilizza alcuni mudelli d'intelligenza artificiale per migliurà automaticamente a precisione di u testu OCR fighjendu a relazione statistica di e parolle in una frase. .

ColorSpace hè un paràmetru induve pudemu sceglie OCR in scala di grisgiu o culore. Generalmente, a scala di grisgiu hè a megliu opzione. Tuttavia, qualchì volta quandu ci sò testi o sfondi di tonalità simile ma di culore assai diversu, un spaziu di culore à pienu culore darà risultati megliu.

DetectWhiteTextOnDarkBackgrounds. Generalmente, tutte e biblioteche OCR aspettanu di vede testu neru nantu à sfondi bianchi. Questa impostazione permette à Iron OCR di rilevà automaticamente negativi, o pagine scure cun testu biancu, è leghje li.

InputImageType. Questa impostazione permette à u sviluppatore di guidà a biblioteca OCR nantu à se stà guardendu un documentu cumpletu o un frammentu, cum'è una screenshot.

RotateAndStraighten hè un paràmetru avanzatu chì permette à Iron OCR a capacità unica di leghje documenti chì ùn sò micca solu rotati, ma forse cuntenenu perspettiva, cum'è e fotografie di documenti di testu.

ReadBarcodes hè una caratteristica utile chì permette à Iron OCR di leghje automaticamente i codici a barre è i codici QR in pagine cume leghje ancu testu, senza aghjunghje un grande pesu di tempu addizionale.

CuloreProfundità. Questa impostazione determina quanti bit per pixel a biblioteca OCR utilizerà per determinà a profondità di un culore. Una prufundità di culore più alta pò aumentà a qualità OCR, ma aumenterà ancu u tempu necessariu per l'operazione OCR per compie.

126 Pacchetti di Lingua

Iron OCR supporta 126 lingue internaziunali per via di pack linguistichi chì sò distribuiti cum'è DLL, chì ponu esse scaricati da stu situ web , o ancu da u NuGet Package Manager .

E lingue includenu Tedescu, Francese, Inglese, Cinese, Giapponese è assai altri. Pacchetti linguistici specializati esistenu per passaporti MRZ, cuntrolli MICR, Dati Finanziarii, Ticchette è assai altri. Pudete ancu aduprà qualsiasi fugliale tesseract ".traineddata" - ancu quelli chì create da voi stessu.

Esempiu di lingua

Usendu altre lingue OCR.

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Aghjunghjite filtri d'immagine se necessariu
// In questu casu, ancu l'input pensatu hè di qualità assai bassa
// IronTesseract pò leghje ciò chì Tesseract convenzionale ùn pò micca.

var Result = Ocr.Read(input);

// A Consola ùn pò micca stampà l'arabu in Windows facilmente.
// Salvemu nant'à u discu invece.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Aghjunghjite filtri d'immagine se necessariu
// In questu casu, ancu l'input pensatu hè di qualità assai bassa
// IronTesseract pò leghje ciò chì Tesseract convenzionale ùn pò micca.

var Result = Ocr.Read(input);

// A Consola ùn pò micca stampà l'arabu in Windows facilmente.
// Salvemu nant'à u discu invece.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Aghjunghjite filtri d'immagine se necessariu
' In questu casu, ancu l'input pensatu hè di qualità assai bassa
' IronTesseract pò leghje ciò chì Tesseract convenzionale ùn pò micca.

Dim Result = Ocr.Read(input)

' A Consola ùn pò micca stampà l'arabu in Windows facilmente.
' Salvemu nant'à u discu invece.
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

Esempiu di Lingua Multipla

Hè ancu pussibule à OCR aduprendu parechje lingue in listessu tempu. Questu pò veramente aiutà à uttene metadati è URL in lingua inglese in documenti Unicode.

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican);

// Pudemu aghjunghje un numeru numeru di lingue

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican);

// Pudemu aghjunghje un numeru numeru di lingue

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican)

' Pudemu aghjunghje un numeru numeru di lingue

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

Oggetti Risultati OCR Risultati

Iron OCR restituisce un ughjettu di risultatu OCR per ogni operazione OCR. Generalmente, i sviluppatori utilizanu solu a pruprietà di u testu di questu oggettu per uttene u testu scansitu da l'imaghjina. Tuttavia, i risultati OCR DOM hè assai più avanzatu di questu.

using IronOcr;
using System.Drawing; //Aghjunghje Riferimentu di l'Assemblea

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! Impurtante

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// Esplora quì per truvà una API massiccia, dettagliata:
// - Pagine, Blocchi, Paraphaphs, Linee, Parolle, Chars
// - Esportazione di l'immagine, Coordinate di caratteri, Dati statistichi
}
using IronOcr;
using System.Drawing; //Aghjunghje Riferimentu di l'Assemblea

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! Impurtante

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// Esplora quì per truvà una API massiccia, dettagliata:
// - Pagine, Blocchi, Paraphaphs, Linee, Parolle, Chars
// - Esportazione di l'immagine, Coordinate di caratteri, Dati statistichi
}
Imports IronOcr
Imports System.Drawing 'Aghjunghje Riferimentu di l'Assemblea

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '! Impurtante

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' Esplora quì per truvà una API massiccia, dettagliata:
' - Pagine, Blocchi, Paraphaphs, Linee, Parolle, Chars
' - Esportazione di l'immagine, Coordinate di caratteri, Dati statistichi
End Using
VB   C#

Rendimentu

IronOCR funziona fora di a scatula senza bisognu di mette in opera e prestazioni o di mudificà pesantmente e immagini di input.

A velocità hè ardente: IronOcr.2020 + hè finu à 10 volte più veloce è face più di 250% menu errori di e costruzioni precedenti.

Sapè ne di più

Per amparà di più nantu à OCR in C #, VB, F #, o qualsiasi altra lingua .NET, per piacè leghjite i nostri tutoriali di a cumunità , chì danu esempi di u mondu reale di cume Iron OCR pò esse adupratu è pò mostrà e sfumature di cume uttene u megliu da sta biblioteca.

Una riferenza d'ughjettu cumpleta per i sviluppatori .NET hè ancu dispunibile.