OCR corsu in C#è .NET
Altre versioni di stu documentu:
IronOCR hè un cumpunente di software C#chì permette à i codificatori .NET di leghje testu da imaghjini è ducumenti PDF in 126 lingue, cumpresu u corsu.
Hè una forchetta avanzata di Tesseract, custruita solu per i sviluppatori .NET è supera di modu regulare l'altri mutori Tesseract sia per a velocità sia per a precisione.
Cuntenutu di IronOcr.Languages.Corsican
Stu pacchettu cuntene 49 lingue OCR per .NET:
- Corsu
- CorsuMiglior
- CorsicanFast
Scaricà
Pack de langue corse [corsu]
* Download as Zip
* Install with as https://www.nuget.org/packages/IronOcr.Languages.Corsican/'> NuGet
Stallazione
A prima cosa avemu à fà hè fatta in u nostru pacchettu Corsican ICT à u vostru prughjettu .com.
PM> Install-Package IronOCR.Languages.Corsican
Esempiu di Codice
Questu esempiu di codice C#leghje u testu corsu da un documentu Image o PDF.
//PM> Install-Package IronOcr.Languages.Corsican
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput(@"images\Corsican.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Corsican
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput(@"images\Corsican.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Corsican
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput("images\Corsican.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
Perchè Sceglite IronOCR?
IronOCR hè una libreria di software .NET faciule da installà, cumpleta è ben documentata.
Sceglite IronOCR per uttene 99,8% + precisione OCR senza aduprà alcun serviziu web esternu, tasse in corsu o inviu di documenti cunfidenziali nantu à Internet.
Perchè i sviluppatori C#scelenu IronOCR sopra Vanilla Tesseract:
- Installa cum'è una sola DLL o NuGet
- Include per i Motori Tesseract 5, 4 è 3 fora di scatula.
- A precisione 99,8% supera significativamente à u Tesseract regulare.
- Velocità Blazing è MultiThreading
- Compatibile MVC, WebApp, Desktop, Console & Server
- Nisun codice Exes o C ++ per travaglià
- Supportu PDF OCR cumpletu
- Per fà OCR un guasgi qualsiasi fugliale Image o PDF
- Supportu Full .NET Core, Standard è FrameWork
- Distribuite nantu à Windows, Mac, Linux, Azure, Docker, Lambda, AWS
- Leghje i codici a barre è i codici QR
- Esporta OCR in quantu à XHTML
- Esporta OCR in documenti PDF ricercabili
- Supportu multithreading
- 126 lingue internaziunali tutte gestite via i fugliali NuGet o OcrData
- Estrae Immagini, Coordinate, Statistiche è Caratteri. Micca solu testu.
- Pò esse adupratu per ridistribuisce Tesseract OCR in applicazioni commerciali è proprietarie.
OCR di Ferru brilla quandu si travaglia cù immagini di u mondu reale è documenti imperfetti cume e fotografie, o scans di bassa risoluzione chì pò avè rumore digitale o imperfezzioni.
Altre biblioteche OCR gratuite per a piattaforma .NET tali altre API .net tesseract è servizii web ùn si comportanu micca bè in questi casi d'usu di u mondu reale.
OCR cù Tesseract 5 - Avvia a Codificazione in C #
U campione di codice sottu mostra quantu hè faciule di leghje u testu da una maghjina cù C#o VB .NET.
OneLiner
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
Configurabile Hello World
// PM> Install-Package IronOCR.Languages.Corsican
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... pudete aghjunghje un numeru numeru di immagini
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Corsican
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... pudete aghjunghje un numeru numeru di immagini
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Corsican
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
C#PDF OCR
U listessu approcciu pò esse adupratu ancu per estrarre testu da qualsiasi documentu PDF.
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Pudemu ancu selezziunà numeri di pagine PDF specifici à OCR
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 pagina per ogni pagina di u PDF
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Pudemu ancu selezziunà numeri di pagine PDF specifici à OCR
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 pagina per ogni pagina di u PDF
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' Pudemu ancu selezziunà numeri di pagine PDF specifici à OCR
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' 1 pagina per ogni pagina di u PDF
End Using
OCR per TIFF MultiPage
OCR Reading Format di fugliale TIFF cumprese documenti di pagine multiple. U TIFF pò ancu esse cunvertitu direttamente in un schedariu PDF cù testu ricercabile.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Codici a barre e QR
Una caratteristica unica di IronOCR hè chì pò leghje codici a barre è codici QR da documenti mentre scansiona per u testu. Istanze di a Classe OcrResult.OcrBarcode
danu à u sviluppatore informazioni dettagliate nantu à ogni codice à OcrResult.OcrBarcode
.
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// pruprietà di tippu è di situazione ancu esposte
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// pruprietà di tippu è di situazione ancu esposte
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' pruprietà di tippu è di situazione ancu esposte
Next Barcode
End Using
OCR nantu à Aree Specifiche di Immagini
Tutti i metudi di scansione è lettura di IronOCR furniscenu a capacità di specificà esattamente da chì parte di una pagina o pagine vulemu leghje testu. Questu hè assai utile quandu guardemu à e forme standardizate è ponu risparmià assai tempu è migliurà l'efficienza.
Per aduprà e regioni di System.Drawing
aghjunghje un riferimentu di sistema à System.Drawing
modu da pudè aduprà l'ughjettu System.Drawing.Rectangle
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// E dimensioni sò in px
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// E dimensioni sò in px
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' E dimensioni sò in px
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR per Scans di Bassa Qualità
A classa IronOCR OcrInput
pò risolve scans chì Tesseract normale ùn pò micca leghje.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // risolve u rumore digitale è a scansione scarsa
Input.Deskew(); // ripara a rotazione è a perspettiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // risolve u rumore digitale è a scansione scarsa
Input.Deskew(); // ripara a rotazione è a perspettiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' risolve u rumore digitale è a scansione scarsa
Input.Deskew() ' ripara a rotazione è a perspettiva
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Esporta risultati OCR cum'è PDF ricercabile
Immagine in PDF cù stringhe di testu cupiate. Pò esse indiziatu da i motori di ricerca è e basi di dati.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")
Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
TIFF à Cunversione PDF ricercabile
Cunvertite un documentu TIFF (o qualsiasi gruppu di fugliali d'imagine) direttamente in un PDF ricercabile chì pò esse indiziatu da intranet, situ web è motori di ricerca google.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
Esporta risultati OCR cum'è HTML
Conversione Image OCR in XHTML.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
Filtri di Migliurazione di l'immagine OCR
IronOCR furnisce filtri unichi per OcrInput
oggetti OcrInput
per migliurà e prestazioni OCR.
Esempiu di Codice di Migliurazione di l'Imagine
Rende l'imagine di input OCR di qualità superiore per pruduce risultati OCR megliu è più veloci.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // risolve u rumore digitale è a scansione scarsa
Input.Deskew(); // ripara a rotazione è a perspettiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // risolve u rumore digitale è a scansione scarsa
Input.Deskew(); // ripara a rotazione è a perspettiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' risolve u rumore digitale è a scansione scarsa
Input.Deskew() ' ripara a rotazione è a perspettiva
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Elencu di Filtri Image OCR
I filtri di input per migliorà e prestazioni OCR chì sò integrate in IronOCR includenu:
- OcrInput.Rotate (doppia gradu) - Gira l'imaghjini da un numeru di gradi in sensu urariu. Per u sensu antiurariu, aduprate numeri negativi.
- OcrInput.Binarize () - Stu filtru di l'immagine trasforma ogni pixel in neru o biancu senza nisun mezu. Puderà Migliurà i casi di prestazione OCR di cuntrastu assai bassu di u testu à u fondu.
- OcrInput.ToGrayScale () - Stu filtru d'imaghjini trasforma ogni pixel in un ombra di scala di grisgiu. Improbabile di migliurà a precisione OCR ma pò migliurà a velocità
- OcrInput.Contrast () - Aumenta u cuntrastu automaticamente. Stu filtru migliora spessu a velocità è a precisione OCR in scans à bassu cuntrastu.
- OcrInput.DeNoise () - Elimina u rumore digitale. Stu filtru deve esse adupratu solu induve si prevede rumore.
- OcrInput.Invert () - Inverte ogni culore. Es. Biancu diventa neru: u neru diventa biancu.
- OcrInput.Dilate () - Morfologia Avanzata. A dilatazione aghjusta pixel à i cunfini di l'uggetti in una maghjina. Oppostu di Erode
- OcrInput.Erode () - Morfologia Avanzata. L'erosione elimina i pixel nantu à i limiti di l'ughjettu Opposite di Dilate
- OcrInput.Deskew () - Gira una maghjina per chì sia a strada ghjusta è ortogonale. Questu hè assai utile per OCR perchè a tolleranza Tesseract per scans distorsioni pò esse bassu 5 gradi.
- OcrInput.DeepCleanBackgroundNoise () - Rimozione di rumore di fondu pesante. Aduprate solu stu filtru in casu chì u rumore di fondu di u documentu estremu sia cunnisciutu, perchè stu filtru risicherà ancu di riduce a precisione OCR di documenti puliti, è hè assai caru in CPU.
- OcrInput.EnhanceResolution - Migliora a risoluzione di l'imagine di bassa qualità. Stu filtru ùn hè micca spessu necessariu perchè OcrInput.MinimumDPI è OcrInput.TargetDPI catturerà è risolverà automaticamente input di bassa risoluzione.
CleanBackgroundNoise. Questu hè un ambiente chì cunsuma un pocu di tempu; in ogni modu, permette à a biblioteca di pulisce automaticamente u rumore digitale, a carta sgretolata, è altre imperfezzioni in una maghjina digitale chì altrimente a renderebbe incapace di esse letta da altre biblioteche OCR.
EnhanceContrast hè un paràmetru chì face chì IronOCR aumenterà automaticamente u cuntrastu di u testu nantu à u fondu di una maghjina, aumentendu a precisione di OCR è generalmente aumentendu e prestazioni è a velocità di OCR.
EnhanceResolution hè un paràmetru chì hà da rilevà automaticamente e immagini à bassa risoluzione (chì sò menu di 275 dpi) è arricchisce automaticamente l'immagine è poi affina tuttu u testu in modu da pudè leghje perfettamente una libreria OCR. Benchì questa operazione sia di per sé lunga, riduce generalmente u tempu generale per un'operazione OCR nantu à una maghjina.
Language IronOCR supporta 22 pacchetti di lingue internaziunali, è l'impostazione linguistica pò esse aduprata per selezziunà una o più lingue multiple da applicà per un'operazione OCR.
Strategy IronOCR sustene duie strategie. Puderemu sceglie di andà per una scansione rapida è menu precisa di un documentu, o aduprà una strategia avanzata chì utilizza alcuni mudelli d'intelligenza artificiale per migliurà automaticamente a precisione di u testu OCR fighjendu a relazione statistica di e parolle in una frase. .
ColorSpace hè un paràmetru induve pudemu sceglie OCR in scala di grisgiu o culore. Generalmente, a scala di grisgiu hè a megliu opzione. Tuttavia, qualchì volta quandu ci sò testi o sfondi di tonalità simile ma di culore assai diversu, un spaziu di culore à pienu culore darà risultati megliu.
DetectWhiteTextOnDarkBackgrounds. Generalmente, tutte e biblioteche OCR aspettanu di vede testu neru nantu à sfondi bianchi. Questa impostazione permette à IronOCR di rilevà automaticamente negativi, o pagine scure cun testu biancu, è leghje li.
InputImageType. Questa impostazione permette à u sviluppatore di guidà a biblioteca OCR nantu à se stà guardendu un documentu cumpletu o un frammentu, cum'è una screenshot.
RotateAndStraighten hè un paràmetru avanzatu chì permette à IronOCR a capacità unica di leghje documenti chì ùn sò micca solu rotati, ma forse cuntenenu perspettiva, cum'è e fotografie di documenti di testu.
ReadBarcodes hè una caratteristica utile chì permette à IronOCR di leghje automaticamente i codici a barre è i codici QR in pagine cume leghje ancu testu, senza aghjunghje un grande pesu di tempu addizionale.
CuloreProfundità. Questa impostazione determina quanti bit per pixel a biblioteca OCR utilizerà per determinà a profondità di un culore. Una prufundità di culore più alta pò aumentà a qualità OCR, ma aumenterà ancu u tempu necessariu per l'operazione OCR per compie.
126 Pacchetti di Lingua
IronOCR supporta 126 lingue internaziunali per via di pack linguistichi chì sò distribuiti cum'è DLL, chì ponu esse scaricati da stu situ web , o ancu da u NuGet Package Manager .
E lingue includenu Tedescu, Francese, Inglese, Cinese, Giapponese è assai altri. Pacchetti linguistici specializati esistenu per passaporti MRZ, cuntrolli MICR, Dati Finanziarii, Ticchette è assai altri. Pudete ancu aduprà qualsiasi fugliale tesseract ".traineddata" - ancu quelli chì create da voi stessu.
Esempiu di lingua
Usendu altre lingue OCR.
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Aghjunghjite filtri d'immagine se necessariu
// In questu casu, ancu l'input pensatu hè di qualità assai bassa
// IronTesseract pò leghje ciò chì Tesseract convenzionale ùn pò micca.
var Result = Ocr.Read(input);
// A Consola ùn pò micca stampà l'arabu in Windows facilmente.
// Salvemu nant'à u discu invece.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Aghjunghjite filtri d'immagine se necessariu
// In questu casu, ancu l'input pensatu hè di qualità assai bassa
// IronTesseract pò leghje ciò chì Tesseract convenzionale ùn pò micca.
var Result = Ocr.Read(input);
// A Consola ùn pò micca stampà l'arabu in Windows facilmente.
// Salvemu nant'à u discu invece.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Aghjunghjite filtri d'immagine se necessariu
' In questu casu, ancu l'input pensatu hè di qualità assai bassa
' IronTesseract pò leghje ciò chì Tesseract convenzionale ùn pò micca.
Dim Result = Ocr.Read(input)
' A Consola ùn pò micca stampà l'arabu in Windows facilmente.
' Salvemu nant'à u discu invece.
Result.SaveAsTextFile("arabic.txt")
End Using
Esempiu di Lingua Multipla
Hè ancu pussibule à OCR aduprendu parechje lingue in listessu tempu. Questu pò veramente aiutà à uttene metadati è URL in lingua inglese in documenti Unicode.
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican);
// Pudemu aghjunghje un numeru numeru di lingue
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican);
// Pudemu aghjunghje un numeru numeru di lingue
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican)
' Pudemu aghjunghje un numeru numeru di lingue
Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
Oggetti Risultati OCR Risultati
IronOCR restituisce un ughjettu di risultatu OCR per ogni operazione OCR. Generalmente, i sviluppatori utilizanu solu a pruprietà di u testu di questu oggettu per uttene u testu scansitu da l'imaghjina. Tuttavia, i risultati OCR DOM hè assai più avanzatu di questu.
using IronOcr;
using System.Drawing; //Aghjunghje Riferimentu di l'Assemblea
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! Impurtante
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Esplora quì per truvà una API massiccia, dettagliata:
// - Pagine, Blocchi, Paraphaphs, Linee, Parolle, Chars
// - Esportazione di l'immagine, Coordinate di caratteri, Dati statistichi
}
using IronOcr;
using System.Drawing; //Aghjunghje Riferimentu di l'Assemblea
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! Impurtante
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Esplora quì per truvà una API massiccia, dettagliata:
// - Pagine, Blocchi, Paraphaphs, Linee, Parolle, Chars
// - Esportazione di l'immagine, Coordinate di caratteri, Dati statistichi
}
Imports IronOcr
Imports System.Drawing 'Aghjunghje Riferimentu di l'Assemblea
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '! Impurtante
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' Esplora quì per truvà una API massiccia, dettagliata:
' - Pagine, Blocchi, Paraphaphs, Linee, Parolle, Chars
' - Esportazione di l'immagine, Coordinate di caratteri, Dati statistichi
End Using
Rendimentu
IronOCR funziona fora di a scatula senza bisognu di mette in opera e prestazioni o di mudificà pesantmente e immagini di input.
A velocità hè ardente: IronOcr.2020 + hè finu à 10 volte più veloce è face più di 250% menu errori di e costruzioni precedenti.
Sapè ne di più
Per amparà di più nantu à OCR in C #, VB, F #, o qualsiasi altra lingua .NET, per piacè leghjite i nostri tutoriali di a cumunità , chì danu esempi di u mondu reale di cume IronOCR pò esse adupratu è pò mostrà e sfumature di cume uttene u megliu da sta biblioteca.
Una riferenza d'ughjettu cumpleta per i sviluppatori .NET hè ancu dispunibile.