OCR corsu in C# è .NET
Altre versioni di stu documentu:
IronOCR hè un cumpunente di software C# chì permette à i codificatori .NET di leghje testu da imaghjini è ducumenti PDF in 126 lingue, cumpresu u corsu. Hè una forchetta avanzata di Tesseract, custruita solu per i sviluppatori .NET è supera di modu regulare l'altri mutori Tesseract sia per a velocità sia per a precisione.
Cuntenutu di IronOcr.Languages.Corsican
Stu pacchettu cuntene 49 lingue OCR per .NET:
- Corsu
- CorsuMiglior
- CorsicanFast
Scaricà
Pack de langue corse [corsu]
Stallazione
A prima cosa avemu à fà hè fatta in u nostru pacchettu Corsican ICT à u vostru prughjettu .com.
Install-Package IronOCR.Languages.Corsican
Esempiu di Codice
Questu esempiu di codice C# leghje u testu corsu da un documentu Image o PDF.
// PM> Install-Package IronOcr.Languages.Corsican
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from an image file
using (var Input = new OcrInput(@"images\Corsican.png"))
{
// Perform OCR to read text from the input
var Result = Ocr.Read(Input);
// Store all extracted text
var AllText = Result.Text;
}
// PM> Install-Package IronOcr.Languages.Corsican
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from an image file
using (var Input = new OcrInput(@"images\Corsican.png"))
{
// Perform OCR to read text from the input
var Result = Ocr.Read(Input);
// Store all extracted text
var AllText = Result.Text;
}
' PM> Install-Package IronOcr.Languages.Corsican
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
' Create OCR input from an image file
Using Input = New OcrInput("images\Corsican.png")
' Perform OCR to read text from the input
Dim Result = Ocr.Read(Input)
' Store all extracted text
Dim AllText = Result.Text
End Using
Perchè Sceglite IronOCR?
IronOCR hè una libreria di software .NET faciule da installà, cumpleta è ben documentata. Sceglite IronOCR per uttene 99,8% + precisione OCR senza aduprà alcun serviziu web esternu, tasse in corsu o inviu di documenti cunfidenziali nantu à Internet.
Perchè i sviluppatori C# scelenu IronOCR sopra Vanilla Tesseract:
- Installa cum'è una sola DLL o NuGet
- Include per i Motori Tesseract 5, 4 è 3 fora di scatula.
- A precisione 99,8% supera significativamente à u Tesseract regulare.
- Velocità Blazing è MultiThreading
- Compatibile MVC, WebApp, Desktop, Console & Server
- Nisun codice Exes o C++ per travaglià
- Supportu PDF OCR cumpletu
- Per fà OCR un guasgi qualsiasi fugliale Image o PDF
- Supportu Full .NET Core, Standard è FrameWork
- Distribuite nantu à Windows, Mac, Linux, Azure, Docker, Lambda, AWS
- Leghje i codici a barre è i codici QR
- Esporta OCR in quantu à XHTML
- Esporta OCR in documenti PDF ricercabili
- Supportu multithreading
- 126 lingue internaziunali tutte gestite via i fugliali NuGet o OcrData
- Estrae Immagini, Coordinate, Statistiche è Caratteri. Micca solu testu.
- Pò esse adupratu per ridistribuisce Tesseract OCR in applicazioni commerciali è proprietarie.
OCR di Ferru brilla quandu si travaglia cù immagini di u mondu reale è documenti imperfetti cume e fotografie, o scans di bassa risoluzione chì pò avè rumore digitale o imperfezzioni.
Altre biblioteche OCR gratuite per a piattaforma .NET tali altre API .net tesseract è servizii web ùn si comportanu micca bè in questi casi d'usu di u mondu reale.
OCR cù Tesseract 5 - Avvia a Codificazione in C#
U campione di codice sottu mostra quantu hè faciule di leghje u testu da una maghjina cù C# o VB .NET.
OneLiner
using IronOcr;
// Perform a simple OCR read operation in a single line
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
using IronOcr;
// Perform a simple OCR read operation in a single line
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Imports IronOcr
' Perform a simple OCR read operation in a single line
Private Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
Configurabile Hello World
// PM> Install-Package IronOCR.Languages.Corsican
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from multiple images
using (var Input = new OcrInput())
{
Input.AddImage("images/sample.jpeg");
// ... You can add multiple images to the input
// Perform OCR and display result
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Corsican
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from multiple images
using (var Input = new OcrInput())
{
Input.AddImage("images/sample.jpeg");
// ... You can add multiple images to the input
// Perform OCR and display result
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Corsican
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
' Create OCR input from multiple images
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg")
' ... You can add multiple images to the input
' Perform OCR and display result
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
C# PDF OCR
U listessu approcciu pò esse adupratu ancu per estrarre testu da qualsiasi documentu PDF.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from a PDF file that may be password protected
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Perform OCR and get results
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages"); // 1 pagina per ogni pagina di u PDF
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from a PDF file that may be password protected
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Perform OCR and get results
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages"); // 1 pagina per ogni pagina di u PDF
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
' Create OCR input from a PDF file that may be password protected
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' Perform OCR and get results
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages") ' 1 pagina per ogni pagina di u PDF
End Using
OCR per TIFF MultiPage
OCR Reading Format di fugliale TIFF cumprese documenti di pagine multiple. U TIFF pò ancu esse cunvertitu direttamente in un schedariu PDF cù testu ricercabile.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input for a multipage TIFF file
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("multi-frame.tiff");
// Perform OCR and display result
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input for a multipage TIFF file
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("multi-frame.tiff");
// Perform OCR and display result
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
' Create OCR input for a multipage TIFF file
Using Input = New OcrInput()
Input.AddMultiFrameTiff("multi-frame.tiff")
' Perform OCR and display result
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Codici a barre e QR
Una caratteristica unica di IronOCR hè chì pò leghje codici a barre è codici QR da documenti mentre scansiona per u testu. Istanze di a Classe OcrResult.OcrBarcode
danu à u sviluppatore informazioni dettagliate nantu à ogni codice à OcrResult.OcrBarcode
.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
// Create OCR input for image containing barcode
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
// Perform OCR to extract barcodes
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// Additional properties for barcode type and location are also available
}
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
// Create OCR input for image containing barcode
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
// Perform OCR to extract barcodes
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// Additional properties for barcode type and location are also available
}
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
' Create OCR input for image containing barcode
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
' Perform OCR to extract barcodes
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' Additional properties for barcode type and location are also available
Next Barcode
End Using
OCR nantu à Aree Specifiche di Immagini
Tutti i metudi di scansione è lettura di IronOCR furniscenu a capacità di specificà esattamente da chì parte di una pagina o pagine vulemu leghje testu. Questu hè assai utile quandu guardemu à e forme standardizate è ponu risparmià assai tempu è migliurà l'efficienza.
Per aduprà e regioni di System.Drawing
, aghjunghje un riferimentu di sistema à System.Drawing
, modu da pudè aduprà l'ughjettu System.Drawing.Rectangle
.
using IronOcr;
using System.Drawing;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Specify the region within the image to perform OCR
using (var Input = new OcrInput())
{
var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 }; // Dimensions in pixels
Input.Add("document.png", ContentArea);
// Perform OCR and display result
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
using System.Drawing;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Specify the region within the image to perform OCR
using (var Input = new OcrInput())
{
var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 }; // Dimensions in pixels
Input.Add("document.png", ContentArea);
// Perform OCR and display result
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Imports System.Drawing
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
' Specify the region within the image to perform OCR
Using Input = New OcrInput()
Dim ContentArea = New Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
Input.Add("document.png", ContentArea)
' Perform OCR and display result
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR per Scans di Bassa Qualità
A classa IronOCR OcrInput
pò risolve scans chì Tesseract normale ùn pò micca leghje.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from a low quality image
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // Removes digital noise
Input.Deskew(); // Corrects skew and perspective
// Perform OCR and display result
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from a low quality image
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // Removes digital noise
Input.Deskew(); // Corrects skew and perspective
// Perform OCR and display result
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
' Create OCR input from a low quality image
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' Removes digital noise
Input.Deskew() ' Corrects skew and perspective
' Perform OCR and display result
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Esporta risultati OCR cum'è PDF ricercabile
Immagine in PDF cù stringhe di testu cupiate. Pò esse indiziatu da i motori di ricerca è e basi di dati.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from multiple images
using (var Input = new OcrInput())
{
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
// Perform OCR and save as a searchable PDF
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from multiple images
using (var Input = new OcrInput())
{
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
// Perform OCR and save as a searchable PDF
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
' Create OCR input from multiple images
Using Input = New OcrInput()
Input.Title = "Quarterly Report"
Input.AddImage("image1.jpeg")
Input.AddImage("image2.png")
Input.AddImage("image3.gif")
' Perform OCR and save as a searchable PDF
Dim Result = Ocr.Read(Input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
TIFF à Cunversione PDF ricercabile
Cunvertite un documentu TIFF (o qualsiasi gruppu di fugliali d'imagine) direttamente in un PDF ricercabile chì pò esse indiziatu da intranet, situ web è motori di ricerca google.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input for a multipage TIFF file
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("example.tiff");
// Perform OCR and save as a searchable PDF
var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input for a multipage TIFF file
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("example.tiff");
// Perform OCR and save as a searchable PDF
var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
' Create OCR input for a multipage TIFF file
Using Input = New OcrInput()
Input.AddMultiFrameTiff("example.tiff")
' Perform OCR and save as a searchable PDF
Dim Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf")
End Using
Esporta risultati OCR cum'è HTML
Conversione Image OCR in XHTML.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from an image
using (var Input = new OcrInput())
{
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
// Perform OCR and save as HTML
var Result = Ocr.Read(Input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from an image
using (var Input = new OcrInput())
{
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
// Perform OCR and save as HTML
var Result = Ocr.Read(Input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
' Create OCR input from an image
Using Input = New OcrInput()
Input.Title = "Html Title"
Input.AddImage("image1.jpeg")
' Perform OCR and save as HTML
Dim Result = Ocr.Read(Input)
Result.SaveAsHocrFile("results.html")
End Using
Filtri di Migliurazione di l'imagine OCR
IronOCR furnisce filtri unici per OcrInput
oggetti per migliurà e prestazioni OCR.
Esempiu di Codice di Migliurazione di l'Imagine
Rende l'imagine di input OCR di qualità superiore per pruduce risultati OCR megliu è più veloci.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from a low-quality image
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // Removes digital noise
Input.Deskew(); // Corrects skew and perspective
// Perform OCR and display result
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
// Create OCR input from a low-quality image
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // Removes digital noise
Input.Deskew(); // Corrects skew and perspective
// Perform OCR and display result
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
' Create OCR input from a low-quality image
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' Removes digital noise
Input.Deskew() ' Corrects skew and perspective
' Perform OCR and display result
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Elencu di Filtri Image OCR
I filtri di input per migliorà e prestazioni OCR chì sò integrate in IronOCR includenu:
- OcrInput.Rotate (doppia gradu) - Gira l'imaghjini da un numeru di gradi in sensu urariu. Per u sensu antiurariu, aduprate numeri negativi.
- OcrInput.Binarize () - Stu filtru di l'immagine trasforma ogni pixel in neru o biancu senza nisun mezu. Puderà Migliurà i casi di prestazione OCR di cuntrastu assai bassu di u testu à u fondu.
- OcrInput.ToGrayScale () - Stu filtru d'imaghjini trasforma ogni pixel in un ombra di scala di grisgiu. Improbabile di migliurà a precisione OCR ma pò migliurà a velocità.
- OcrInput.Contrast () - Aumenta u cuntrastu automaticamente. Stu filtru migliora spessu a velocità è a precisione OCR in scans à bassu cuntrastu.
- OcrInput.DeNoise () - Elimina u rumore digitale. Stu filtru deve esse adupratu solu induve si prevede rumore.
- OcrInput.Invert () - Inverte ogni culore. Es. Biancu diventa neru: u neru diventa biancu.
- OcrInput.Dilate () - Morfologia Avanzata. A dilatazione aghjusta pixel à i cunfini di l'uggetti in una maghjina. Oppostu di Erode.
- OcrInput.Erode () - Morfologia Avanzata. L'erosione elimina i pixel nantu à i limiti di l'ughjettu. Opposte di Dilate.
- OcrInput.Deskew () - Gira una maghjina per chì sia a strada ghjusta è ortogonale. Questu hè assai utile per OCR perchè a tolleranza Tesseract per scans distorsioni pò esse bassu 5 gradi.
- OcrInput.DeepCleanBackgroundNoise () - Rimozione di rumore di fondu pesante. Aduprate solu stu filtru in casu chì u rumore di fondu di u documentu estremu sia cunnisciutu, perchè stu filtru risikerà ancu di riduce a precisione OCR di documenti puliti, è hè assai caru in CPU.
- OcrInput.EnhanceResolution - Migliora a risoluzione di l'immagine di bassa qualità. Stu filtru ùn hè micca spessu necessariu perchè OcrInput.MinimumDPI è OcrInput.TargetDPI catturerà è risolverà automaticamente input di bassa risoluzione.
CleanBackgroundNoise. Questu hè un ambiente chì cunsuma un pocu di tempu; in ogni modu, permette à a biblioteca di pulisce automaticamente u rumore digitale, a carta sgretolata, è altre imperfezzioni in una maghjina digitale chì altrimente a renderebbe incapace di esse letta da altre biblioteche OCR.
EnhanceContrast hè un paràmetru chì face chì IronOCR aumenterà automaticamente u cuntrastu di u testu nantu à u fondu di una maghjina, aumentendu a precisione di OCR è generalmente aumentendu e prestazioni è a velocità di OCR.
EnhanceResolution hè un paràmetru chì hà da rilevà automaticamente e immagini à bassa risoluzione (chì sò menu di 275 dpi) è arricchisce automaticamente l'immagine è poi affina tuttu u testu in modu da pudè leghje perfettamente una libreria OCR. Benchì questa operazione sia di per sé lunga, riduce generalmente u tempu generale per un'operazione OCR nantu à una maghjina.
Language IronOCR supporta 22 pacchetti di lingue internaziunali, è l'impostazione linguistica pò esse aduprata per selezziunà una o più lingue multiple da applicà per un'operazione OCR.
Strategy IronOCR sustene duie strategie. Puderemu sceglie di andà per una scansione rapida è menu precisa di un documentu, o aduprà una strategia avanzata chì utilizza alcuni mudelli d'intelligenza artificiale per migliurà automaticamente a precisione di u testu OCR fighjendu a relazione statistica di e parolle in una frase.
ColorSpace hè un paràmetru induve pudemu sceglie OCR in scala di grisgiu o culore. Generalmente, a scala di grisgiu hè a megliu opzione. Tuttavia, qualchì volta quandu ci sò testi o sfondi di tonalità simile ma di culore assai diversu, un spaziu di culore à pienu culore darà risultati megliu.
DetectWhiteTextOnDarkBackgrounds. Generalmente, tutte e biblioteche OCR aspettanu di vede testu neru nantu à sfondi bianchi. Questa impostazione permette à IronOCR di rilevà automaticamente negativi, o pagine scure cun testu biancu, è leghje li.
InputImageType. Questa impostazione permette à u sviluppatore di guidà a biblioteca OCR nantu à se stà guardendu un documentu cumpletu o un frammentu, cum'è una screenshot.
RotateAndStraighten hè un paràmetru avanzatu chì permette à IronOCR a capacità unica di leghje documenti chì ùn sò micca solu rotati, ma forse cuntenenu perspettiva, cum'è e fotografie di documenti di testu.
ReadBarcodes hè una caratteristica utile chì permette à IronOCR di leghje automaticamente i codici a barre è i codici QR in pagine cume leghje ancu testu, senza aghjunghje un grande pesu di tempu addizionale.
CuloreProfundità. Questa impostazione determina quanti bit per pixel a biblioteca OCR utilizerà per determinà a profondità di un culore. Una prufundità di culore più alta pò aumentà a qualità OCR, ma aumenterà ancu u tempu necessariu per l'operazione OCR per compie.
126 Pacchetti di Lingua
IronOCR supporta 126 lingue internaziunali per via di pacchetti linguistichi chì sò distribuiti cum'è DLL, chì ponu esse scaricati da stu situ web , o ancu da u NuGet Package Manager.
E lingue includenu Tedescu, Francese, Inglese, Cinese, Giapponese è assai altri. Pacchetti linguistici specializati esistenu per passaporti MRZ, cuntrolli MICR, Dati Finanziarii, Ticchette è assai altri. Pudete ancu aduprà qualsiasi fugliale tesseract ".traineddata" - ancu quelli chì create da voi stessu.
Esempiu di lingua
Usendu altre lingue OCR.
// PM> Install IronOcr.Languages.Arabic
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
// Create OCR input for an image containing Arabic text
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Add image filters if necessary
// Even though the input quality is very low, IronTesseract can read what conventional Tesseract can't
var Result = Ocr.Read(input);
// Since the console cannot display Arabic easily, save to disk instead
Result.SaveAsTextFile("arabic.txt");
}
// PM> Install IronOcr.Languages.Arabic
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
// Create OCR input for an image containing Arabic text
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Add image filters if necessary
// Even though the input quality is very low, IronTesseract can read what conventional Tesseract can't
var Result = Ocr.Read(input);
// Since the console cannot display Arabic easily, save to disk instead
Result.SaveAsTextFile("arabic.txt");
}
' PM> Install IronOcr.Languages.Arabic
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
' Create OCR input for an image containing Arabic text
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Add image filters if necessary
' Even though the input quality is very low, IronTesseract can read what conventional Tesseract can't
Dim Result = Ocr.Read(input)
' Since the console cannot display Arabic easily, save to disk instead
Result.SaveAsTextFile("arabic.txt")
End Using
Esempiu di Lingua Multipla
Hè ancu pussibule à OCR aduprendu parechje lingue in listessu tempu. Questu pò veramente aiutà à uttene metadati è URL in lingua inglese in documenti Unicode.
// PM> Install IronOcr.Languages.ChineseSimplified
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican);
// You can add multiple languages
// Create OCR input for a multi-language PDF
using (var input = new OcrInput())
{
input.Add("multi-language.pdf");
// Perform OCR and save result as text file
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// PM> Install IronOcr.Languages.ChineseSimplified
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican);
// You can add multiple languages
// Create OCR input for a multi-language PDF
using (var input = new OcrInput())
{
input.Add("multi-language.pdf");
// Perform OCR and save result as text file
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' PM> Install IronOcr.Languages.ChineseSimplified
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican)
' You can add multiple languages
' Create OCR input for a multi-language PDF
Using input = New OcrInput()
input.Add("multi-language.pdf")
' Perform OCR and save result as text file
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
Oggetti Risultati OCR Risultati
IronOCR restituisce un ughjettu di risultatu OCR per ogni operazione OCR. Generalmente, i sviluppatori utilizanu solu a pruprietà di u testu di questu oggettu per uttene u testu scansitu da l'imaghjina. Tuttavia, i risultati OCR DOM hè assai più avanzatu di questu.
using IronOcr;
using System.Drawing; //Aghjunghje Riferimentu di l'Assemblea
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! Impurtante
// Create OCR input for a TIFF file
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
// Access different results like pages, words, and barcodes
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// Explore for a detailed API:
// - Pages, Blocks, Paragraphs, Lines, Words, Chars
// - Image export, Character coordinates, Statistical data
}
using IronOcr;
using System.Drawing; //Aghjunghje Riferimentu di l'Assemblea
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! Impurtante
// Create OCR input for a TIFF file
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
// Access different results like pages, words, and barcodes
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// Explore for a detailed API:
// - Pages, Blocks, Paragraphs, Lines, Words, Chars
// - Image export, Character coordinates, Statistical data
}
Imports IronOcr
Imports System.Drawing 'Aghjunghje Riferimentu di l'Assemblea
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '! Impurtante
' Create OCR input for a TIFF file
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
' Access different results like pages, words, and barcodes
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' Explore for a detailed API:
' - Pages, Blocks, Paragraphs, Lines, Words, Chars
' - Image export, Character coordinates, Statistical data
End Using
Rendimentu
IronOCR funziona fora di a scatula senza bisognu di mette in opera e prestazioni o di mudificà pesantmente e immagini di input.
A velocità hè ardente: IronOcr.2020+ hè finu à 10 volte più veloce è face più di 250% menu errori di e costruzioni precedenti.
Sapè ne di più
Per amparà di più nantu à OCR in C#, VB, F#, o qualsiasi altra lingua .NET, per piacè leghjite i nostri tutoriali di a cumunità , chì danu esempi di u mondu reale di cume IronOCR pò esse adupratu è pò mostrà e sfumature di cume uttene u megliu da sta biblioteca.
Una riferenza d'ughjettu cumpleta per i sviluppatori .NET hè ancu dispunibile.