OCR corsu in C# è .NET

Altre versioni di stu documentu:

IronOCR hè un cumpunente di software C# chì permette à i codificatori .NET di leghje testu da imaghjini è ducumenti PDF in 126 lingue, cumpresu u corsu. Hè una forchetta avanzata di Tesseract, custruita solu per i sviluppatori .NET è supera di modu regulare l'altri mutori Tesseract sia per a velocità sia per a precisione.

Cuntenutu di IronOcr.Languages.Corsican

Stu pacchettu cuntene 49 lingue OCR per .NET:

  • Corsu
  • CorsuMiglior
  • CorsicanFast

Scaricà

Pack de langue corse [corsu]

Stallazione

A prima cosa avemu à fà hè fatta in u nostru pacchettu Corsican ICT à u vostru prughjettu .com.

Install-Package IronOCR.Languages.Corsican

Esempiu di Codice

Questu esempiu di codice C# leghje u testu corsu da un documentu Image o PDF.

// PM> Install-Package IronOcr.Languages.Corsican
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from an image file
using (var Input = new OcrInput(@"images\Corsican.png"))
{
    // Perform OCR to read text from the input
    var Result = Ocr.Read(Input);
    // Store all extracted text
    var AllText = Result.Text;
}
// PM> Install-Package IronOcr.Languages.Corsican
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from an image file
using (var Input = new OcrInput(@"images\Corsican.png"))
{
    // Perform OCR to read text from the input
    var Result = Ocr.Read(Input);
    // Store all extracted text
    var AllText = Result.Text;
}
' PM> Install-Package IronOcr.Languages.Corsican
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

' Create OCR input from an image file
Using Input = New OcrInput("images\Corsican.png")
	' Perform OCR to read text from the input
	Dim Result = Ocr.Read(Input)
	' Store all extracted text
	Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel

Perchè Sceglite IronOCR?

IronOCR hè una libreria di software .NET faciule da installà, cumpleta è ben documentata. Sceglite IronOCR per uttene 99,8% + precisione OCR senza aduprà alcun serviziu web esternu, tasse in corsu o inviu di documenti cunfidenziali nantu à Internet.

Perchè i sviluppatori C# scelenu IronOCR sopra Vanilla Tesseract:

  • Installa cum'è una sola DLL o NuGet
  • Include per i Motori Tesseract 5, 4 è 3 fora di scatula.
  • A precisione 99,8% supera significativamente à u Tesseract regulare.
  • Velocità Blazing è MultiThreading
  • Compatibile MVC, WebApp, Desktop, Console & Server
  • Nisun codice Exes o C++ per travaglià
  • Supportu PDF OCR cumpletu
  • Per fà OCR un guasgi qualsiasi fugliale Image o PDF
  • Supportu Full .NET Core, Standard è FrameWork
  • Distribuite nantu à Windows, Mac, Linux, Azure, Docker, Lambda, AWS
  • Leghje i codici a barre è i codici QR
  • Esporta OCR in quantu à XHTML
  • Esporta OCR in documenti PDF ricercabili
  • Supportu multithreading
  • 126 lingue internaziunali tutte gestite via i fugliali NuGet o OcrData
  • Estrae Immagini, Coordinate, Statistiche è Caratteri. Micca solu testu.
  • Pò esse adupratu per ridistribuisce Tesseract OCR in applicazioni commerciali è proprietarie.

OCR di Ferru brilla quandu si travaglia cù immagini di u mondu reale è documenti imperfetti cume e fotografie, o scans di bassa risoluzione chì pò avè rumore digitale o imperfezzioni.

Altre biblioteche OCR gratuite per a piattaforma .NET tali altre API .net tesseract è servizii web ùn si comportanu micca bè in questi casi d'usu di u mondu reale.

OCR cù Tesseract 5 - Avvia a Codificazione in C#

U campione di codice sottu mostra quantu hè faciule di leghje u testu da una maghjina cù C# o VB .NET.

OneLiner

using IronOcr;

// Perform a simple OCR read operation in a single line
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
using IronOcr;

// Perform a simple OCR read operation in a single line
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Imports IronOcr

' Perform a simple OCR read operation in a single line
Private Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
$vbLabelText   $csharpLabel

Configurabile Hello World

// PM> Install-Package IronOCR.Languages.Corsican
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from multiple images
using (var Input = new OcrInput())
{
    Input.AddImage("images/sample.jpeg");
    // ... You can add multiple images to the input

    // Perform OCR and display result
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Corsican
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from multiple images
using (var Input = new OcrInput())
{
    Input.AddImage("images/sample.jpeg");
    // ... You can add multiple images to the input

    // Perform OCR and display result
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Corsican
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

' Create OCR input from multiple images
Using Input = New OcrInput()
	Input.AddImage("images/sample.jpeg")
	' ... You can add multiple images to the input

	' Perform OCR and display result
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

C# PDF OCR

U listessu approcciu pò esse adupratu ancu per estrarre testu da qualsiasi documentu PDF.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from a PDF file that may be password protected
using (var input = new OcrInput())
{
    input.AddPdf("example.pdf", "password");

    // Perform OCR and get results
    var Result = Ocr.Read(input);

    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages"); // 1 pagina per ogni pagina di u PDF
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from a PDF file that may be password protected
using (var input = new OcrInput())
{
    input.AddPdf("example.pdf", "password");

    // Perform OCR and get results
    var Result = Ocr.Read(input);

    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages"); // 1 pagina per ogni pagina di u PDF
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

' Create OCR input from a PDF file that may be password protected
Using input = New OcrInput()
	input.AddPdf("example.pdf", "password")

	' Perform OCR and get results
	Dim Result = Ocr.Read(input)

	Console.WriteLine(Result.Text)
	Console.WriteLine($"{Result.Pages.Count()} Pages") ' 1 pagina per ogni pagina di u PDF
End Using
$vbLabelText   $csharpLabel

OCR per TIFF MultiPage

OCR Reading Format di fugliale TIFF cumprese documenti di pagine multiple. U TIFF pò ancu esse cunvertitu direttamente in un schedariu PDF cù testu ricercabile.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input for a multipage TIFF file
using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("multi-frame.tiff");

    // Perform OCR and display result
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input for a multipage TIFF file
using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("multi-frame.tiff");

    // Perform OCR and display result
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

' Create OCR input for a multipage TIFF file
Using Input = New OcrInput()
	Input.AddMultiFrameTiff("multi-frame.tiff")

	' Perform OCR and display result
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

Codici a barre e QR

Una caratteristica unica di IronOCR hè chì pò leghje codici a barre è codici QR da documenti mentre scansiona per u testu. Istanze di a Classe OcrResult.OcrBarcode danu à u sviluppatore informazioni dettagliate nantu à ogni codice à OcrResult.OcrBarcode.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

// Create OCR input for image containing barcode
using (var input = new OcrInput())
{
    input.AddImage("img/Barcode.png");

    // Perform OCR to extract barcodes
    var Result = Ocr.Read(input);
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // Additional properties for barcode type and location are also available
    }
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

// Create OCR input for image containing barcode
using (var input = new OcrInput())
{
    input.AddImage("img/Barcode.png");

    // Perform OCR to extract barcodes
    var Result = Ocr.Read(input);
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // Additional properties for barcode type and location are also available
    }
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

' Create OCR input for image containing barcode
Using input = New OcrInput()
	input.AddImage("img/Barcode.png")

	' Perform OCR to extract barcodes
	Dim Result = Ocr.Read(input)
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
		' Additional properties for barcode type and location are also available
	Next Barcode
End Using
$vbLabelText   $csharpLabel

OCR nantu à Aree Specifiche di Immagini

Tutti i metudi di scansione è lettura di IronOCR furniscenu a capacità di specificà esattamente da chì parte di una pagina o pagine vulemu leghje testu. Questu hè assai utile quandu guardemu à e forme standardizate è ponu risparmià assai tempu è migliurà l'efficienza.

Per aduprà e regioni di System.Drawing, aghjunghje un riferimentu di sistema à System.Drawing, modu da pudè aduprà l'ughjettu System.Drawing.Rectangle.

using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Specify the region within the image to perform OCR
using (var Input = new OcrInput())
{
    var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 }; // Dimensions in pixels
    Input.Add("document.png", ContentArea);

    // Perform OCR and display result
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Specify the region within the image to perform OCR
using (var Input = new OcrInput())
{
    var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 }; // Dimensions in pixels
    Input.Add("document.png", ContentArea);

    // Perform OCR and display result
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Imports IronOcr
Imports System.Drawing

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

' Specify the region within the image to perform OCR
Using Input = New OcrInput()
	Dim ContentArea = New Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	Input.Add("document.png", ContentArea)

	' Perform OCR and display result
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

OCR per Scans di Bassa Qualità

A classa IronOCR OcrInput pò risolve scans chì Tesseract normale ùn pò micca leghje.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from a low quality image
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    Input.DeNoise(); // Removes digital noise
    Input.Deskew(); // Corrects skew and perspective

    // Perform OCR and display result
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from a low quality image
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    Input.DeNoise(); // Removes digital noise
    Input.Deskew(); // Corrects skew and perspective

    // Perform OCR and display result
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

' Create OCR input from a low quality image
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
	Input.DeNoise() ' Removes digital noise
	Input.Deskew() ' Corrects skew and perspective

	' Perform OCR and display result
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

Esporta risultati OCR cum'è PDF ricercabile

Immagine in PDF cù stringhe di testu cupiate. Pò esse indiziatu da i motori di ricerca è e basi di dati.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from multiple images
using (var Input = new OcrInput())
{
    Input.Title = "Quarterly Report";
    Input.AddImage("image1.jpeg");
    Input.AddImage("image2.png");
    Input.AddImage("image3.gif");

    // Perform OCR and save as a searchable PDF
    var Result = Ocr.Read(Input);
    Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from multiple images
using (var Input = new OcrInput())
{
    Input.Title = "Quarterly Report";
    Input.AddImage("image1.jpeg");
    Input.AddImage("image2.png");
    Input.AddImage("image3.gif");

    // Perform OCR and save as a searchable PDF
    var Result = Ocr.Read(Input);
    Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

' Create OCR input from multiple images
Using Input = New OcrInput()
	Input.Title = "Quarterly Report"
	Input.AddImage("image1.jpeg")
	Input.AddImage("image2.png")
	Input.AddImage("image3.gif")

	' Perform OCR and save as a searchable PDF
	Dim Result = Ocr.Read(Input)
	Result.SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

TIFF à Cunversione PDF ricercabile

Cunvertite un documentu TIFF (o qualsiasi gruppu di fugliali d'imagine) direttamente in un PDF ricercabile chì pò esse indiziatu da intranet, situ web è motori di ricerca google.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input for a multipage TIFF file
using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("example.tiff");

    // Perform OCR and save as a searchable PDF
    var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input for a multipage TIFF file
using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("example.tiff");

    // Perform OCR and save as a searchable PDF
    var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

' Create OCR input for a multipage TIFF file
Using Input = New OcrInput()
	Input.AddMultiFrameTiff("example.tiff")

	' Perform OCR and save as a searchable PDF
	Dim Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

Esporta risultati OCR cum'è HTML

Conversione Image OCR in XHTML.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from an image
using (var Input = new OcrInput())
{
    Input.Title = "Html Title";
    Input.AddImage("image1.jpeg");

    // Perform OCR and save as HTML
    var Result = Ocr.Read(Input);
    Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from an image
using (var Input = new OcrInput())
{
    Input.Title = "Html Title";
    Input.AddImage("image1.jpeg");

    // Perform OCR and save as HTML
    var Result = Ocr.Read(Input);
    Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

' Create OCR input from an image
Using Input = New OcrInput()
	Input.Title = "Html Title"
	Input.AddImage("image1.jpeg")

	' Perform OCR and save as HTML
	Dim Result = Ocr.Read(Input)
	Result.SaveAsHocrFile("results.html")
End Using
$vbLabelText   $csharpLabel

Filtri di Migliurazione di l'imagine OCR

IronOCR furnisce filtri unici per OcrInput oggetti per migliurà e prestazioni OCR.

Esempiu di Codice di Migliurazione di l'Imagine

Rende l'imagine di input OCR di qualità superiore per pruduce risultati OCR megliu è più veloci.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from a low-quality image
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    Input.DeNoise(); // Removes digital noise
    Input.Deskew(); // Corrects skew and perspective

    // Perform OCR and display result
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

// Create OCR input from a low-quality image
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    Input.DeNoise(); // Removes digital noise
    Input.Deskew(); // Corrects skew and perspective

    // Perform OCR and display result
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

' Create OCR input from a low-quality image
Using Input = New OcrInput("LowQuality.jpeg")
	Input.DeNoise() ' Removes digital noise
	Input.Deskew() ' Corrects skew and perspective

	' Perform OCR and display result
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

Elencu di Filtri Image OCR

I filtri di input per migliorà e prestazioni OCR chì sò integrate in IronOCR includenu:

  • OcrInput.Rotate (doppia gradu) - Gira l'imaghjini da un numeru di gradi in sensu urariu. Per u sensu antiurariu, aduprate numeri negativi.
  • OcrInput.Binarize () - Stu filtru di l'immagine trasforma ogni pixel in neru o biancu senza nisun mezu. Puderà Migliurà i casi di prestazione OCR di cuntrastu assai bassu di u testu à u fondu.
  • OcrInput.ToGrayScale () - Stu filtru d'imaghjini trasforma ogni pixel in un ombra di scala di grisgiu. Improbabile di migliurà a precisione OCR ma pò migliurà a velocità.
  • OcrInput.Contrast () - Aumenta u cuntrastu automaticamente. Stu filtru migliora spessu a velocità è a precisione OCR in scans à bassu cuntrastu.
  • OcrInput.DeNoise () - Elimina u rumore digitale. Stu filtru deve esse adupratu solu induve si prevede rumore.
  • OcrInput.Invert () - Inverte ogni culore. Es. Biancu diventa neru: u neru diventa biancu.
  • OcrInput.Dilate () - Morfologia Avanzata. A dilatazione aghjusta pixel à i cunfini di l'uggetti in una maghjina. Oppostu di Erode.
  • OcrInput.Erode () - Morfologia Avanzata. L'erosione elimina i pixel nantu à i limiti di l'ughjettu. Opposte di Dilate.
  • OcrInput.Deskew () - Gira una maghjina per chì sia a strada ghjusta è ortogonale. Questu hè assai utile per OCR perchè a tolleranza Tesseract per scans distorsioni pò esse bassu 5 gradi.
  • OcrInput.DeepCleanBackgroundNoise () - Rimozione di rumore di fondu pesante. Aduprate solu stu filtru in casu chì u rumore di fondu di u documentu estremu sia cunnisciutu, perchè stu filtru risikerà ancu di riduce a precisione OCR di documenti puliti, è hè assai caru in CPU.
  • OcrInput.EnhanceResolution - Migliora a risoluzione di l'immagine di bassa qualità. Stu filtru ùn hè micca spessu necessariu perchè OcrInput.MinimumDPI è OcrInput.TargetDPI catturerà è risolverà automaticamente input di bassa risoluzione.

CleanBackgroundNoise. Questu hè un ambiente chì cunsuma un pocu di tempu; in ogni modu, permette à a biblioteca di pulisce automaticamente u rumore digitale, a carta sgretolata, è altre imperfezzioni in una maghjina digitale chì altrimente a renderebbe incapace di esse letta da altre biblioteche OCR.

EnhanceContrast hè un paràmetru chì face chì IronOCR aumenterà automaticamente u cuntrastu di u testu nantu à u fondu di una maghjina, aumentendu a precisione di OCR è generalmente aumentendu e prestazioni è a velocità di OCR.

EnhanceResolution hè un paràmetru chì hà da rilevà automaticamente e immagini à bassa risoluzione (chì sò menu di 275 dpi) è arricchisce automaticamente l'immagine è poi affina tuttu u testu in modu da pudè leghje perfettamente una libreria OCR. Benchì questa operazione sia di per sé lunga, riduce generalmente u tempu generale per un'operazione OCR nantu à una maghjina.

Language IronOCR supporta 22 pacchetti di lingue internaziunali, è l'impostazione linguistica pò esse aduprata per selezziunà una o più lingue multiple da applicà per un'operazione OCR.

Strategy IronOCR sustene duie strategie. Puderemu sceglie di andà per una scansione rapida è menu precisa di un documentu, o aduprà una strategia avanzata chì utilizza alcuni mudelli d'intelligenza artificiale per migliurà automaticamente a precisione di u testu OCR fighjendu a relazione statistica di e parolle in una frase.

ColorSpace hè un paràmetru induve pudemu sceglie OCR in scala di grisgiu o culore. Generalmente, a scala di grisgiu hè a megliu opzione. Tuttavia, qualchì volta quandu ci sò testi o sfondi di tonalità simile ma di culore assai diversu, un spaziu di culore à pienu culore darà risultati megliu.

DetectWhiteTextOnDarkBackgrounds. Generalmente, tutte e biblioteche OCR aspettanu di vede testu neru nantu à sfondi bianchi. Questa impostazione permette à IronOCR di rilevà automaticamente negativi, o pagine scure cun testu biancu, è leghje li.

InputImageType. Questa impostazione permette à u sviluppatore di guidà a biblioteca OCR nantu à se stà guardendu un documentu cumpletu o un frammentu, cum'è una screenshot.

RotateAndStraighten hè un paràmetru avanzatu chì permette à IronOCR a capacità unica di leghje documenti chì ùn sò micca solu rotati, ma forse cuntenenu perspettiva, cum'è e fotografie di documenti di testu.

ReadBarcodes hè una caratteristica utile chì permette à IronOCR di leghje automaticamente i codici a barre è i codici QR in pagine cume leghje ancu testu, senza aghjunghje un grande pesu di tempu addizionale.

CuloreProfundità. Questa impostazione determina quanti bit per pixel a biblioteca OCR utilizerà per determinà a profondità di un culore. Una prufundità di culore più alta pò aumentà a qualità OCR, ma aumenterà ancu u tempu necessariu per l'operazione OCR per compie.

126 Pacchetti di Lingua

IronOCR supporta 126 lingue internaziunali per via di pacchetti linguistichi chì sò distribuiti cum'è DLL, chì ponu esse scaricati da stu situ web , o ancu da u NuGet Package Manager.

E lingue includenu Tedescu, Francese, Inglese, Cinese, Giapponese è assai altri. Pacchetti linguistici specializati esistenu per passaporti MRZ, cuntrolli MICR, Dati Finanziarii, Ticchette è assai altri. Pudete ancu aduprà qualsiasi fugliale tesseract ".traineddata" - ancu quelli chì create da voi stessu.

Esempiu di lingua

Usendu altre lingue OCR.

// PM> Install IronOcr.Languages.Arabic
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

// Create OCR input for an image containing Arabic text
using (var input = new OcrInput())
{
    input.AddImage("img/arabic.gif");

    // Add image filters if necessary
    // Even though the input quality is very low, IronTesseract can read what conventional Tesseract can't

    var Result = Ocr.Read(input);

    // Since the console cannot display Arabic easily, save to disk instead
    Result.SaveAsTextFile("arabic.txt");
}
// PM> Install IronOcr.Languages.Arabic
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

// Create OCR input for an image containing Arabic text
using (var input = new OcrInput())
{
    input.AddImage("img/arabic.gif");

    // Add image filters if necessary
    // Even though the input quality is very low, IronTesseract can read what conventional Tesseract can't

    var Result = Ocr.Read(input);

    // Since the console cannot display Arabic easily, save to disk instead
    Result.SaveAsTextFile("arabic.txt");
}
' PM> Install IronOcr.Languages.Arabic
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

' Create OCR input for an image containing Arabic text
Using input = New OcrInput()
	input.AddImage("img/arabic.gif")

	' Add image filters if necessary
	' Even though the input quality is very low, IronTesseract can read what conventional Tesseract can't

	Dim Result = Ocr.Read(input)

	' Since the console cannot display Arabic easily, save to disk instead
	Result.SaveAsTextFile("arabic.txt")
End Using
$vbLabelText   $csharpLabel

Esempiu di Lingua Multipla

Hè ancu pussibule à OCR aduprendu parechje lingue in listessu tempu. Questu pò veramente aiutà à uttene metadati è URL in lingua inglese in documenti Unicode.

// PM> Install IronOcr.Languages.ChineseSimplified
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican);

// You can add multiple languages

// Create OCR input for a multi-language PDF
using (var input = new OcrInput())
{
    input.Add("multi-language.pdf");

    // Perform OCR and save result as text file
    var Result = Ocr.Read(input);
    Result.SaveAsTextFile("results.txt");
}
// PM> Install IronOcr.Languages.ChineseSimplified
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican);

// You can add multiple languages

// Create OCR input for a multi-language PDF
using (var input = new OcrInput())
{
    input.Add("multi-language.pdf");

    // Perform OCR and save result as text file
    var Result = Ocr.Read(input);
    Result.SaveAsTextFile("results.txt");
}
' PM> Install IronOcr.Languages.ChineseSimplified
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican)

' You can add multiple languages

' Create OCR input for a multi-language PDF
Using input = New OcrInput()
	input.Add("multi-language.pdf")

	' Perform OCR and save result as text file
	Dim Result = Ocr.Read(input)
	Result.SaveAsTextFile("results.txt")
End Using
$vbLabelText   $csharpLabel

Oggetti Risultati OCR Risultati

IronOCR restituisce un ughjettu di risultatu OCR per ogni operazione OCR. Generalmente, i sviluppatori utilizanu solu a pruprietà di u testu di questu oggettu per uttene u testu scansitu da l'imaghjina. Tuttavia, i risultati OCR DOM hè assai più avanzatu di questu.

using IronOcr;
using System.Drawing; //Aghjunghje Riferimentu di l'Assemblea

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! Impurtante

// Create OCR input for a TIFF file
using (var Input = new OcrInput(@"images\sample.tiff"))
{
    OcrResult Result = Ocr.Read(Input);

    // Access different results like pages, words, and barcodes
    var Pages = Result.Pages;
    var Words = Pages[0].Words;
    var Barcodes = Result.Barcodes;

    // Explore for a detailed API:
    // - Pages, Blocks, Paragraphs, Lines, Words, Chars
    // - Image export, Character coordinates, Statistical data
}
using IronOcr;
using System.Drawing; //Aghjunghje Riferimentu di l'Assemblea

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! Impurtante

// Create OCR input for a TIFF file
using (var Input = new OcrInput(@"images\sample.tiff"))
{
    OcrResult Result = Ocr.Read(Input);

    // Access different results like pages, words, and barcodes
    var Pages = Result.Pages;
    var Words = Pages[0].Words;
    var Barcodes = Result.Barcodes;

    // Explore for a detailed API:
    // - Pages, Blocks, Paragraphs, Lines, Words, Chars
    // - Image export, Character coordinates, Statistical data
}
Imports IronOcr
Imports System.Drawing 'Aghjunghje Riferimentu di l'Assemblea

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '! Impurtante

' Create OCR input for a TIFF file
Using Input = New OcrInput("images\sample.tiff")
	Dim Result As OcrResult = Ocr.Read(Input)

	' Access different results like pages, words, and barcodes
	Dim Pages = Result.Pages
	Dim Words = Pages(0).Words
	Dim Barcodes = Result.Barcodes

	' Explore for a detailed API:
	' - Pages, Blocks, Paragraphs, Lines, Words, Chars
	' - Image export, Character coordinates, Statistical data
End Using
$vbLabelText   $csharpLabel

Rendimentu

IronOCR funziona fora di a scatula senza bisognu di mette in opera e prestazioni o di mudificà pesantmente e immagini di input.

A velocità hè ardente: IronOcr.2020+ hè finu à 10 volte più veloce è face più di 250% menu errori di e costruzioni precedenti.

Sapè ne di più

Per amparà di più nantu à OCR in C#, VB, F#, o qualsiasi altra lingua .NET, per piacè leghjite i nostri tutoriali di a cumunità , chì danu esempi di u mondu reale di cume IronOCR pò esse adupratu è pò mostrà e sfumature di cume uttene u megliu da sta biblioteca.

Una riferenza d'ughjettu cumpleta per i sviluppatori .NET hè ancu dispunibile.