OCR Korsu in C#è .NET

Andere Versionen dieses Dokuments:

IronOCR for .NET ist eine C#-Software, die es den Entwicklern von .NET ermöglicht, einen Test zu erstellen PDF in 126 lingue, cumpresu u corsu.

Eine moderne Tesseract-Forchette, eine maßgeschneiderte Lösung für .NET-Entwickler, ermöglicht es, auch andere Systeme zu regulieren mutori Tesseract sia per a velocità sia per a precisione.

Cuntenutu di IronOcr.Languages.Corsican

Stu pacchettu cuntene 49 lingue OCR per .NET:

  • Corsu
  • CorsuMiglior
  • KorsikaFast

Scaricà

Pack de langue corse [corsu]
* Herunterladen als Reißverschluss
* Installieren mit als
https://www.nuget.org/packages/IronOcr.Languages.Corsican/'> NuGet

Stallazione

A prima cosa avemu à fà hè fatta in u nostru pacchettu Korsika ICT à u vostru prughjettu .com.

PM> Install-Package IronOCR.Languages.Korsika

Esempiu di Codice

Sie können einen C#-Code in ein Bild- oder PDF-Dokument einfügen.

//PM> Install-Package IronOcr.Languages.Corsican
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput(@"images\Corsican.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Corsican
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput(@"images\Corsican.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Corsican
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput("images\Corsican.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

Perchè Sceglite IronOCR?

IronOCR ist eine Softwarebibliothek für .NET, die einfach zu installieren ist und deren Inhalt gut dokumentiert ist.

Sceglite IronOCR per uttene 99,8% + Genauigkeit OCR ohne irgendeinen Webservice aus dem Ausland zu nutzen, tasse in corsu o inviu di documenti cunfidenziali nantu à Internet.

Perchè i sviluppatori C#scelenu IronOCR sopra Vanilla Tesseract:

  • Installieren Sie nur eine DLL oder NuGet
  • Include per i Motori Tesseract 5, 4 è 3 fora di scatula.
  • Eine Präzision 99,8% supera significativamente à u Tesseract regulare.
  • Rasende Geschwindigkeit è MultiThreading
  • Kompatibel mit MVC, WebApp, Desktop, Konsole & Server
  • Nisun codice Exes o C ++ per travaglià
  • Unterstützung von PDF OCR cumpletu
  • Für OCR un guasgi qualsiasi fugliale Image o PDF
  • Volle Unterstützung von .NET Core, Standard è FrameWork
  • Verteilbar unter Windows, Mac, Linux, Azure, Docker, Lambda, AWS
  • Leghje i codici a barre è i codici QR
  • Esporta OCR in quantu à XHTML
  • Esporta OCR in PDF-Dokumenten ricercabili
  • Unterstützung von Multithreading
  • 126 interne Sprachen, die über die NuGet- oder OcrData-Funktionen erstellt werden
  • Estrae Immagini, Coordinate, Statistiche è Caratteri. Micca solu testu.
  • Die Möglichkeit, Tesseract OCR in kommerziellen Anwendungen zu verwenden, ist urheberrechtlich geschützt.

OCR di Ferru brilla quandu si travaglia cù immagini di u mondu reale è documenti imperfetti cume e fotografie, o scans di bassa risoluzione chì pò avè rumore digitale o imperfezzioni.

Andere Biblioteken OCR kostenlos für eine .NET-Patentform und andere API .net tesseract è servizii web ùn si comportanu micca bè in questi casi d'usu di u mondu reale.

OCR cù Tesseract 5 - Avvia a Codificazione in C #

U campione di codice sottu mostra quantu hè faciule di leghje u testu da una maghjina cù C#o VB .NET.

OneLiner

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

Konfigurierbares Hallo Welt

// PM> Install-Package IronOCR.Languages.Corsican
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... pudete aghjunghje un numeru numeru di immagini
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Corsican
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... pudete aghjunghje un numeru numeru di immagini
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Corsican
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

C#PDF OCR

Die Liste kann auch für die Erstellung von PDF-Dokumenten verwendet werden.

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Pudemu ancu selezziunà numeri di pagine PDF specifici à OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 pagina per ogni pagina di u PDF
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Pudemu ancu selezziunà numeri di pagine PDF specifici à OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 pagina per ogni pagina di u PDF
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' Pudemu ancu selezziunà numeri di pagine PDF specifici à OCR

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' 1 pagina per ogni pagina di u PDF
End Using
VB   C#

OCR per TIFF MultiPage

OCR Reading Format di fugliale TIFF cumprese documenti di pagine multiple. U TIFF pò ancu esse cunvertitu direttamente in un schedariu PDF cù testu ricercabile.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Codici a barre e QR

Eine Besonderheit von IronOCR ist die Tatsache, dass die QR-Codes für Dokumente und die Skalierung per testu. Istanze di a Classe OcrResult.OcrBarcode danu à u sviluppatore informazioni dettagliate nantu à jeder Kodex à OcrResult.OcrBarcode .

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// pruprietà di tippu è di situazione ancu esposte
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// pruprietà di tippu è di situazione ancu esposte
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' pruprietà di tippu è di situazione ancu esposte
Next Barcode
End Using
VB   C#

OCR nantu à Aree Specifiche di Immagini

Alle Scanning-Methoden werden von IronOCR mit einer spezifischen Kapazität für den jeweiligen Teil eines Projekts durchgeführt pagina o pagine vulemu leghje testu. Diese Frage ist sehr nützlich, wenn man auf standardisierte Formen achtet, die eine Gefahr darstellen assai tempu è migliurà l'efficienza.

Per aduprà e regioni di System.Zeichnung aghjunghje un riferimentu di sistema à System.Zeichnung modu da pudè aduprà l'ughjettu System.Zeichnung.Rectangle

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// E dimensioni sò in px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// E dimensioni sò in px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' E dimensioni sò in px

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR für Scans von geringer Qualität

A classa IronOCR OcrInput pò risolve scans chì Tesseract normale ùn pò micca leghje.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // risolve u rumore digitale è a scansione scarsa
Input.Deskew(); // ripara a rotazione è a perspettiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // risolve u rumore digitale è a scansione scarsa
Input.Deskew(); // ripara a rotazione è a perspettiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' risolve u rumore digitale è a scansione scarsa
Input.Deskew() ' ripara a rotazione è a perspettiva
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Esporta risultati OCR cum'è PDF ricercabile

Immagine in PDF cù stringhe di testu cupiate. Pò esse indiziatu da i motori di ricerca è e basi di dati.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

TIFF à Cunversione PDF ricercabile

Cunvertite un documentu TIFF (o qualsiasi gruppu di fugliali d'imagine) direttamente in un PDF ricercabile chì pò esse indiziatu da intranet, situ web è motori di ricerca google.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

Esporta risultati OCR cum'è HTML

Konvertierung von Bild OCR in XHTML.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

Filtri di Migliurazione di l'immagine OCR

IronOCR liefert unikale Filter für OcrInput oggetti OcrInput per migliurà e prestazioni OCR.

Esempiu di Codice di Migliurazione di l'Imagine

Rende l'imagine di input OCR di qualità superiore per pruduce risultati OCR megliu è più veloci.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // risolve u rumore digitale è a scansione scarsa
Input.Deskew(); // ripara a rotazione è a perspettiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // risolve u rumore digitale è a scansione scarsa
Input.Deskew(); // ripara a rotazione è a perspettiva
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' risolve u rumore digitale è a scansione scarsa
Input.Deskew() ' ripara a rotazione è a perspettiva
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Elencu di Filtri Image OCR

I filtri di input per migliorà e prestazioni OCR chì sò integrate in IronOCR includenu:

  • OcrInput.Rotate (doppelstufe) - Gira l'imaghjini da un numeru di gradi in sensu urariu. Per u sensu antiurariu, aduprate numeri negativi.
  • OcrInput.Binarize () - Stu filtru di l'immagine trasforma ogni pixel in neru o biancu senza nisun mezu. Puderà Migliurà i casi di prestazione OCR di cuntrastu assai bassu di u testu à u fondu.
  • OcrInput.ToGrayScale () - Stu filtru d'imaghjini trasforma ogni pixel in un ombra di scala di grisgiu. Improbabile di migliurà a precisione OCR ma pò migliurà a velocità
  • OcrInput.Contrast () - Aumenta u cuntrastu automaticamente. Stu filtru migliora spessu a velocità è a precisione OCR in scans à bassu cuntrastu.
  • OcrInput.DeNoise () - Elimina u rumore digitale. Stu filtru deve esse adupratu solu induve si prevede rumore.
  • OcrInput.Invertieren () - Inverte ogni culore. Es. Biancu diventa neru: u neru diventa biancu.
  • OcrInput.Dilate () - Morfologia Avanzata. Eine Dilatazione aghjusta pixel à i cunfini di l'uggetti in una maghjina. Oppostu di Erode
  • OcrInput.Erode () - Morfologia Avanzata. L'erosione elimina i pixel nantu à i limiti di l'ughjettu Opposite di Dilate
  • OcrInput.Deskew () - Gira una maghjina per chì sia a strada ghjusta è ortogonale. Questu hè assai utile per OCR perchè a tolleranza Tesseract per scans distorsioni pò esse bassu 5 gradi.
  • OcrInput.DeepCleanBackgroundNoise () - Rimozione di rumore di fondu pesante. Aduprate solu stu filtru in casu chì u rumore di fondu di u documentu estremu sia cunnisciutu, perchè stu filtru risicherà ancu di riduce a precisione OCR di documenti puliti, è hè assai caru in CPU.
  • OcrInput.EnhanceResolution - Migliora a risoluzione di l'imagine di bassa qualità. Stu filtru ùn hè micca spessu necessariu perchè OcrInput.MinimumDPI è OcrInput.TargetDPI catturerà è risolverà automatische Eingabe einer geringen Menge an Daten.

CleanBackgroundNoise. Sie haben eine Umgebung, die eine geringe Temperatur aufweist; in jedem Modus, erlaubt es eine Bibliothek, die automatisch ausläuft, ein digitales Gerät, eine Karte, die nicht verschlüsselt ist, oder andere Unzulänglichkeiten in einem Buch digitale chì altrimente a renderebbe incapace di esse letta da altre biblioteche OCR.

EnhanceContrast hè un paràmetru chì face chì IronOCR aumenterà automaticamente u cuntrastu di u testu nantu à u fondu di una maghjina, aumentendu a precisione di OCR è generalmente aumentendu e prestazioni è a velocità di OCR.

EnhanceResolution hè un paràmetru chì hà da rilevà automaticamente e immagini à bassa risoluzione (chì sò menu di 275 dpi) das Bild wird automatisch gezeichnet und dann mit allen Daten und Tests in der richtigen Reihenfolge versehen leghje perfettamente una libreria OCR. Benchì questa operazione sia di per sé lunga, riduce generalmente u tempu generale per un'operazione OCR nantu à una maghjina.

Sprache IronOCR unterstützt 22 internationale Sprachen und ist eine linguistische Herausforderung pò esse aduprata per selezziunà una o più lingue multiple da applicà per un'operazione OCR.

Strategie IronOCR ist die richtige Strategie für Sie. Puderemu sceglie di andà per una scansione rapida è menu eine präzise Dokumentation oder eine fortschrittliche Strategie, die einige Methoden der künstlichen Intelligenz nutzt per migliurà automaticamente a precisione di u testu OCR fighjendu a relazione statistica di e parolle in una frase. .

Farbraum hè un paràmetru induve pudemu sceglie OCR in scala di grisgiu o culore. Generell gilt, dass ein scala di grisgiu hè a megliu opzione. Aber wenn Sie auch nur ein einziges Mal Tests oder Tonabstufungen haben, die ähnlich sind, aber die culore assai diversu, un spaziu di culore à pienu culore darà risultati megliu.

DetectWhiteTextOnDarkBackgrounds. Im Allgemeinen können alle OCR-Bibliotheken den Test übermitteln neru nantu à sfondi bianchi. Diese Maßnahme ermöglicht es IronOCR, automatisch negative Seiten zu übergehen scure cun testu biancu, è leghje li.

EingabeBildTyp. Diese Maßnahme ermöglicht es dem Entwickler, eine OCR-Bibliotek anzuleiten, die auf die stà guardendu un documentu cumpletu o un frammentu, cum'è una screenshot.

RotateAndStraighten hè un paràmetru avanzatu chì permette à IronOCR a capacità unica di leghje dokumente, die sich drehen lassen, aber auch Fotos von Dokumenten, die sich nicht drehen lassen.

ReadBarcodes hè una caratteristica utile chì permette à IronOCR di leghje automaticallyamente i codici a barre è i codici QR in pagine cume leghje ancu testu, senza aghjunghje un grande pesu di tempu addizionale.

CuloreProfundità. Diese Funktion bestimmt die Anzahl der Bits pro Pixel, die eine OCR-Biblioteca für determinà a profondità di un culore. Ein höherer Nährwert erhöht die OCR-Qualität, aber er erhöht auch die tempu necessariu per l'operazione OCR per compie.

126 Pacchetti di Lingua

IronOCR Unterstützung 126 internationale Sprachen für via di pack linguistichi chì sò distribuiti cum'è DLL, chì ponu esse scaricati da stu situ web , o ancu da u NuGet-Paketmanager .

E lingue includenu Tedescu, Francese, Inglese, Cinese, Giapponese è assai altri. Pacchetti linguistici specializati esistenu per passaporti MRZ, cuntrolli MICR, Dati Finanziarii, Ticchette è assai altri. Pudete ancu aduprà qualsiasi fugliale tesseract ".traineddata" - ancu quelli chì create da voi stessu.

Esempiu di lingua

Andere Sprachen verwenden OCR.

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Aghjunghjite filtri d'immagine se necessariu
// In questu casu, ancu l'input pensatu hè di qualità assai bassa
// IronTesseract pò leghje ciò chì Tesseract convenzionale ùn pò micca.

var Result = Ocr.Read(input);

// A Consola ùn pò micca stampà l'arabu in Windows facilmente.
// Salvemu nant'à u discu invece.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Aghjunghjite filtri d'immagine se necessariu
// In questu casu, ancu l'input pensatu hè di qualità assai bassa
// IronTesseract pò leghje ciò chì Tesseract convenzionale ùn pò micca.

var Result = Ocr.Read(input);

// A Consola ùn pò micca stampà l'arabu in Windows facilmente.
// Salvemu nant'à u discu invece.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Aghjunghjite filtri d'immagine se necessariu
' In questu casu, ancu l'input pensatu hè di qualità assai bassa
' IronTesseract pò leghje ciò chì Tesseract convenzionale ùn pò micca.

Dim Result = Ocr.Read(input)

' A Consola ùn pò micca stampà l'arabu in Windows facilmente.
' Salvemu nant'à u discu invece.
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

Esempiu di Lingua Multipla

Sie können auch OCR-Funktionen nutzen, um bestimmte Sprachen in einer bestimmten Zeit zu erfassen. Diese Frage ist bei der Verwendung von Metadaten sehr hilfreich URL in lingua inglese in documenti Unicode.

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican);

// Pudemu aghjunghje un numeru numeru di lingue

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican);

// Pudemu aghjunghje un numeru numeru di lingue

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Corsican)

' Pudemu aghjunghje un numeru numeru di lingue

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

Oggetti Risultati OCR Risultati

IronOCR stellt ein OCR-Resultat für jede OCR-Operation zur Verfügung. Im Allgemeinen nutzen die Entwickler eine Lösung für die Beantwortung von Fragen, die sich aus der Suche nach einer bestimmten Person ergeben. Die Ergebnisse sind jedoch OCR DOM hè assai più avanzatu di questu.

using IronOcr;
using System.Drawing; //Aghjunghje Riferimentu di l'Assemblea

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! Impurtante

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Esplora quì per truvà una API massiccia, dettagliata:
// - Pagine, Blocchi, Paraphaphs, Linee, Parolle, Chars
// - Esportazione di l'immagine, Coordinate di caratteri, Dati statistichi
}
using IronOcr;
using System.Drawing; //Aghjunghje Riferimentu di l'Assemblea

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Corsican;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //! Impurtante

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Esplora quì per truvà una API massiccia, dettagliata:
// - Pagine, Blocchi, Paraphaphs, Linee, Parolle, Chars
// - Esportazione di l'immagine, Coordinate di caratteri, Dati statistichi
}
Imports IronOcr
Imports System.Drawing 'Aghjunghje Riferimentu di l'Assemblea

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Corsican
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '! Impurtante

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' Esplora quì per truvà una API massiccia, dettagliata:
' - Pagine, Blocchi, Paraphaphs, Linee, Parolle, Chars
' - Esportazione di l'immagine, Coordinate di caratteri, Dati statistichi
End Using
VB   C#

Rendimentu

IronOCR funktioniert ohne die Notwendigkeit der Inbetriebnahme oder der Aufbereitung von Daten und ohne die Möglichkeit, die Daten zu vervielfältigen immagini di input.

Mit hoher Geschwindigkeit: IronOCR.2020 + ist um 10 Volten schneller als die Konkurrenz, und das bei einer Fehlerquote von 250% bei der Konstruktion precedenti.

Sapè ne di più

Um OCR in C#, VB, F# oder einer anderen .NET-Sprache zu verbessern, kann man leghjite i nostri tutoriali di a cumunità , chì danu esempi di u mondu reale di cume IronOCR pò esse adupratu è pò mostrà e sfumature di cume uttene u megliu da sta biblioteca.

Una riferenza d'ughjettu cumpleta für Entwickler von .NET hè ancu dispunibile.