Afrikaanse OCR in C#en .NET

Ander weergawes van hierdie dokument:

IronOCR ist eine C#-Softwarekomponente, die es .NET-Kunden ermöglicht, PDF-Dokumente in 126 Tabellen zu erstellen Afrikaans, kan lees.

Es handelt sich dabei um eine neue Version von Tesseract, die für .NET-Anwender geeignet ist und einen besseren Service bietet as ander Tesseract-enjins vir snelheid en akkuraatheid.

Inhoud van IronOcr.Languages.Afrikaans

In diesem Paket sind 52 OCR-Tabellen für .NET enthalten:

  • Afrikaans
  • AfrikaansBeste
  • AfrikaansFast

Aflaai

Afrikaanse Taalpakket [Afrikaans]

Installation

Die eerste Sache, die wir tun können, ist, uns zu helfen Afrikaanse OCR-Paket für Ihre .NET-Projekte zu installieren.

PM> Install-Package IronOCR.Languages.Afrikaans

Kode Voorbeeld

Diese C#-Kode-Variante ermöglicht es, Afrikaanse teks in einem PDF-Dokument zu verwenden.

//PM> Install-Package IronOcr.Languages.Afrikaans
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput(@"images\Afrikaans.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Afrikaans
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput(@"images\Afrikaans.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Afrikaans
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using Input = New OcrInput("images\Afrikaans.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

Was kann IronOCR?

IronOCR ist eine einfach zu installierende, vollständige und gut dokumentierte .NET Sagwarebiblioteek.

Kies IronOCR om OCR-akkuraatheid van 99,8% + um eksterne Webdienste nutzen zu können, deurlopende fooie of vertroulike dokumente oor die internet te stuur.

Wo C#-ontwikkelaars kies IronOCR bo Vanilla Tesseract:

  • Installieren Sie es als eine einfache DLL von NuGet
  • Ingesluit vir Tesseract 5, 4 en 3 Engines out of the box.
  • Akkuraatheid 99,8% besser als gewone Tesseract.
  • Blauer Spoed und Multithreading
  • MVC, WebApp, Desktop, Konsole & Server Anwendung versoenbaar
  • Geen Exes of C ++ - kode om mee te werk nie
  • Vollständiges PDF-OCR-Sondersteuning
  • Damit OCR 'n bykans enige beeldlêer of PDF uit te voer
  • Vollständiges .NET Core-, Standard- und FrameWork-ondersteuning
  • Ontplooi op Windows, Mac, Linux, Azure, Docker, Lambda, AWS
  • Lees strepieskodes en QR-kodes
  • Von OCR zu XHTML
  • OCR in PDF-Dokumente einbinden
  • Optimierung von Multithreading
  • 126 internasionale Wortmeldungen über NuGet- oder OcrData-Bestände
  • Onttrek beelde, koördinate, statistieke en lettertipes. Nie net teks nie.
  • Sie können Tesseract OCR für den Einsatz in Unternehmen und für die Bearbeitung von Einzelaufträgen nutzen.

Yster OCR skyn as u met werklike beelde en onvolmaakte dokumente werk, soos foto's, of skanderings met lae resolusie wat digitale geraas of onvolmaakthede kan hê.

Ander kostenlose OCR- biblioteke für die .NET-Plattform, soos ander .net tesseract-API's en webdienste, presteer nie so goed in hierdie gebruiksgevalle nie.

OCR trifft Tesseract 5 - Beginn der Kodierung in C #

Der erste kodierte Vortrag darüber, wie nützlich es ist, mit C# oder VB zu arbeiten .NET.

OneLiner

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

Konfigureerbare Hello World

// PM> Install-Package IronOCR.Languages.Afrikaans
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... u kan enige aantal beelde byvoeg
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Afrikaans
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... u kan enige aantal beelde byvoeg
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Afrikaans
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

C#PDF OCR

Dieselfde benadering can ook gebruik word om teks uit enige PDF-document te onttrek.

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Ons kan ook spesifieke PDF-bladsynommers vir OCR kies

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 bladsy vir elke bladsy in die PDF
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Ons kan ook spesifieke PDF-bladsynommers vir OCR kies

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 bladsy vir elke bladsy in die PDF
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' Ons kan ook spesifieke PDF-bladsynommers vir OCR kies

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' 1 bladsy vir elke bladsy in die PDF
End Using
VB   C#

OCR vir MultiPage TIFF' s

OCR Lees TIFF-lêerformaat, insluitend dokumente met meerdere bladsye. TIFF kann auch direkt in ein PDF-Lesegerät mit soekbare teks omgeskakel word.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Strichcodes en QR

das einzige Merkmal von IronOCR ist, dass man Barcodes und QR-Codes aus Dokumenten herauslesen kann, wenn man sie nicht mehr braucht. Gevalle van die OcrResult.OcrBarcode klas gee die ontwikkelaar gedetailleerde inligting oor elke geskandeerde strepieskode.

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// tipe en liggingseienskappe ook blootgestel
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// tipe en liggingseienskappe ook blootgestel
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' tipe en liggingseienskappe ook blootgestel
Next Barcode
End Using
VB   C#

OCR für bestimmte Gebiete von Beelde

Al die scan- en leesmetodes van IronOCR bied die vermoë om presies aan te dui uit watter deel van 'n bladsy of bladsye ons teks wil lees. Es ist sehr praktisch, wenn man sich mit einem gestandenen Mann zusammentut und viel Zeit mit ihm verbringen kann doeltreffendheid kan verbeter.

Für die Anwendung von Gewässerstrecken müssen Sie eine Stelselverwysing von System.Zeichnung sodat ons die System.Drawing.Rectangle voorwerp kan gebruik.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Die afmetings is in px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Die afmetings is in px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' Die afmetings is in px

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR für Skande von Lae gehalte

Die IronOCR OcrInput klas kan skanderings regstel wat normal Tesseract nie kan lees nie.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // herstel digitale geraas en swak skandering
Input.Deskew(); // draai rotasie en perspektief reg
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // herstel digitale geraas en swak skandering
Input.Deskew(); // draai rotasie en perspektief reg
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' herstel digitale geraas en swak skandering
Input.Deskew() ' draai rotasie en perspektief reg
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Voer OCR-Ergebnisse als deursoekbare PDF

Beeld na PDF met kopieerbare teksstringe. Kan geïndekseer word deur soekenjins en databasisse.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

TIFF na deursoekbare PDF-omskakeling

COnverteer 'n TIFF-Dokument (einer großen Gruppe von Beeldlêers) direk na 'n soekbare PDF wat deur middel van intranet-, webwerf- en google-soekenjins geïndekseer kan word.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

Voer OCR-Ergebnisse als HTML

OCR-beeld na XHTML-omskakeling.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

OCR-beeldverbeteringsfilters

IronOCR bied unieke filters vir OcrInput voorwerpe om die OCR-Prämie te verbeter.

Einsatz der Beeldverbeteringskode

OCR-Invoerbeelde von hoër halten, um bessere, aussagekräftigere OCR-Ergebnisse zu erhalten.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // herstel digitale geraas en swak skandering
Input.Deskew(); // draai rotasie en perspektief reg
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // herstel digitale geraas en swak skandering
Input.Deskew(); // draai rotasie en perspektief reg
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' herstel digitale geraas en swak skandering
Input.Deskew() ' draai rotasie en perspektief reg
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Lys met OCR-Beeldfilters

Invoerfilters om die OCR-prestasie te verbeter, wat in IronOCR ingebou is, sluit in:

  • OcrInput.Rotate (güteklasse Dubbele) - Draai beelde met 'n aantal grade kloksgewys. Gebruik negatiewe getalle vir antikloksgewys.
  • OcrInput.Binarize () - Hierdie beeldfilter maak elke pixel swart of wit sonder middelgrond. Kan OCR-prestasiegevalle verbeter met 'n baie lae kontras tussen teks en agtergrond.
  • OcrInput.ToGrayScale () - Hierdie beeldfilter verander elke pixel in 'n skakering van grysskaal. Das ist nie die Akkuratheid der OCR-Verbesserer, sondern die Spoed verbeter
  • OcrInput.Contrast () - Verhoog die kontras outomaties. Dieser Filter verbeter OCR-Spoed und akkuraatheid in skanderings met lae kontras.
  • OcrInput.DeNoise () - Verwyder digitale geraas. Dieser Filter darf nur verwendet werden, wenn geraas verwag word.
  • OcrInput.Invertieren () - skakel elke kleur om. Bv. Wit Wort swart: swart Wort wit.
  • OcrInput.Dilate () - Gevorderde morfologie. Dilatasie voeg pixel by aan die grense van voorwerpe in 'n beeld. Oorkant Erode
  • OcrInput.Erode () - Gevorderde morfologie. Erosie verwyder pixel op voorwerpgrense oorkant Dilate
  • OcrInput.Deskew () - Draai 'n beeld sodat dit op die regte manier en ortogonaal is. Dit is baie handig vir OCR, omdat die toleransie van Tesseract vir skewe skanderings tot 5 grade kan wees.
  • OcrInput.DeepCleanBackgroundNoise () - Swaar agtergrondgeraasverwydering. Gebruik hierdie filter slegs indien ekstreme agtergrondgeluide van dokumente bekend is, omdat hierdie filter ook die OCR-akkuraatheid van skoon dokumente kan verminder, en dit is baie duur vir die CPU.
  • OcrInput.EnhanceResolution - Verbeter die resolusie van beelde van lae gehalte. Hierdie Filter ist nie dikwels nodig nie omdat OcrInput.MinimumDPI en OcrInput.TargetDPI outomaties insette met lae resolusie sal opvang en oplos.

Skoon agtergrond lawaai. Das ist eine schöne, wachsende Umgebung; das ist der Grund, warum die Bibliothek so viel Geld ausgibt um digitale Geräte, Papierkreukel und andere automatische Geräte in einem digitalen Feld zu erstellen, wat dit andersins onbevoeg kan maak om deur ander OCR-biblioteke gelees te word.

EnhanceContrast ist eine Einstellung, die IronOCR die Kontras der Teks verschafft outomaties verhoog teen die agtergrond van 'n beeld, wat die akkuraatheid van OCR verhoog en die prestasie en die snelheid van OCR gewoonlik verhoog.

EnhanceResolution ist eine Einstellung, die mit einer gewissen Entschlossenheit zu Werke geht (wat minder as 275 dpi het) ich habe mich geirrt, und die Daten sind so gut, dass ich sie für perfekt befunden habe kan word deur 'n OCR-biblioteek. Auch wenn diese Arbeit für Sie sehr zeitaufwendig ist, so ist sie doch für die algehele tyd vir 'n OCR-bewerking op 'n beeld.

Sprache IronOCR ondersteun 22 internasionale taalpakkette, en die taalinstelling kan gebruik word om een of meer tale te kies wat vir 'n OCR-operasie toegepas moet word.

Strategie IronOCR hat zwei Strategien ausgearbeitet. Ons kan kies om 'n vinnige en minder akkurate die Weitergabe eines Dokuments oder die Anwendung einer geeigneten Strategie, um bestimmte Kunden zu erreichen anwendung des Intelligenzmodells, um die Akkuratheit von OCR-Tekterkennungen durch die Statistik zu verbessern die Verhinderung der Verweildauer in der Sünde. .

Farbraum is 'n instelling waardeur ons OCR in grysskaal of kleur kan kies. Für die Algemeen ist grysskaal die beste Möglichkeit. Soms, as daar tekste of agtergronde van 'n soortgelyke tint is, maar baie different, sal 'n kleurkleurruimte beter resultate lewer.

DetectWhiteTextOnDarkBackgrounds. Alle OCR-Biblioteken werden für die Algemeen verwaltet, wenn sie mit agtergronde te sien. Mit dieser Einstellung kann IronOCR negative oder schlechte Ergebnisse bei der Arbeit erzielen en dit lees.

EingabeBildTyp. Met hierdie instelling kan die ontwikkelaar die OCR-biblioteek lei of hy na 'n volledige dokument of 'n fragment kyk, soos 'n kiekie.

RotateAndStraighten ist eine geordnete Einrichtung, in der IronOCR die einzige Vermoë ist, um dokumente zu lesen, die noch nie netto gedruckt wurden, aber eine gute Perspektive bieten, wie z.B. Fotos von Teksdokumenten.

ReadBarcodes ist eine handliche Funktion, bei der IronOCR Strepieskodes und QR-Codes automatisiert werden können bladsye kan lees, aangesien dit ook teks lees, sonder om 'n groot ekstra tydlas von te voeg.

Kleurdiepte. Diese Einstellung ermöglicht es, die OCR-Bibliotek bis zu einem Pixel zu nutzen, um diepte van 'n kleur te bepaal. groter Kleurdiepte kann die OCR-Kwaliteit verhoog, aber es kann auch die tyd wat die OCR-bewerking benodig om te voltooi, vergroot.

126 Taalpakkette

IronOCR ondersteun 126 internasionale Erzählungen via taalpakkette wat as DLL's versprei word, wat van hierdie webwerf von van die NuGet-Paketmanager afgelaai kan Wort.

Tale sluit Duits, Frans, Engels, Chinees, Japannees en vele meer in. Spesialistaalpakkette bestaan vir paspoort MRZ, MICR-Texte, Finanzdaten, Nommerplate und vieles mehr. Sie können auch ein anderes Messinstrument verwenden, nämlich ".traineddata" -lêer gebruik - ook die lêers wat u self skep.

Taalvoorbeeld

Die Verwendung von anderen OCR-Tabellen.

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Voeg prentfilters by indien nodig
// In hierdie geval is selfs insette van baie lae gehalte
// IronTesseract kan lees wat konvensionele Tesseract nie kan nie.

var Result = Ocr.Read(input);

// Die konsole kan nie maklik Arabies op Windows druk nie.
// Laat ons eerder op die skyf stoor.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Voeg prentfilters by indien nodig
// In hierdie geval is selfs insette van baie lae gehalte
// IronTesseract kan lees wat konvensionele Tesseract nie kan nie.

var Result = Ocr.Read(input);

// Die konsole kan nie maklik Arabies op Windows druk nie.
// Laat ons eerder op die skyf stoor.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Voeg prentfilters by indien nodig
' In hierdie geval is selfs insette van baie lae gehalte
' IronTesseract kan lees wat konvensionele Tesseract nie kan nie.

Dim Result = Ocr.Read(input)

' Die konsole kan nie maklik Arabies op Windows druk nie.
' Laat ons eerder op die skyf stoor.
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

Die Antwort auf weitere Geschichten

Es ist auch möglich, OCR mit Hilfe von verschiedenen Märchen zu verwenden. Dies kann sehr hilfreich sein, wenn Engelse metadata en urls in Unicode-dokumente te kry.

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Afrikaans);

// Ons kan enige aantal tale byvoeg

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Afrikaans);

// Ons kan enige aantal tale byvoeg

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Afrikaans)

' Ons kan enige aantal tale byvoeg

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

Gedetailleerde OCR-uitslagvoorwerpe

IronOCR ist ein OCR-Resultatobjek für alle OCR-Bewerker. Für die algemeen gebruik ontwikkelaars slegs die tekseiendom van hierdie voorwerp om die teks vanaf die prent te laat skandeer. Die OCR-Resultate DOM sind z.B baie meer gevorderd as dit.

using IronOcr;
using System.Drawing; //Voeg vergaderingverwysing by

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //!Belangrik

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Verken hier om 'n uitgebreide, gedetailleerde API te vind:
// - Bladsye, blokke, parafafs, lyne, woorde, karakters
// - Beelduitvoer, lettertypekoördinate, statistiese data
}
using IronOcr;
using System.Drawing; //Voeg vergaderingverwysing by

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //!Belangrik

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Verken hier om 'n uitgebreide, gedetailleerde API te vind:
// - Bladsye, blokke, parafafs, lyne, woorde, karakters
// - Beelduitvoer, lettertypekoördinate, statistiese data
}
Imports IronOcr
Imports System.Drawing 'Voeg vergaderingverwysing by

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '!Belangrik

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' Verken hier om 'n uitgebreide, gedetailleerde API te vind:
' - Bladsye, blokke, parafafs, lyne, woorde, karakters
' - Beelduitvoer, lettertypekoördinate, statistiese data
End Using
VB   C#

Optrede

IronOCR arbeitet mit den Büchern, sei es, um die Rechnung zu bezahlen oder um die Rechnung zu verifizieren.

Speed is Blazing: IronOCR.2020 + ist bis zu 10 Tage schneller und kann bis zu 250% weniger verbrauchen als frühere Builds.

Mehr Informationen

Um mehr über OCR in C#, VB, F# oder anderen .NET-Tools zu erfahren, lees gerus ons gemeenskapshandleidings , wat werklike wêreldvoorbeelde gee van hoe IronOCR gebruik kan word en wat die nuanses kan toon van hoe u die beste kan haal uit hierdie biblioteek.

'N Volledige objekverwysing vir .NET-ontwikkelaars ist ook beskikbaar.