Afrikaanse OCR in C#en .NET
Ander weergawes van hierdie dokument:
IronOCR ist eine C#-Softwarekomponente, die es .NET-Kunden ermöglicht, PDF-Dokumente in 126 Tabellen zu erstellen Afrikaans, kan lees.
Es handelt sich dabei um eine neue Version von Tesseract, die für .NET-Anwender geeignet ist und einen besseren Service bietet as ander Tesseract-enjins vir snelheid en akkuraatheid.
Inhoud van IronOcr.Languages.Afrikaans
In diesem Paket sind 52 OCR-Tabellen für .NET enthalten:
- Afrikaans
- AfrikaansBeste
- AfrikaansFast
Aflaai
Afrikaanse Taalpakket [Afrikaans]
Installation
Die eerste Sache, die wir tun können, ist, uns zu helfen Afrikaanse OCR-Paket für Ihre .NET-Projekte zu installieren.
PM> Install-Package IronOCR.Languages.Afrikaans
Kode Voorbeeld
Diese C#-Kode-Variante ermöglicht es, Afrikaanse teks in einem PDF-Dokument zu verwenden.
//PM> Install-Package IronOcr.Languages.Afrikaans
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput(@"images\Afrikaans.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Afrikaans
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput(@"images\Afrikaans.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Afrikaans
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using Input = New OcrInput("images\Afrikaans.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
Was kann IronOCR?
IronOCR ist eine einfach zu installierende, vollständige und gut dokumentierte .NET Sagwarebiblioteek.
Kies IronOCR om OCR-akkuraatheid van 99,8% + um eksterne Webdienste nutzen zu können, deurlopende fooie of vertroulike dokumente oor die internet te stuur.
Wo C#-ontwikkelaars kies IronOCR bo Vanilla Tesseract:
- Installieren Sie es als eine einfache DLL von NuGet
- Ingesluit vir Tesseract 5, 4 en 3 Engines out of the box.
- Akkuraatheid 99,8% besser als gewone Tesseract.
- Blauer Spoed und Multithreading
- MVC, WebApp, Desktop, Konsole & Server Anwendung versoenbaar
- Geen Exes of C ++ - kode om mee te werk nie
- Vollständiges PDF-OCR-Sondersteuning
- Damit OCR 'n bykans enige beeldlêer of PDF uit te voer
- Vollständiges .NET Core-, Standard- und FrameWork-ondersteuning
- Ontplooi op Windows, Mac, Linux, Azure, Docker, Lambda, AWS
- Lees strepieskodes en QR-kodes
- Von OCR zu XHTML
- OCR in PDF-Dokumente einbinden
- Optimierung von Multithreading
- 126 internasionale Wortmeldungen über NuGet- oder OcrData-Bestände
- Onttrek beelde, koördinate, statistieke en lettertipes. Nie net teks nie.
- Sie können Tesseract OCR für den Einsatz in Unternehmen und für die Bearbeitung von Einzelaufträgen nutzen.
Yster OCR skyn as u met werklike beelde en onvolmaakte dokumente werk, soos foto's, of skanderings met lae resolusie wat digitale geraas of onvolmaakthede kan hê.
Ander kostenlose OCR- biblioteke für die .NET-Plattform, soos ander .net tesseract-API's en webdienste, presteer nie so goed in hierdie gebruiksgevalle nie.
OCR trifft Tesseract 5 - Beginn der Kodierung in C #
Der erste kodierte Vortrag darüber, wie nützlich es ist, mit C# oder VB zu arbeiten .NET.
OneLiner
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
Konfigureerbare Hello World
// PM> Install-Package IronOCR.Languages.Afrikaans
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... u kan enige aantal beelde byvoeg
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Afrikaans
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... u kan enige aantal beelde byvoeg
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Afrikaans
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
C#PDF OCR
Dieselfde benadering can ook gebruik word om teks uit enige PDF-document te onttrek.
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Ons kan ook spesifieke PDF-bladsynommers vir OCR kies
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 bladsy vir elke bladsy in die PDF
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Ons kan ook spesifieke PDF-bladsynommers vir OCR kies
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 bladsy vir elke bladsy in die PDF
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' Ons kan ook spesifieke PDF-bladsynommers vir OCR kies
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' 1 bladsy vir elke bladsy in die PDF
End Using
OCR vir MultiPage TIFF' s
OCR Lees TIFF-lêerformaat, insluitend dokumente met meerdere bladsye. TIFF kann auch direkt in ein PDF-Lesegerät mit soekbare teks omgeskakel word.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Strichcodes en QR
das einzige Merkmal von IronOCR ist, dass man Barcodes und QR-Codes aus Dokumenten herauslesen kann, wenn man sie nicht mehr braucht. Gevalle van die OcrResult.OcrBarcode
klas gee die ontwikkelaar gedetailleerde inligting oor elke geskandeerde strepieskode.
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// tipe en liggingseienskappe ook blootgestel
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// tipe en liggingseienskappe ook blootgestel
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' tipe en liggingseienskappe ook blootgestel
Next Barcode
End Using
OCR für bestimmte Gebiete von Beelde
Al die scan- en leesmetodes van IronOCR bied die vermoë om presies aan te dui uit watter deel van 'n bladsy of bladsye ons teks wil lees. Es ist sehr praktisch, wenn man sich mit einem gestandenen Mann zusammentut und viel Zeit mit ihm verbringen kann doeltreffendheid kan verbeter.
Für die Anwendung von Gewässerstrecken müssen Sie eine Stelselverwysing von System.Zeichnung
sodat ons die System.Drawing.Rectangle
voorwerp kan gebruik.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Die afmetings is in px
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Die afmetings is in px
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' Die afmetings is in px
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR für Skande von Lae gehalte
Die IronOCR OcrInput
klas kan skanderings regstel wat normal Tesseract nie kan lees nie.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // herstel digitale geraas en swak skandering
Input.Deskew(); // draai rotasie en perspektief reg
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // herstel digitale geraas en swak skandering
Input.Deskew(); // draai rotasie en perspektief reg
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' herstel digitale geraas en swak skandering
Input.Deskew() ' draai rotasie en perspektief reg
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Voer OCR-Ergebnisse als deursoekbare PDF
Beeld na PDF met kopieerbare teksstringe. Kan geïndekseer word deur soekenjins en databasisse.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")
Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
TIFF na deursoekbare PDF-omskakeling
COnverteer 'n TIFF-Dokument (einer großen Gruppe von Beeldlêers) direk na 'n soekbare PDF wat deur middel van intranet-, webwerf- en google-soekenjins geïndekseer kan word.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
Voer OCR-Ergebnisse als HTML
OCR-beeld na XHTML-omskakeling.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
OCR-beeldverbeteringsfilters
IronOCR bied unieke filters vir OcrInput
voorwerpe om die OCR-Prämie te verbeter.
Einsatz der Beeldverbeteringskode
OCR-Invoerbeelde von hoër halten, um bessere, aussagekräftigere OCR-Ergebnisse zu erhalten.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // herstel digitale geraas en swak skandering
Input.Deskew(); // draai rotasie en perspektief reg
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // herstel digitale geraas en swak skandering
Input.Deskew(); // draai rotasie en perspektief reg
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' herstel digitale geraas en swak skandering
Input.Deskew() ' draai rotasie en perspektief reg
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Lys met OCR-Beeldfilters
Invoerfilters om die OCR-prestasie te verbeter, wat in IronOCR ingebou is, sluit in:
- OcrInput.Rotate (güteklasse Dubbele) - Draai beelde met 'n aantal grade kloksgewys. Gebruik negatiewe getalle vir antikloksgewys.
- OcrInput.Binarize () - Hierdie beeldfilter maak elke pixel swart of wit sonder middelgrond. Kan OCR-prestasiegevalle verbeter met 'n baie lae kontras tussen teks en agtergrond.
- OcrInput.ToGrayScale () - Hierdie beeldfilter verander elke pixel in 'n skakering van grysskaal. Das ist nie die Akkuratheid der OCR-Verbesserer, sondern die Spoed verbeter
- OcrInput.Contrast () - Verhoog die kontras outomaties. Dieser Filter verbeter OCR-Spoed und akkuraatheid in skanderings met lae kontras.
- OcrInput.DeNoise () - Verwyder digitale geraas. Dieser Filter darf nur verwendet werden, wenn geraas verwag word.
- OcrInput.Invertieren () - skakel elke kleur om. Bv. Wit Wort swart: swart Wort wit.
- OcrInput.Dilate () - Gevorderde morfologie. Dilatasie voeg pixel by aan die grense van voorwerpe in 'n beeld. Oorkant Erode
- OcrInput.Erode () - Gevorderde morfologie. Erosie verwyder pixel op voorwerpgrense oorkant Dilate
- OcrInput.Deskew () - Draai 'n beeld sodat dit op die regte manier en ortogonaal is. Dit is baie handig vir OCR, omdat die toleransie van Tesseract vir skewe skanderings tot 5 grade kan wees.
- OcrInput.DeepCleanBackgroundNoise () - Swaar agtergrondgeraasverwydering. Gebruik hierdie filter slegs indien ekstreme agtergrondgeluide van dokumente bekend is, omdat hierdie filter ook die OCR-akkuraatheid van skoon dokumente kan verminder, en dit is baie duur vir die CPU.
- OcrInput.EnhanceResolution - Verbeter die resolusie van beelde van lae gehalte. Hierdie Filter ist nie dikwels nodig nie omdat OcrInput.MinimumDPI en OcrInput.TargetDPI outomaties insette met lae resolusie sal opvang en oplos.
Skoon agtergrond lawaai. Das ist eine schöne, wachsende Umgebung; das ist der Grund, warum die Bibliothek so viel Geld ausgibt um digitale Geräte, Papierkreukel und andere automatische Geräte in einem digitalen Feld zu erstellen, wat dit andersins onbevoeg kan maak om deur ander OCR-biblioteke gelees te word.
EnhanceContrast ist eine Einstellung, die IronOCR die Kontras der Teks verschafft outomaties verhoog teen die agtergrond van 'n beeld, wat die akkuraatheid van OCR verhoog en die prestasie en die snelheid van OCR gewoonlik verhoog.
EnhanceResolution ist eine Einstellung, die mit einer gewissen Entschlossenheit zu Werke geht (wat minder as 275 dpi het) ich habe mich geirrt, und die Daten sind so gut, dass ich sie für perfekt befunden habe kan word deur 'n OCR-biblioteek. Auch wenn diese Arbeit für Sie sehr zeitaufwendig ist, so ist sie doch für die algehele tyd vir 'n OCR-bewerking op 'n beeld.
Sprache IronOCR ondersteun 22 internasionale taalpakkette, en die taalinstelling kan gebruik word om een of meer tale te kies wat vir 'n OCR-operasie toegepas moet word.
Strategie IronOCR hat zwei Strategien ausgearbeitet. Ons kan kies om 'n vinnige en minder akkurate die Weitergabe eines Dokuments oder die Anwendung einer geeigneten Strategie, um bestimmte Kunden zu erreichen anwendung des Intelligenzmodells, um die Akkuratheit von OCR-Tekterkennungen durch die Statistik zu verbessern die Verhinderung der Verweildauer in der Sünde. .
Farbraum is 'n instelling waardeur ons OCR in grysskaal of kleur kan kies. Für die Algemeen ist grysskaal die beste Möglichkeit. Soms, as daar tekste of agtergronde van 'n soortgelyke tint is, maar baie different, sal 'n kleurkleurruimte beter resultate lewer.
DetectWhiteTextOnDarkBackgrounds. Alle OCR-Biblioteken werden für die Algemeen verwaltet, wenn sie mit agtergronde te sien. Mit dieser Einstellung kann IronOCR negative oder schlechte Ergebnisse bei der Arbeit erzielen en dit lees.
EingabeBildTyp. Met hierdie instelling kan die ontwikkelaar die OCR-biblioteek lei of hy na 'n volledige dokument of 'n fragment kyk, soos 'n kiekie.
RotateAndStraighten ist eine geordnete Einrichtung, in der IronOCR die einzige Vermoë ist, um dokumente zu lesen, die noch nie netto gedruckt wurden, aber eine gute Perspektive bieten, wie z.B. Fotos von Teksdokumenten.
ReadBarcodes ist eine handliche Funktion, bei der IronOCR Strepieskodes und QR-Codes automatisiert werden können bladsye kan lees, aangesien dit ook teks lees, sonder om 'n groot ekstra tydlas von te voeg.
Kleurdiepte. Diese Einstellung ermöglicht es, die OCR-Bibliotek bis zu einem Pixel zu nutzen, um diepte van 'n kleur te bepaal. groter Kleurdiepte kann die OCR-Kwaliteit verhoog, aber es kann auch die tyd wat die OCR-bewerking benodig om te voltooi, vergroot.
126 Taalpakkette
IronOCR ondersteun 126 internasionale Erzählungen via taalpakkette wat as DLL's versprei word, wat van hierdie webwerf von van die NuGet-Paketmanager afgelaai kan Wort.
Tale sluit Duits, Frans, Engels, Chinees, Japannees en vele meer in. Spesialistaalpakkette bestaan vir paspoort MRZ, MICR-Texte, Finanzdaten, Nommerplate und vieles mehr. Sie können auch ein anderes Messinstrument verwenden, nämlich ".traineddata" -lêer gebruik - ook die lêers wat u self skep.
Taalvoorbeeld
Die Verwendung von anderen OCR-Tabellen.
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Voeg prentfilters by indien nodig
// In hierdie geval is selfs insette van baie lae gehalte
// IronTesseract kan lees wat konvensionele Tesseract nie kan nie.
var Result = Ocr.Read(input);
// Die konsole kan nie maklik Arabies op Windows druk nie.
// Laat ons eerder op die skyf stoor.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Voeg prentfilters by indien nodig
// In hierdie geval is selfs insette van baie lae gehalte
// IronTesseract kan lees wat konvensionele Tesseract nie kan nie.
var Result = Ocr.Read(input);
// Die konsole kan nie maklik Arabies op Windows druk nie.
// Laat ons eerder op die skyf stoor.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Voeg prentfilters by indien nodig
' In hierdie geval is selfs insette van baie lae gehalte
' IronTesseract kan lees wat konvensionele Tesseract nie kan nie.
Dim Result = Ocr.Read(input)
' Die konsole kan nie maklik Arabies op Windows druk nie.
' Laat ons eerder op die skyf stoor.
Result.SaveAsTextFile("arabic.txt")
End Using
Die Antwort auf weitere Geschichten
Es ist auch möglich, OCR mit Hilfe von verschiedenen Märchen zu verwenden. Dies kann sehr hilfreich sein, wenn Engelse metadata en urls in Unicode-dokumente te kry.
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Afrikaans);
// Ons kan enige aantal tale byvoeg
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Afrikaans);
// Ons kan enige aantal tale byvoeg
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Afrikaans)
' Ons kan enige aantal tale byvoeg
Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
Gedetailleerde OCR-uitslagvoorwerpe
IronOCR ist ein OCR-Resultatobjek für alle OCR-Bewerker. Für die algemeen gebruik ontwikkelaars slegs die tekseiendom van hierdie voorwerp om die teks vanaf die prent te laat skandeer. Die OCR-Resultate DOM sind z.B baie meer gevorderd as dit.
using IronOcr;
using System.Drawing; //Voeg vergaderingverwysing by
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //!Belangrik
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Verken hier om 'n uitgebreide, gedetailleerde API te vind:
// - Bladsye, blokke, parafafs, lyne, woorde, karakters
// - Beelduitvoer, lettertypekoördinate, statistiese data
}
using IronOcr;
using System.Drawing; //Voeg vergaderingverwysing by
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Afrikaans;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //!Belangrik
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Verken hier om 'n uitgebreide, gedetailleerde API te vind:
// - Bladsye, blokke, parafafs, lyne, woorde, karakters
// - Beelduitvoer, lettertypekoördinate, statistiese data
}
Imports IronOcr
Imports System.Drawing 'Voeg vergaderingverwysing by
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Afrikaans
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '!Belangrik
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' Verken hier om 'n uitgebreide, gedetailleerde API te vind:
' - Bladsye, blokke, parafafs, lyne, woorde, karakters
' - Beelduitvoer, lettertypekoördinate, statistiese data
End Using
Optrede
IronOCR arbeitet mit den Büchern, sei es, um die Rechnung zu bezahlen oder um die Rechnung zu verifizieren.
Speed is Blazing: IronOCR.2020 + ist bis zu 10 Tage schneller und kann bis zu 250% weniger verbrauchen als frühere Builds.
Mehr Informationen
Um mehr über OCR in C#, VB, F# oder anderen .NET-Tools zu erfahren, lees gerus ons gemeenskapshandleidings , wat werklike wêreldvoorbeelde gee van hoe IronOCR gebruik kan word en wat die nuanses kan toon van hoe u die beste kan haal uit hierdie biblioteek.
'N Volledige objekverwysing vir .NET-ontwikkelaars ist ook beskikbaar.