Niederländische OCR in C#en .NET

Andere Versionen dieses Dokuments:

IronOCR ist eine C#-Softwarekomponente, die es .NET-Programmierern ermöglicht, PDF-Dokumente zu erstellen und zu bearbeiten 126 talen, waaronder Nederlands.

Es handelt sich hierbei um ein gehobenes Angebot von Tesseract, das ausschließlich für .NET-Anwender entwickelt wurde und regelmäßig aktualisiert wird beter dan andere Tesseract-engines voor zowel snelheid als nauwkeurigheid.

Inhoud van IronOcr.Talen Niederländisch

In diesem Paket sind 40 OCR-Tabellen für .NET enthalten:

  • Niederländisch
  • DutchBest
  • DutchFast

Herunterladen

Nederlands taalpakket [Niederländisch]
* Herunterladen als Ritssluiting
* Installieren mit
https://www.nuget.org/packages/IronOcr.Languages.Dutch/'> NuGet

Installatie

Das Wichtigste, was wir tun können, sind wir selbst Nederlandse OCR-pakket installeren op uw .NET-project.

PM> Install-Package IronOCR.Languages.Dutch

Code Voorbeeld

Dit C #-codevoorbeeld leest Nederlandse tekst uit een afbeelding of pdf-document.

//PM> Install-Package IronOcr.Languages.Dutch
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;
using (var Input = new OcrInput(@"images\Dutch.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Dutch
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;
using (var Input = new OcrInput(@"images\Dutch.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Dutch
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Dutch
Using Input = New OcrInput("images\Dutch.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

Was können Sie für IronOCR tun?

IronOCR ist eine einfach zu installierende, vollständige und gut dokumentierte .NET-Softwarebibliothek.

Kies IronOCR om een nauwkeurigheid von 99,8% + OCR für die Herstellung externer Produkte zu verwenden webservices, lopende kosten of het verzenden van vertrouwelijke documenten via internet.

Wo C#-ontwikkelaars IronOCR verkiezen boven Vanilla Tesseract:

  • Installieren Sie als eine andere DLL von NuGet
  • Bevat voor Tesseract 5, 4 en 3 motoren uit de doos.
  • Nauwkeurigheid 99,8% presteert aanzienlijk beter dan gewone Tesseract.
  • Hohe Geschwindigkeit und Multithreading
  • MVC, WebApp, Desktop, Konsole & Server Anwendungen kompatibel
  • Geen Exes of C ++ - code om mee te werken
  • Vollständiges Tuning für PDF OCR
  • Voor het uitvoeren van OCR een vrijwel elk afbeeldingsbestand of pdf
  • Vollständiges .NET Core-, Standard- und FrameWork-ondersteuning
  • Implementierung von Windows, Mac, Linux, Azure, Docker, Lambda, AWS
  • Lesen Sie Barcodes und QR-Codes
  • OCR als XHTML exportieren
  • Exporteer OCR naar doorzoekbare PDF-documenten
  • Optimierung von Multithreading
  • 126 internationale Talente, die alle über NuGet- oder OcrData-Bestände verfügen
  • Extraheer afbeeldingen, coördinaten, statistieken en lettertypen. Niet alleen tekst.
  • Tesseract OCR kann für den Vertrieb in kommerziellen und eigenen Anwendungen eingesetzt werden.

IronOCR arbeitet mit Unternehmen aus der ganzen Welt zusammen und veröffentlicht Dokumente wie z. B foto's, of scans met een lage resolutie die mogelijk digitale ruis of onvolkomenheden bevatten.

Andere kostenlose OCR- bibliotheken für die .NET-Plattform, z. B andere .net tesseract-API's en webservices, presteren niet zo goed in deze praktijkgevallen.

OCR mit Tesseract 5 - Beginn der Codierung in C #

Der folgende Code zeigt, wie einfach es ist, mit C# oder VB zu lernen .NET.

Oneliner

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

Configureerbare Hallo wereld

// PM> Install-Package IronOCR.Languages.Dutch
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... je kunt een willekeurig aantal afbeeldingen toevoegen
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Dutch
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... je kunt een willekeurig aantal afbeeldingen toevoegen
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Dutch
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Dutch
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

C#PDF OCR

Eine beliebige Auswahl kann auf eine beliebige Weise genutzt werden, um ein PDF-Dokument zu extrahieren.

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// We kunnen ook specifieke PDF-paginanummers selecteren voor OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 pagina voor elke pagina van de pdf
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// We kunnen ook specifieke PDF-paginanummers selecteren voor OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 pagina voor elke pagina van de pdf
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Dutch
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' We kunnen ook specifieke PDF-paginanummers selecteren voor OCR

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' 1 pagina voor elke pagina van de pdf
End Using
VB   C#

OCR für TIFF's mit größerer Seitenzahl

OCR Lezen von TIFF-Bestandsformaten, einschließlich Dokumenten mit mehr Seiten. TIFF kann auch rechtstreeks worden geconverteerd naar een PDF-bestand met doorzoekbare tekst.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Dutch

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Strichcodes en QR

Ein einzigartiges Merkmal von IronOCR ist, dass man die Strichcodes und QR-Codes von Dokumenten lesen kann, wenn man sie auf der Tastatur hat spärlich. Instanties von der OcrResult.OcrBarcode Die Klasse gibt den Teilnehmern detaillierte Informationen over elke gescande barcode.

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// type en locatie-eigenschappen ook weergegeven
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// type en locatie-eigenschappen ook weergegeven
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' type en locatie-eigenschappen ook weergegeven
Next Barcode
End Using
VB   C#

OCR für bestimmte Anwendungen

Alle Scan- und Lesemethoden von IronOCR bieten die Möglichkeit, die Art eines Produkts genau zu bestimmen pagina of pagina's we tekst willen lezen. Dies ist sehr hilfreich, wenn wir auf der Suche nach einer geeigneten Formulierung sind und het kan ontzettend veel tijd besparen en de efficiëntie verbeteren.

Für die Nutzung von Biomasseverbindungen ist eine Systemverwaltungsfunktion erforderlich, bei der System.Zeichnung zodat we het System.Drawing.Rectangle object kunnen gebruiken.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Afmetingen zijn in in px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Afmetingen zijn in in px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Dutch

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' Afmetingen zijn in in px

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR für Scans von großer Qualität

De IronOCR OcrInput klasse can scans repareren die normaal Tesseract niet lezen kann.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // lost digitale ruis en slecht scannen op
Input.Deskew(); // lost rotatie en perspectief op
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // lost digitale ruis en slecht scannen op
Input.Deskew(); // lost rotatie en perspectief op
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Dutch

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' lost digitale ruis en slecht scannen op
Input.Deskew() ' lost rotatie en perspectief op
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Exportieren von OCR-Ergebnissen als ein zoekbares PDF

Abrufbar im PDF-Format mit kopierfähigen Grafiken. Kann durch Suchmaschinen und Datenbanken indexiert werden.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Dutch

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

TIFF naar doorzoekbare PDF-Konvertierung

COverteer een TIFF-document (einer Gruppe unabhängiger Unternehmen (Afbeeldingsbestanden)) rechtstreeks naar een doorzoekbare PDF die kan worden geïndexeerd door intranet, website en Google-zoekmachines.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Dutch

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

Exportieren von OCR-Ergebnissen als HTML

OCR-afbeelding naar XHTML-conversie.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Dutch
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

OCR-Filter für die Beeldverbetering

IronOCR bietet unieke Filter für OcrInput objecten om de OCR-prestaties te verbeteren.

Voorbeeld van beeldverbeteringscode

Erzeugt OCR-Invoerbeelden von einer höheren Qualität, um bessere und schnellere OCR-Ergebnisse zu erzielen.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // lost digitale ruis en slecht scannen op
Input.Deskew(); // lost rotatie en perspectief op
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // lost digitale ruis en slecht scannen op
Input.Deskew(); // lost rotatie en perspectief op
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Dutch

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' lost digitale ruis en slecht scannen op
Input.Deskew() ' lost rotatie en perspectief op
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Lijst met OCR-afbeeldingsfilters

Zu den Rechnungsfiltern, die in IronOCR zum Verbessern der OCR-Präzisionen eingesetzt werden, gehören noch weitere:

  • OcrInput.Rotate (dubbele graden) - Roteert afbeeldingen een aantal graden met de klok mee. Gebruik negatieve getallen voor linksom.
  • OcrInput.Binarize () - Dit afbeeldingsfilter maakt elke pixel zwart of wit zonder middenweg. Kan de prestaties van OCR verbeteren met een zeer laag contrast tussen tekst en achtergrond.
  • OcrInput.ToGrayScale () - Dit afbeeldingsfilter verandert elke pixel in een grijstint. Het is onwaarschijnlijk dat de OCR-nauwkeurigheid verbetert, maar kan de snelheid verbeteren
  • OcrInput.Contrast () - Verhoogt automatisch het contrast. Dit filter verbetert vaak de OCR-snelheid en nauwkeurigheid bij scans met laag contrast.
  • OcrInput.DeNoise () - Verwijdert digitale ruis. Dieser Filter kann nur eingesetzt werden, wenn ruis wordt verwacht.
  • OcrInput.Invertieren () - Keert elke kleur om. Bijv. Wit wordt zwart: zwart wordt wit.
  • OcrInput.Dilate () - Geavanceerde morfologie. Dilatatie voegt pixels toe aan de grenzen van objecten in einem afbeelding. Tegenover Erode
  • OcrInput.Erode () - Geavanceerde morfologie. Erosie verwirbelt Pixel auf objectgrenzen Opposite of Dilate
  • OcrInput.Deskew () - Draait een afbeelding zodat deze met de goede kant omhoog en orthogonaal ist. Dit is erg handig voor OCR, omdat de Tesseract-tolerantie voor scheve scans slechts 5 graden kan zijn.
  • OcrInput.DeepCleanBackgroundNoise () - Verwijdering van zware achtergrondruis. Gebruik dit filter alleen als er extreme achtergrondruis bekend is, omdat dit filter ook het riskico loopt de OCR-nauwkeurigheid van schone documenten te verminderen, en het is erg duur voor de CPU.
  • OcrInput.EnhanceResolution - Verbetert de resolutie van afbeeldingen van lage kwaliteit. Dit der Filter ist niet vaak nodig omdat OcrInput.MinimumDPI en OcrInput.TargetDPI automatischer Rechnungssteller met lage resolutie opvangen en oplossen.

CleanBackgroundGeluid. Dies ist eine Einrichtung, die sehr nützlich ist; Er stelt de bibliotheek echter in staat om automatisch digitale ruis, papierkreukels en andere onvolkomenheden in een digitaal beeld op te ruimen, waardoor het anders niet meer door andere OCR-bibliotheken kan worden gelezen.

EnhanceContrast ist eine Einrichtung, die dafür sorgt, dass IronOCR automatisch den Kontrast der Technik über den Hintergrund einer Meldung, die die Nichteinhaltung der OCR-Bestimmungen anzeigt, und im Übrigen die prestaties en de snelheid van OCR worden verbeterd.

EnhanceResolution ist eine Einrichtung, die automatisch Nachbeobachtungen mit einer hohen Auflösung vornimmt (die kleiner zijn dan 275 dpi) en automatisch de afbeelding opschaalt en vervolgens alle tekst verscherpt, so dass diese Perfektion durch eine OCR-Bücherei geleert werden kann. Wie kann diese Arbeit auf sich selbst bezogen werden? tijdrovend is, verkort het in het algemeen de totale tijd voor een OCR-bewerking op een afbeelding.

Taal IronOCR bietet 22 internationale Pakete an, die für den Einsatz in der Gastronomie geeignet sind om een of meer meerdere talen te selecteren die moeten worden toegepast voor een OCR-bewerking.

Strategie IronOCR hat zwei Strategien ausgearbeitet. Wir können uns entscheiden, ob wir für eine bestimmte Person schnelles und unkompliziertes Scannen eines Dokuments oder die Anwendung einer geeigneten Strategie, die für alle Bereiche geeignet ist kunstmatige-intelligentiemodellen gebruikt om de nauwkeurigheid van OCR-tekst automatisch te verbeteren door te kijken naar de statistische relatie van woorden tot elkaar in een zin. .

Farbraum ist eine Anwendung, mit der wir OCR in verschiedenen Größen und Farben durchführen können. Über sie algemeen is grijstinten de best optie. Soms, als er echter teksten oder achtergronden zijn met een vergelijkbare tint maar een heel andere kleur, zal een kleurruimte in volledige kleuren betere resultaten opleveren.

DetectWhiteTextOnDarkBackgrounds. Alle OCR-Bibliotheken werden über das gesamte Spektrum verwaltet op een witte achtergrond. Mit dieser Einstellung kann IronOCR automatisch negative Auswirkungen auf andere Seiten haben tekst detecteren en lezen.

EingabeBildTyp. Mit dieser Einstellung kann der Benutzer die OCR-Bücherei in seinem Unternehmen nutzen kijken naar een volledig document of een fragment, zoals een screenshot.

RotateAndStraighten ist ein geavanceerde instelling waarmee IronOCR de unieke mogelijkheid heeft om dokumente zu sehen, die nicht nur geradlinig, sondern auch perspektivisch sind, z.B. Fotos von tekstdocumenten.

ReadBarcodes ist eine praktische Funktion, mit der IronOCR automatisch QR-Codes und andere Codes auslesen kann pagina's kan lezen terwijl het ook tekst leest, zonder een grote extra tijdlast.

Kleuren diepte. Diese Einstellung gibt an, wie viele Bits pro Pixel die OCR-Bücherei für die Erkennung verwendet diepte van een kleur te bepalen. Eine größere Menge an Klebeband kann die OCR-Kalibrierung verhindern, aber auch die Zeit, in der die nodig is om de OCR-bewerking te voltooien, verlengen.

126 Taalpakketten

IronOCR ondersteunt 126 internationale Talente über Taalpakketten die worden gedistribueerd als DLL's, die gekündigt wurden download dieser Website von und über NuGet-Paketmanager .

Zu den Talenten gehören u.a. Duits, Frans, Engels, Chinees, Japans und viele andere mehr. Es gibt spezialisierte Taalpakketten voor paspoort-MRZ, MICR-cheques, financiële gegevens, kentekenplaten en nog veel meer. Sie können auch einen Mosaikstein benutzen ".traineddata" -bestand gebruiken, ook degene die u zelf maakt.

Taalvoorbeeld

Andere OCR-Tabellen gebruiken.

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Voeg indien nodig afbeeldingsfilters toe
// In dit geval is zelfs de gedachte-invoer van zeer lage kwaliteit
// IronTesseract kan lezen wat conventionele Tesseract niet kan.

var Result = Ocr.Read(input);

// Console kan niet gemakkelijk Arabisch afdrukken op Windows.
// Laten we in plaats daarvan op schijf opslaan.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Voeg indien nodig afbeeldingsfilters toe
// In dit geval is zelfs de gedachte-invoer van zeer lage kwaliteit
// IronTesseract kan lezen wat conventionele Tesseract niet kan.

var Result = Ocr.Read(input);

// Console kan niet gemakkelijk Arabisch afdrukken op Windows.
// Laten we in plaats daarvan op schijf opslaan.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Voeg indien nodig afbeeldingsfilters toe
' In dit geval is zelfs de gedachte-invoer van zeer lage kwaliteit
' IronTesseract kan lezen wat conventionele Tesseract niet kan.

Dim Result = Ocr.Read(input)

' Console kan niet gemakkelijk Arabisch afdrukken op Windows.
' Laten we in plaats daarvan op schijf opslaan.
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

Meerdere talen voorbeeld

Es ist auch sinnvoll, OCR mit größeren Talenten zu nutzen. Das kann wirklich helfen, wenn es um Metageschichten und URL's in het Engels in Unicode-documenten te krijgen.

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Dutch);

// We kunnen een willekeurig aantal talen toevoegen

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Dutch);

// We kunnen een willekeurig aantal talen toevoegen

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Dutch)

' We kunnen een willekeurig aantal talen toevoegen

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

Detaillierte OCR-Ergebnis-Objekte

IronOCR liefert ein OCR-Resultatobjekt für eine OCR-Bearbeitung. Over het algemeen gebruiken ontwikkelaars alleen de teksteigenschap van dit object om de tekst uit de afbeelding te laten scannen. Die OCR-Resultate DOM sind echter veel geavanceerder dan dit.

using IronOcr;
using System.Drawing; //Voeg een assemblageverwijzing toe

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //!Belangrijk

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Verken hier om een enorme, gedetailleerde API te vinden:
// - Pagina's, blokken, parafijnen, regels, woorden, tekens
// - Afbeelding exporteren, lettertypecoördinaten, statistische gegevens
}
using IronOcr;
using System.Drawing; //Voeg een assemblageverwijzing toe

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Dutch;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //!Belangrijk

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Verken hier om een enorme, gedetailleerde API te vinden:
// - Pagina's, blokken, parafijnen, regels, woorden, tekens
// - Afbeelding exporteren, lettertypecoördinaten, statistische gegevens
}
Imports IronOcr
Imports System.Drawing 'Voeg een assemblageverwijzing toe

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Dutch
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '!Belangrijk

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' Verken hier om een enorme, gedetailleerde API te vinden:
' - Pagina's, blokken, parafijnen, regels, woorden, tekens
' - Afbeelding exporteren, lettertypecoördinaten, statistische gegevens
End Using
VB   C#

Prestatie

IronOCR arbeitet direkt mit den Kunden zusammen, denn es ist wichtig, dass die Produkte nicht gestoppt werden oder dass die Rechnungsstellung reibungslos verläuft te wijzigen.

Snelheid is razendsnel: IronOCR.2020 + ist bis zu 10 Tage billiger und bietet mehr als 250% weniger Geld als andere builds.

Mehr Informationen

Lektüre für weitere Informationen über OCR in C#, VB, F# oder einem anderen .NET-Taal onze communityhandleidingen , die wie IronOCR eingesetzt werden kann und welche Nuancen es gibt, um zu erfahren, wie Sie het beste uit deze bibliotheek.

Een volledige objectreferentie voor .NET-ontwikkelaars ist ook beschikbaar.