Svensk OCR i C#och .NET

Weitere Versionen des Dokuments:

IronOCR ist eine C#-Komponente, die es .NET-Nutzern ermöglicht, Text aus Bildern und PDF-Dokumenten zu lesen 126 språk, inklusive svenska.

Tesseract ist ein fortschrittlicher Gaffel, der exklusiv für .NET-Anwender entwickelt wurde und auch für andere Unternehmen geeignet ist Tesseract-motorer för både hastighet och noggrannhet.

Innehåll i IronOcr.Languages.Swedish

Dieses Paket enthält 46 OCR-Språk für .NET:

  • svenska
  • SwedishBest
  • SwedishFast

Ladda ner

Schwedisch Sprachpaket [Svenska]
* Herunterladen als Blixtlås
* Installieren Sie mit
https://www.nuget.org/packages/IronOcr.Languages.Swedish/'> NuGet

Einrichtung

Das Wichtigste, was Sie tun müssen, ist die Installation von svenska OCR-Paket für ein .NET-Projekt.

PM> Install-Package IronOCR.Languages.Swedish

Kodexempel

Detta C#-kodexempel läser svensk text från ett bild- eller PDF-dokument.

//PM> Install-Package IronOcr.Languages.Swedish
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;
using (var Input = new OcrInput(@"images\Swedish.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Swedish
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;
using (var Input = new OcrInput(@"images\Swedish.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Swedish
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Swedish
Using Input = New OcrInput("images\Swedish.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

Woher kommt IronOCR?

IronOCR ist eine lättinstallerat, komplett och väldokumenterat .NET-programbibliotek.

Välj IronOCR för att uppnå 99,8% + OCR-noggrannhet um ein externes Webbtjänster zu erstellen, löpande avgifter eller skicka konfidentiella dokument över internet.

Wenn C#-Autoren IronOCR im Rahmen von Vanilla Tesseract verwenden:

  • Installieren Sie eine Enda DLL oder NuGet
  • Inkluderar för Tesseract 5, 4 och 3 Motorer ur lådan.
  • Noggrannhet 99,8% överträffar betydligt bättre än vanlig Tesseract.
  • Snabb hastighet och multitrådning
  • MVC, WebApp, Desktop, Konsole & Server Anwendung kompatibel
  • Inga Exes eller C ++ - kod att arbeta med
  • Vollständiger PDF-Stoff für OCR
  • Um OCR zu nutzen, müssen Sie eine Bilddatei oder ein PDF-Dokument ausdrucken
  • Vollständige Unterstützung für .NET Core, Standard und FrameWork
  • Verteilung auf Windows, Mac, Linux, Azure, Docker, Lambda, AWS
  • Läs streckkoder och QR-koder
  • OCR bis XHTML exportieren
  • Exportera OCR till sökbara PDF-document
  • Multithreading-Stöd
  • 126 internationale Sprachen sind über NuGet- oder OcrData-Filer verfügbar
  • Extrahera bilder, koordinater, statistik och teckensnitt. Inte bara text.
  • Mit dieser Funktion können Sie Tesseract OCR in verschiedenen Anwendungen einsetzen.

IronOCR lyser när du arbetar med verkliga bilder och ofullkomliga dokument som fotografier eller skanningar med låg upplösning som kan ha digitalt brus eller brister.

Andra kostnadsfria OCR- bibliotek för .NET-plattformen, sådana andra .net tesseract-API: er och webbtjänster, fungerar inte så bra på dessa användningsfall.

OCR med Tesseract 5 - Starta kodning i C #

Der Benutzer sieht, wie wichtig es ist, mit C# und VB .NET Text aus einem Bild zu lesen.

OneLiner

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

Konfigurerbar Hallo Welt

// PM> Install-Package IronOCR.Languages.Swedish
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... du kan lägga till valfritt antal bilder
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Swedish
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... du kan lägga till valfritt antal bilder
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Swedish
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Swedish
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

C#PDF OCR

Das gleiche Format kann für die Extrahierung von Text aus allen PDF-Dokumenten verwendet werden.

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Vi kan också välja specifika PDF-sidnummer för OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 sida för varje sida i PDF-filen
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Vi kan också välja specifika PDF-sidnummer för OCR

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// 1 sida för varje sida i PDF-filen
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Swedish
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' Vi kan också välja specifika PDF-sidnummer för OCR

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' 1 sida för varje sida i PDF-filen
End Using
VB   C#

OCR für Mehrseiten-TIFF

OCR lässte TIFF-Format inklusive Dokument mit flera sidor. TIFF kann auch direkt in eine PDF-Datei umgewandelt werden sökbar text.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Swedish

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Streckkoder und QR

Ein einzigartiges Merkmal von IronOCR ist, dass der Benutzer Streckkoder und QR-Koder aus dem Dokument herauslesen kann, während er den Text liest. Instanser av OcrResult.OcrBarcode klassen ger utvecklaren detaljerad information om varje skannad streckkod.

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// typ- och platsegenskaper också exponerade
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// typ- och platsegenskaper också exponerade
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' typ- och platsegenskaper också exponerade
Next Barcode
End Using
VB   C#

OCR für bestimmte Bilddateien

Alla IronOCR: s skannings- och läsmetoder ger möjlighet att exakt specificera vilken del av en sida eller sidor vi vill läsa text från. Das ist sehr schwierig, wenn man standardisierte Formulare verwendet und viel Geld sparen kann mycket tid och förbättra effektiviteten.

Um eine Beskärningsregion zu finden, müssen Sie ein Systemreferenzsystem verwenden System.Zeichnung så att vi kann ein Objekt använda System.Drawing.Rectangle .

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Måtten är i px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Måtten är i px

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Swedish

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' Måtten är i px

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR für das Skannen von Låg kvalitet

IronOCR OcrInput klassen kan fixa skanningar som normal Tesseract inte kan läsa.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // fixar digitalt brus och dålig skanning
Input.Deskew(); // fixerar rotation och perspektiv
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // fixar digitalt brus och dålig skanning
Input.Deskew(); // fixerar rotation och perspektiv
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Swedish

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' fixar digitalt brus och dålig skanning
Input.Deskew() ' fixerar rotation och perspektiv
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR-Ergebnis als PDF-Datei exportieren

Bild bis PDF mit kopierbarem Textsträngar. Kan indexeras av sökmotorer och databaser.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Swedish

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

TIFF bis sökbar PDF-Konvertierung

COvertera ett TIFF-dokument (oder eine andere Gruppe von Filmemachern) direkt zu einer PDF-Datei, die indexiert werden kann sökmotorerna på intranät, webbplats och google.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Swedish

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

OCR-Ergebnis als HTML exportieren

OCR-Bild bis XHTML-Konvertierung.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Swedish
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

OCR-Bildförbättringsfilter

IronOCR tillhandahåller unika filter för OcrInput objekt för att förbättra OCR-prestanda.

Beispiel für einen Bildförbättringskod

OCR-inmatade bilder högre kvalitet för att get bättre, snabbare OCR-resultat.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // fixar digitalt brus och dålig skanning
Input.Deskew(); // fixerar rotation och perspektiv
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // fixar digitalt brus och dålig skanning
Input.Deskew(); // fixerar rotation och perspektiv
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Swedish

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' fixar digitalt brus och dålig skanning
Input.Deskew() ' fixerar rotation och perspektiv
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

Lista över OCR-bildfilter

Ingångsfilter, um die in IronOCR inkluderar enthaltenen OCR-Prüfdaten zu verarbeiten:

  • OcrInput.Rotate (dubbla-Sortierer) - Roterar bilder med ett antal grader medurs. Använd negativa siffror moturs.
  • OcrInput.Binarize () - Detta bildfilter gör varje pixel svart eller vit utan mellanliggande marke. Kan förbättra OCR-prestandafall med mycket låg kontrast mellan text och bakgrund.
  • OcrInput.ToGrayScale () - Detta bildfilter förvandlar varje pixel till en nyans av gråskala. Det är osannolikt att OCR-noggrannheten förbättras men kan förbättra hastigheten
  • OcrInput.Contrast () - Ökar kontrasten automatiskt. Dieser Filter förbättrar ofta OCR-hastighet och noggrannhet vid skanningar med låg kontrast.
  • OcrInput.DeNoise () - Teer bort digitalt brus. Detta filter ska endast användas där buller förväntas.
  • OcrInput.Invertieren () - Inverterar varje färg. Till exempel blir vit svart: svart blir vit.
  • OcrInput.Dilate () - Avancerad morfologi. Verdünnung lägger till pixlar till gränserna för objekt i en bild. Mittemot Erode
  • OcrInput.Erode () - Avancerad morfologi. Erosion tar bort pixlar på objektgränserna motsatt av Dilate
  • OcrInput.Deskew () - Roterar en bild så att den är rätt uppåt och ortogonal. Detta är mycket användbart för OCR eftersom Tesseract-toleransen för skeva skanningar kan vara så låg som 5 grader.
  • OcrInput.DeepCleanBackgroundNoise () - Avlägsnande av kraftvoll bakgrundsbrus. Der Filter kann nicht verwendet werden, da er das Risiko birgt minska OCR-noggrannhet för rena dokument och är mycket CPU-dyrt.
  • OcrInput.EnhanceResolution - Förbättrar upplösningen på bilder med låg kvalitet. Detta filter behövs inte ofta eftersom OcrInput.MinimumDPI och OcrInput.TargetDPI automatiskt kommer att fånga och lösa ingångar med låg upplösning.

CleanBackgroundBuller. Detta är en inställning som är lite tidskrävande; emellertid tillåter det biblioteket att automatiskt rengöra digitalt brus, pappers skrynklor och andra brister i en digital bild som annars skulle göra det oförmöget att läsas av andra OCR-bibliotek.

EnhanceContrast är en inställning som gör att IronOCR automatiskt ökar textens kontrast mot en bilds bakgrund, vilket ökar OCR-noggrannheten och i allmänhet ökar prestanda och OCR-hastighet.

EnhanceResolution är en inställning som automatiskt upptäcker bilder med låg upplösning (som är unter 275 dpi) och automatiskt uppskalar bild och sedan skärper hela texten så att den kan läsas perfekt av ett OCR-bibliotek. Auch wenn die Operation selbst noch nicht abgeschlossen ist, kann die Gesamtmenge an Geld, die für eine OCR-operation på en bild.

Språk IronOCR stöder 22 internationella språkpaket och språkinställningen kan användas för att att att välja ett eller flera språk som ska användas för en OCR-operation.

Strategi IronOCR stöder två strategier. Vi kan välja att antingen gå för en snabb och mindre korrekte Erstellung eines Dokuments oder die Entwicklung einer neuen Strategie, die die künstliche Intelligenz verändert intelligenzmodelle für die automatische Erkennung von Fehlern in OCR-Texten, um die statistischen Daten einer Bestellung zu erfassen relation till varandra i en mening .

Farbraum är en inställning där vi kan välja OCR i gråskala eller färg. Generell sind die bästa alternativet. Men ibland när det finns texter eller bakgrunder med liknande nyans men väldigt annorlunda färger, kommer ett färgfärgutrymme i färger att ge bättre resultat.

DetectWhiteTextOnDarkBackgrounds. I allmänhet förväntar sig alla OCR-bibliotek att se svart text på vit bakgrund. Mit dieser Einstellung kann IronOCR automatisch eine negative oder eine positive Nachricht übermitteln och läsa dem.

EingabeBildTyp. Denna inställning gör det möjligt för utvecklaren att vägleda OCR-biblioteket om huruvida den tittar på ett fullständigt dokument eller ett utdrag, till exempel en skärmdump.

RotateAndStraighten är en avancerad inställning som tillåter IronOCR den unika förmågan att läsa dokument som inte bara roteras utan kanske innehåller perspektiv, till exempel fotografier av textdokument.

ReadBarcodes es handelt sich um eine Funktion, die es IronOCR ermöglicht, automatisch zu läsen streckkoder och QR-koder på sidor eftersom det också läser text utan att lägga till en större extra tidsbörda.

Färgdjup. Den här inställningen avgör hur många bitar per pixel OCR-biblioteket ska använda för att att att att bestämma djupet på en färg. Ett högre färgdjup kan öka OCR-kvaliteten, men kommer också att öka den tid som krävs för OCR-operationen.

126 Språkpaket

IronOCR stöder 126 internationella språk via Språkpaket som distribueras som DLL-filer, som kan laddas ner von der här webbplatsen eller också från NuGet-Paketmanager .

Språken inkluderar tyska, franska, engelska, kinesiska, japanska och många fler. Specialistpaket finns för MRZ-pass, MICR-Kontroller, Finanzdaten, Registrierkassen und viele andere Dinge. Sie können auch einen wertvollen Mosaikstein anbringen ".traineddata" -fil - inklusive de du skapar själv.

Språkexempel

Använda andra OCR-språk.

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Lägg till bildfilter om det behövs
// I det här fallet är även tankeinmatningen mycket låg kvalitet
// IronTesseract kan läsa vad konventionell Tesseract inte kan.

var Result = Ocr.Read(input);

// Konsolen kan inte skriva ut arabiska på Windows enkelt.
// Låt oss spara på disk istället.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// Lägg till bildfilter om det behövs
// I det här fallet är även tankeinmatningen mycket låg kvalitet
// IronTesseract kan läsa vad konventionell Tesseract inte kan.

var Result = Ocr.Read(input);

// Konsolen kan inte skriva ut arabiska på Windows enkelt.
// Låt oss spara på disk istället.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' Lägg till bildfilter om det behövs
' I det här fallet är även tankeinmatningen mycket låg kvalitet
' IronTesseract kan läsa vad konventionell Tesseract inte kan.

Dim Result = Ocr.Read(input)

' Konsolen kan inte skriva ut arabiska på Windows enkelt.
' Låt oss spara på disk istället.
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

Beispiel aus dem Englischen Sprachraum

Det är också möjligt att använda OCR med flera språk samtidigt. Detta kan verkligen hjälpa till att få engelskspråkiga metadata och webbadresser i Unicode-dokument.

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Swedish);

// Vi kan lägga till valfritt antal språk

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Swedish);

// Vi kan lägga till valfritt antal språk

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Swedish)

' Vi kan lägga till valfritt antal språk

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

Detailliertes OCR-Resultatobjekt

IronOCR liefert ein OCR-Ergebnisobjekt für eine bestimmte OCR-Operation. Generellt använder utvecklare endast textegenskapen för det här objektet för att få texten skannad från bilden. OCR-Resultate DOM är dock mycket mer avancerad än detta.

using IronOcr;
using System.Drawing; //Lägg till monteringsreferens

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //!Viktig

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Utforska här för att hitta ett massivt, detaljerat API:
// - Sidor, block, parafafer, linjer, ord, tecken
// - Bildexport, teckensnittskoordinater, statistiska data
}
using IronOcr;
using System.Drawing; //Lägg till monteringsreferens

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Swedish;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //!Viktig

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// Utforska här för att hitta ett massivt, detaljerat API:
// - Sidor, block, parafafer, linjer, ord, tecken
// - Bildexport, teckensnittskoordinater, statistiska data
}
Imports IronOcr
Imports System.Drawing 'Lägg till monteringsreferens

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Swedish
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True '!Viktig

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' Utforska här för att hitta ett massivt, detaljerat API:
' - Sidor, block, parafafer, linjer, ord, tecken
' - Bildexport, teckensnittskoordinater, statistiska data
End Using
VB   C#

Prestanda

IronOCR funktioniert nur dann, wenn es darum geht, ein gutes Ergebnis zu erzielen oder kraftvolle Bilder zu erstellen.

Die Geschwindigkeit ist gigantisch: IronOCR.2020 + ist bis zu 10 Gänge schneller und bietet mehr als 250% mehr Leistung bei normalen Builds.

Läs mer

Um mehr über OCR in C#, VB, F# oder einem anderen .NET-Spruch zu erfahren, läs våra communitytutorialer , som ger verkliga exempel på hur IronOCR kan användas och kan visa nyanserna i hur du får ut det bästa av detta bibliotek.

En fullständig objektreferens för .NET-utvecklare finns också.