VERGLEICH MIT ANDEREN KOMPONENTEN

Ein Vergleich zwischen IronOCR und Aspose.OCR

Veröffentlicht 26. Januar 2023
Teilen Sie:

OCR steht für Optical Character Recognition (optische Zeichenerkennung). Dabei handelt es sich um eine Technologie, bei der eine Maschine Bilder von Text in digitalen Text umwandelt, der durchsucht und bearbeitet werden kann.

Diese Technologie gibt es schon seit einiger Zeit, aber sie wird mit der Weiterentwicklung des maschinellen Lernens immer beliebter. Erst in den letzten Jahren haben Informatiker einen Algorithmus entwickelt, der die Schreibschrift lesen kann, die auch heute noch von vielen Menschen verwendet wird, darunter Ärzte und Rechtsanwälte. Zu den Einsatzmöglichkeiten dieses Tools gehören das Scannen eines ganzen Buches, das Extrahieren des Textes aus einem einzelnen Buchstaben, die Umwandlung einer ganzen PDF-Datei in ein bearbeitbares Format, die Dokumentenerkennung, die Unabhängigkeit von der TIFF-Plattform usw. Die Optical Character Recognition Engine kann in vielen verschiedenen Branchen eingesetzt werden, z. B. in Medien- und Verlagsunternehmen, Anwaltskanzleien, Bibliotheken, Behörden und vielen mehr. Viele Unternehmen setzen OCR-Software ein, um Papierschecks und Kontoauszüge zu digitalisieren, Rechtschreibfehler automatisch zu korrigieren oder Textkonsolen zu erkennen und so Zeit und Mühe beim Scannen von Dokumenten per Hand zu sparen.

Manchmal ist der Text von Bildern nicht in Englisch. In diesem Fall muss ein OCR-Tool verwendet werden, das das PNG-Bild übersetzt, bevor es den Text extrahieren und in englische Zeichen umwandeln kann.

In diesem Artikel vergleichen wir zwei der gängigsten Bibliotheken und Anwendungen für OCR-Rasterformate und PDF-Dokumentbilder. Diese sind:

  • Aspose.OCR
  • IronOCR

1.0 Einführung

1.1 Aspose.OCR Einführung und Funktionen

Aspose.OCR für .NET ist ein leistungsstarkes und robustes Paket für die optische Zeichenerkennung. Dies ist eine hervorragende Ergänzung zu jeder Anwendung und kann den Prozess automatisieren. Die eigenständige OCR-API ist erweiterbar, benutzerfreundlich und kompakt. Es enthält einen einfachen Satz von Klassen, die alle Funktionen bieten, die Sie benötigen, um Text ohne zusätzlichen Aufwand zu erkennen und die korrekte Textreihenfolge beizubehalten. Aspose.OCR kann über 100 verschiedene Formate lesen und bietet eine Vielzahl nützlicher Funktionen, von der Möglichkeit, Schriftarten zu lesen, Stileffekte anzuwenden (fett/kursiv)und sogar Rauschen aus Ihrem Bild entfernen. Die API kann den Grafikprozessor für die optische Zeichenerkennung nutzen und so den Stromverbrauch der CPU senken.

Merkmale von Aspose.OCR

  • Programmgesteuertes Erkennen, Identifizieren und Lesen von Zeichen aus Bildern.
  • Scannen Sie das gesamte Bild oder nur einen bestimmten Teil des Bildes.
  • Schräglagenkorrektur für OCR-Betrieb. Gedrehte Bilder scannen.
  • Unterstützt JPEG, PNG, GIF, etc. Die vollständige Liste der unterstützten Dateiformate finden Sie auf der Seite Unterstützte Dateiformate, und abonnieren Sie das Aspose-Produkt.
  • Unterstützung für viele Zeichen, einschließlich Zahlen und Alphabete. Eine vollständige Liste der unterstützten Zeichen finden Sie auf der Seite Unterstützte Zeichen.
  • Derzeit werden 20 europäische Sprachen und Chinesisch unterstützt.
  • Erkennen und lesen Sie gängige Schriftarten wie Arial, Times New Roman, Courier New, Tahoma, Calibri und Verdana.
  • Unterstützt normale, fette und kursive Schriftstile.
  • Anwendung verschiedener Rauschunterdrückungsfilter zur Unterstützung der Bilderkennung.
  • Berechnen Sie die Begrenzungsrahmen von Zeilen oder Absätzen.
  • Erhalten Sie für jedes erkannte Zeichen eine Auswahlmöglichkeit.
  • URI übergeben und das Bild daraus erkennen.
  • Erkennen Sie mehrere Bilder in einem Ordner oder Zip-Archiv.
  • Ergebnisse im JSON-Format abrufen.
  • Speichern der Ergebnisse im Text-, DOCX- oder PDF-Format

    Für die Integration der Toggle-Navigation ist Aspose eine gute Option, die es gibt. Die Konsole für erkannten Text und die Dokumententexterkennung oder die Bild-zu-Text- oder Bild-OCR-API sind Beispiele für Funktionen, die nützlich sein können.

    Neben der automatischen Rechtschreibprüfung unterstützt die Bilderkennungssoftware auch eine Vielzahl von Ausgabeformaten (wie zum Beispiel PNG) und ignorieren nicht-textliche Blöcke, ohne dass eine zusätzliche OCR-API erforderlich ist. Auf eigenständige API-Funktionen kann in der Entwicklungsumgebung zugegriffen werden, um Text aus Bildern zu erfassen.

1.2 IronOCR - Einführung und Funktionen

IronOCR for .NET liest Textinhalte aus Fotos und PDFs in .NET-Anwendungen und Websites. Die Software hilft beim Scannen von Fotos nach Text und Barcodes. Es gibt den Inhalt als reinen Text oder als strukturierte Daten aus. IronOCR unterstützt zahlreiche Sprachen weltweit. Die OCR-Bibliothek kann in MVC-, Web-, Konsolen- und Desktop-.NET-Anwendungen verwendet werden. Für kommerzielle Einsätze wird die Lizenzierung mit direkter Unterstützung durch das Entwicklungsteam durchgeführt.

  • Mit der neuesten Tesseract 5-Engine liest IronOCR Text, Barcodes und QR-Codes aus jedem Bild- oder PDF-Format. Diese Bibliothek erweitert Desktop-, Konsolen- und Webanwendungen schnell um OCR.
  • IronOCR unterstützt 127 internationale Sprachen. Es unterstützt auch benutzerdefinierte Sprachen und Wortlisten.
  • Es kann mehr als 20 Barcode- und QR-Code-Formate lesen.
  • IronOCR unterstützt die mehrseitigen Bildformate GIF und TIFF.
  • Sie korrigiert gescannte Bilder von schlechter Qualität.
  • IronOCR unterstützt Multithreading. Er kann einen oder mehrere Prozesse gleichzeitig ausführen.
  • IronOCR kann strukturierte Daten auf Seiten, Absätzen, Zeilen, Wörtern, Zeichen usw. ausgeben.
  • IronOCR unterstützt Betriebssysteme wie Windows, Linux, macOS, etc.

2. Erstellen eines neuen Projekts in Visual Studio

Öffnen Sie Visual Studio und rufen Sie das Menü Datei auf. Wählen Sie Neues Projekt und dann Konsolenanwendung.

Ein Vergleich zwischen IronOCR und Aspose.OCR - Abbildung 1: Konsolen-App

Konsolen-App

Geben Sie den Projektnamen ein und wählen Sie den Dateipfad in dem entsprechenden Textfeld aus. Klicken Sie dann auf die Schaltfläche Create und wählen Sie ein .NET-Framework aus:

Ein Vergleich zwischen IronOCR und Aspose.OCR - Abbildung 2: Neue Projektkonfiguration

Neue Projektkonfiguration

Das Projekt wird nun die Struktur für die ausgewählte Anwendung generieren.

Ein Vergleich zwischen IronOCR und Aspose.OCR - Abbildung 3: Datei Program.cs

Datei Program.cs

3.0 Installieren

3.1 Aspose.OCR installieren

Installation von Aspose.OCR für .NET über NuGet

Wir können die Aspose.OCR API in unserer Anwendung mit NuGet installieren. Gehen Sie einfach zum Menü Tools in Visual Studio und wählen Sie den NuGet Package Manager. Wählen Sie im Seitenmenü NuGet-Paket für eine Lösung verwalten. Es öffnet sich ein Fenster des NuGet Package Managers. Gehen Sie auf die Registerkarte Durchsuchen und suchen Sie nach Aspose.OCR. Wählen Sie dann die Aspose API aus den Suchergebnissen aus und klicken Sie auf die Schaltfläche "Installieren". Die Aspose-API wird installiert und ist bereit, im Projekt verwendet zu werden.

Ein Vergleich zwischen IronOCR und Aspose.OCR - Abbildung 4

Installieren oder aktualisieren Sie Aspose.OCR über die Paketmanager-Konsole

Auf ähnliche Weise können Sie Aspose.OCR über die Konsole installieren. Öffnen Sie die NuGet-Konsole, die sich normalerweise am unteren Rand eines Visual Studio-Projekts befindet, geben Sie den folgenden Befehl ein und drücken Sie die Eingabetaste.

“Install-Package Aspose.OCR -Version x.x.0”

3.2 IronOCR installieren

Die IronOCR-Bibliothek kann auf vier Arten heruntergeladen und installiert werden.

Diese sind:

  • Visual Studio verwenden.
  • Verwendung der Befehlszeile.
  • Laden Sie die Software direkt von der NuGet-Website herunter.
  • Download von der IronPDF-Website.

3.2.1 Verwendung von Visual Studio

Der folgende Screenshot zeigt, wie Sie den NuGet Package Manager öffnen.

Ein Vergleich zwischen IronOCR und Aspose.OCR - Abbildung 5: NuGet-Paketmanager

NuGet-Paketmanager

Klicken Sie im Fenster des Paketmanagers auf Durchsuchen und suchen Sie nach dem Schlüsselwort "IronOCR", wie in der folgenden Abbildung dargestellt:

Ein Vergleich zwischen IronOCR und Aspose.OCR - Abbildung 6: IronOCR-Installation

IronOCR-Installation

In der obigen Abbildung sehen wir die Liste der verwandten Suchanfragen. Wir müssen die gewünschte Option auswählen, um das Paket in der Lösung zu installieren.

3.2.2 Verwendung der Kommandozeile

  • In Visual Studio: Gehen Sie zu Werkzeuge -> NuGet Paketmanager -> Paketmanager-Konsole
  • Geben Sie auf der Registerkarte Konsole die folgende Zeile ein.
Install-Package IronOcr
  • Jetzt wird das Paket in das aktuelle Projekt heruntergeladen/installiert und ist einsatzbereit.

3.2.3 Direktes Herunterladen von der NuGet-Website

Die dritte Möglichkeit ist, das NuGet-Paket direkt von der Website herunterzuladen.

  • Navigieren Sie zum link.
  • Wählen Sie im Menü auf der rechten Seite die Option Paket herunterladen.
  • Doppelklicken Sie auf das heruntergeladene Paket. Sie wird automatisch installiert.
  • Laden Sie anschließend die Lösung neu und verwenden Sie sie im Projekt.

3.2.4 Download direkt von der IronOCR-Website

Klicken Sie auf die link hier, um das neueste Paket direkt von der Website herunterzuladen. Führen Sie nach dem Download die folgenden Schritte aus, um das Paket zum Projekt hinzuzufügen.

  • Klicken Sie mit der rechten Maustaste auf das Projekt im Projektmappenfenster.
  • Wählen Sie dann die Option Referenz und suchen Sie den Speicherort der heruntergeladenen Referenz.
  • Klicken Sie anschließend auf OK, um die Referenz hinzuzufügen.

4.0 OCR-Bild

Sowohl IronOCR als auch Aspose.OCR verfügen über eine OCR-Technologie, die Bilder in Text umwandeln kann.

4.1 Aspose.OCR verwenden

Der folgende Codeschnipsel demonstriert die Verwendung der Option bild erkennen methode zur Durchführung einer OCR-Operation auf dem Bild einer Seite.

// For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();
// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();
// Recognize image
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");
// Display the recognized text
Console.WriteLine(result);
// For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();
// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();
// Recognize image
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");
// Display the recognized text
Console.WriteLine(result);
' For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
' The path to the documents directory.
Dim dataDir As String = RunExamples.GetDataDir_OCR()
' Initialize an instance of AsposeOcr
Dim api As New AsposeOcr()
' Recognize image
Dim result As String = api.RecognizeImage(dataDir & "Sampleocr.bmp")
' Display the recognized text
Console.WriteLine(result)
VB   C#

Der folgende Codeschnipsel demonstriert die Verwendung der Option erkennungslinie methode, um eine OCR-Operation an einem Bild durchzuführen, das eine einzelne Zeile enthält.

// For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();

// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();

// Recognize image
string result = api.RecognizeLine(dataDir + "sample_line.png");

// Display the recognized text
Console.WriteLine(result);
// For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();

// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();

// Recognize image
string result = api.RecognizeLine(dataDir + "sample_line.png");

// Display the recognized text
Console.WriteLine(result);
' For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
' The path to the documents directory.
Dim dataDir As String = RunExamples.GetDataDir_OCR()

' Initialize an instance of AsposeOcr
Dim api As New AsposeOcr()

' Recognize image
Dim result As String = api.RecognizeLine(dataDir & "sample_line.png")

' Display the recognized text
Console.WriteLine(result)
VB   C#

4.2 Verwendung von IronOCR

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("3.png")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Console.ReadKey()
End Using
VB   C#

Die Tesseract 5 API, mit der wir Bilddateien in Text umwandeln können, wird oben demonstriert. In der obigen Codezeile erstellen wir ein Objekt für "IronTesseract". Wir erstellen auch ein "OcrInput"-Objekt, mit dem wir eine oder mehrere Bilddateien hinzufügen können. Es kann sein, dass wir den verfügbaren Bildpfad innerhalb des Codes angeben müssen, wenn wir die Methode add des Objekts OcrInput verwenden. Es können beliebig viele Bilder hinzugefügt werden. Die Funktion "Lesen" im Objekt "IronTesseract", das wir zuvor konstruiert haben, kann verwendet werden, um die Bilder zu erhalten, indem die Bilddatei geparst und das Ergebnis in das OCR-Ergebnis extrahiert wird. Es ist in der Lage, Text aus Fotos zu extrahieren und in eine Zeichenkette zu konvertieren.

Wir können auch Tesseract verwenden, um Bilder mit mehreren Bildern hinzuzufügen. die Methode "AddMultiFrameTiff" ist eine andere Methode für diesen Vorgang. Die Tesseract-Bibliothek liest jedes Einzelbild des Bildes, und jedes Einzelbild wird als eine eigene Seite behandelt. Der Prozess liest das erste Bild und fährt dann mit dem nächsten Bild fort, bis alle Bilder des Bildes gescannt worden sind. Nur das TIFF-Bildformat wird von dieser Methode unterstützt.

Ein Vergleich zwischen IronOCR und Aspose.OCR - Abbildung 74: IronOCR-Installation

IronOCR-Installation

Das obige Bild ist die Ausgabe des IronOCR-Ergebnisses, das die Daten genau in bearbeitbaren Text umgewandelt hat.

5.0 OCR-PDF-Dateien

IronOCR und Aspose.OCR konvertieren PDF-Dateien in bearbeitbaren Text. Aspose.OCR bietet dem Benutzer eine Reihe von Optionen, z. B. Speichern der Seite, Bearbeiten des Bildes, Erkennen der Seite usw. Es bietet auch Speicheroptionen wie Text, Dokument, HTML-Format, etc. IronOCR ermöglicht es uns auch, eine konvertierte OCR-Datei in HTML, Text, PDF usw. zu speichern.

5.1 Aspose.OCR verwenden

Aspose.OCR bietet die Methode RecognizePdf, die Text in den Bildern erkennen kann, die aus gescannten PDF-Dateien extrahiert wurden. Die Methode RecognizePdf nimmt den PDF-Pfad als Parameter und das Objekt DocumentRecognitionSettings. Der folgende Codeschnipsel demonstriert die Verwendung der Methode "RecognizePdf" zur Erkennung von Bildern aus einer gescannten mehrseitigen PDF-Datei.

// The path to the PDF file
string dataDir = RunExamples.GetDataDir_OCR();
// Archive Path
string fullPath = dataDir + "OCR.pdf";
// Recognize images from PDF           
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
            set.DetectAreas = false;
    List<RecognitionResult> result = api.RecognizePdf(imgPath, set);
// Print result
int pageNumber = 0;
    foreach (var page in result)
    {                
        System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
    }
// The path to the PDF file
string dataDir = RunExamples.GetDataDir_OCR();
// Archive Path
string fullPath = dataDir + "OCR.pdf";
// Recognize images from PDF           
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
            set.DetectAreas = false;
    List<RecognitionResult> result = api.RecognizePdf(imgPath, set);
// Print result
int pageNumber = 0;
    foreach (var page in result)
    {                
        System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
    }
' The path to the PDF file
Dim dataDir As String = RunExamples.GetDataDir_OCR()
' Archive Path
Dim fullPath As String = dataDir & "OCR.pdf"
' Recognize images from PDF           
Dim [set] As New DocumentRecognitionSettings()
			[set].DetectAreas = False
	Dim result As List(Of RecognitionResult) = api.RecognizePdf(imgPath, [set])
' Print result
Dim pageNumber As Integer = 0
	For Each page In result
'INSTANT VB WARNING: An assignment within expression was extracted from the following statement:
'ORIGINAL LINE: System.Console.WriteLine(string.Format("Page: {0} text: {1}", pageNumber++, page.RecognitionText));
		System.Console.WriteLine($"Page: {pageNumber} text: {page.RecognitionText}")
		pageNumber += 1
	Next page
VB   C#

5.2 Verwendung von IronOCR

Wir können auch OCRInput verwenden, um PDF-Dateien zu verwalten. Jede Seite eines Dokuments wird von der Klasse IronTesseract gelesen. Der Text wird dann aus den Seiten extrahiert. Wir können geschützte Dokumente auch mit einer zweiten Funktion namens AddPDF öffnen, mit der wir PDFs zu unserer Dokumentenliste hinzufügen können (passwort, wenn es geschützt ist). Der folgende Code zeigt, wie ein kennwortgeschütztes PDF-Dokument geöffnet werden kann:

var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract() ' nothing to configure
Using Input = New OcrInput()
	Input.AddPdf("example.pdf", "password")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

Mit AddPdfPage können wir den Inhalt einer einzelnen Seite in einem PDF-Dokument lesen und extrahieren. Es muss nur die Seitenzahl angegeben werden, aus der wir den Text extrahieren wollen. mit AddPdfPage können wir Text aus zahlreichen Seiten extrahieren, die wir angeben. In IEnumerable&lt;int&gt; können wir leicht mehrere Seiten angeben. Wir müssen auch den Speicherort der Datei sowie die Erweiterung der Datei angeben. Dies wird im folgenden Codebeispiel veranschaulicht:

IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
Dim numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
 Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	'single page
	Input.AddPdfPage("example.pdf",10)
	'Multiple page
	Input.AddPdfPages("example.pdf", numbers)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Result.SaveAsTextFile("ocrtext.txt")
End Using
VB   C#

Mit der Funktion SaveAsTextFile können wir das Ergebnis als Textdatei speichern, was uns erlaubt, die Datei in den Pfad des Ausgabeverzeichnisses herunterzuladen. Außerdem können wir die Datei mit SaveAsHocrFile in einer HTML-Datei speichern.

6.0 Sonstige Merkmale

6.1 Aspose.OCR verwenden

Aspose.OCR verfügt über einige zusätzliche Optionen wie Draw Text Area, Draw Picture Area, Draw Table Area, Draw Recognize Area, etc. Sie alle helfen dem Benutzer, die Leistung der OCR zu verbessern. Die Anwendung führt nicht nur OCR durch, sondern wir sind auch in der Lage, Operationen wie das Kombinieren von PDFs, das Teilen von PDFs, das Bearbeiten von PDFs usw. durchzuführen.

6.2 Verwendung von IronOCR

IronOCR verfügt über einzigartige Funktionen, mit denen wir Barcodes und QR-Codes von gescannten Dokumenten lesen können. Die folgenden Codes zeigen, wie wir einen Barcode aus einem bestimmten Bild oder Dokument lesen können.

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("barcode.gif")
	Dim Result = Ocr.Read(Input)

	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
VB   C#

Der obige Code hilft, einen Barcode aus einem bestimmten Bild oder PDF-Dokument zu lesen. Es kann mehr als einen Barcode von einer Seite/einem Bild lesen. Um den Barcode zu lesen, hat IronOCR eine einzigartige Einstellung, Ocr.Configuration.ReadBarCodes. Der Standardwert ist auf false gesetzt.

Nach dem Lesen der Eingaben werden die Daten in dem Objekt "OCRResult" gespeichert. Diese hat eine Eigenschaft namens Barcodes und enthält alle verfügbaren Barcodedaten in einer Liste. Mithilfe der "Foreach"-Schleife können wir alle Barcode-Details einzeln abrufen. Außerdem wird der Barcode gescannt und der Wert des Barcodes gelesen - zwei Vorgänge, die in einem Arbeitsgang erledigt werden.

Es wird auch Threading-Optionen unterstützen. Wir können mehrere OCR-Prozesse auf einmal durchführen. IronOCR ist auch in der Lage, einen bestimmten Bereich aus einer bestimmten Region zu erkennen.

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
} 
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
} 
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	Input.Add("document.png", ContentArea)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

Der obige Code ist ein Beispiel für die Durchführung von OCR in einer bestimmten Region. Wir müssen nur den rechteckigen Bereich im Bild oder PDF angeben. Die Tesseract-Engine in IronOCR hilft uns, den Text zu erkennen.

IronOCR und Aspose.OCR Lizenzierungsmodelle und Preisgestaltung

IronOCR Lizenzmodelle und Preise

Eine 30-tägige Geld-zurück-Garantie: IronOCR bietet eine 30-tägige Geld-zurück-Politik. Wenn Sie also nach dem Kauf der Software Ihre Meinung ändern, können Sie Ihr Geld innerhalb von 30 Tagen zurückfordern.

Einfache Integration: Die Integration von IronOCR in ein Projekt und eine Umgebung ist so einfach, dass es ausreicht, eine einzige Codezeile zu schreiben und sie aus dem NuGet-Paket hinzuzufügen. Oder wir können sie aus dem Internet herunterladen und auf diese Weise in unsere Umgebung integrieren.

Dauerlizenzierung: Jede Lizenz wird einmal erworben und muss nicht erneuert werden.

Kostenloser Support und Produkt-Updates: Jede Lizenz beinhaltet ein Jahr lang kostenlose Produkt-Updates und Support durch das Team, das hinter dem Produkt steht. Es ist jederzeit möglich, Erweiterungen zu erwerben. Erweiterungen können eingesehen werden.

Sofortige Lizenzen: Registrierte Lizenzschlüssel werden versandt, sobald die Zahlung eingegangen ist.

Alle Lizenzen sind unbefristet und gelten für Entwicklung, Staging und Produktion.

Das Lite-Paket

  • 1 Entwickler
  • 1 Standort
  • 1 Projekt
  • Unbefristete Lizenz

    Mit diesem Paket kann ein einzelner Softwareentwickler in einem Unternehmen die Iron Software an einem einzigen Ort nutzen. Es kann in einer einzelnen Webanwendung, Intranetanwendung oder einem Desktop-Softwareprogramm verwendet werden. Lizenzen sind nicht übertragbar und können nicht außerhalb einer Organisation oder einer Agentur-/Kundenbeziehung weitergegeben werden. Dieser Lizenztyp, wie auch alle anderen Lizenztypen, schließt ausdrücklich alle Rechte aus, die nicht ausdrücklich im Rahmen der Vereinbarung gewährt werden, ohne OEM-Weitergabe und Nutzung von Iron Software als SaaS ohne Erwerb einer zusätzlichen Abdeckung.

    Preise: Beginnt bei 499 $ pro Jahr.

Die Berufslizenz

  • 10 Entwickler
  • 10 Standorte
  • 10 Projekte
  • Unbefristete Lizenz

    Dadurch kann eine festgelegte Anzahl von Softwareentwicklern in einem Unternehmen diese Iron Software an einzelnen Standorten nutzen, bis zu einer Höchstzahl von zehn. IronOCR kann in beliebig vielen Websites, Intranetanwendungen oder Desktop-Softwareanwendungen verwendet werden. Dieser Lizenztyp, wie auch alle anderen Lizenztypen, schließt ausdrücklich alle Rechte aus, die nicht ausdrücklich im Rahmen der Vereinbarung gewährt werden, einschließlich der OEM-Weiterverbreitung und der Nutzung der Iron Software als SaaS ohne den Erwerb einer zusätzlichen Abdeckung. Diese Lizenz kann in ein einzelnes Projekt integriert werden, bis zu einer Höchstzahl von 10.

    Preisgestaltung: Ab $999 pro Jahr.

Die Unbegrenzte Lizenz

  • Unbegrenzt viele Entwickler
  • Unbegrenzte Anzahl von Standorten
  • Unbegrenzte Projekte
  • Unbefristete Lizenz

    Dies ermöglicht es einer unbegrenzten Anzahl von Softwareentwicklern in einem Unternehmen, diese Iron Software an einer unbegrenzten Anzahl von Standorten zu nutzen. Sie kann in beliebig vielen Websites, Intranetanwendungen oder Desktop-Softwareanwendungen verwendet werden. Lizenzen sind nicht übertragbar und können nicht außerhalb einer Organisation oder einer Agentur/Kundenbeziehung weitergegeben werden. Dieser Lizenztyp, wie auch alle anderen Lizenztypen, schließt ausdrücklich alle Rechte aus, die nicht ausdrücklich im Rahmen der Vereinbarung gewährt werden, einschließlich der OEM-Weitergabe und der Nutzung der Iron Software als SaaS ohne Erwerb einer zusätzlichen Abdeckung.

    Preise: Ab $2999 pro Jahr.

    Royalty-Free Redistribution - Dies erlaubt Ihnen, diese Iron Software als Teil einer Reihe von unterschiedlich verpackten kommerziellen Produkten zu vertreiben (ohne Lizenzgebühren zahlen zu müssen) basierend auf der Anzahl der Projekte, die von der Basislizenz abgedeckt werden. Sie ermöglicht die Bereitstellung der Iron Software im Rahmen von SaaS-Software-Services, basierend auf der Anzahl der Projekte, die von der Basislizenz abgedeckt werden.

    Preise: Beginnt bei $1599 pro Jahr.

    Ein Vergleich zwischen IronOCR und Aspose.OCR - Abbildung 8: Preisgestaltung

    Preisgestaltung

Aspose Lizenzmodelle und Preisgestaltung

Die Entwickler-Kleinunternehmerlizenz

Eine Entwickler-Kleinunternehmenslizenz erlaubt es einem Entwickler, mit dem Produkt eine unbegrenzte Anzahl von Endbenutzersoftware zu erstellen und sie nur an einem physischen Standort innerhalb seiner Organisation zu installieren. Wenn Sie Software für Endbenutzer bereitstellen, müssen Sie für jeden Entwickler in Ihrem Entwicklungsteam oder für jeden physischen Standort, an dem die Software verwendet wird, eine Lizenz erwerben. Die Entwicklerlizenz für kleine Unternehmen erlaubt es Ihnen nicht, Ihre Endbenutzer-Software an Dritte, öffentliche Websites und Anwendungen, Extranets, Intranets mit mehreren Standorten oder Software as a Service weiterzugeben (SaaS) projekt-Nutzungsszenarien. Sie können die Anwendungen, die Sie mit einer OEM-Lizenz entwickeln, nur auf einem einzigen Client einsetzen. Wenn Sie Bibliotheken zur Verwendung durch andere Unternehmen erstellen oder Ihre Kreationen als Open-Source-Software verbreiten wollen, benötigen Sie eine andere Art von Lizenz.

Preisgestaltung: Ab 799 $ pro Jahr.

Die OEM-Lizenz für Entwickler

Die OEM-Lizenz für Entwickler bedeutet, dass ein Entwickler das Produkt auf einer beliebigen Anzahl von Computern an einem beliebigen Standort verwenden kann. Wenn Sie also in einem Büro arbeiten, aber eine Stunde lang in einem anderen Büro etwas erledigen müssen, ist das mit dieser Art von Lizenz möglich. Eine OEM-Entwicklerlizenz deckt einen Hersteller von Softwareprodukten ab - d. h. jemanden, der kein autorisierter Händler des Produkts ist, sondern Software herstellt, die dessen Funktionen nutzt. Um Endbenutzer-Software an einen Endbenutzer weiterzugeben, benötigen Sie diesen Lizenztyp. Um die Verteilung von Endbenutzer-Software an Dritte, öffentlich zugängliche Websites/Anwendungen, Extranets, Intranets mit mehreren Standorten oder SaaS-Projektnutzungsszenarien zu ermöglichen, muss für jeden Entwickler im Entwicklungsteam eine Entwicklerlizenz erworben werden. Diese Lizenz unterstützt nicht die Erstellung von Software wie z. B. einer API oder eines SDK für Endbenutzer.

Preise: Beginnt bei $2397 pro Jahr.

Die Site Small Business License

Eine Site Small Business-Lizenz erlaubt es bis zu zehn Entwicklern, mit dem Produkt eine unbegrenzte Anzahl von Endbenutzer-Software zu erstellen, die an jedem Ihrer zehn physischen Standorte verwendet werden kann (z. B. getrennte Bürogebäude oder, wenn Sie kein Unternehmen mit mehreren Büros sind, ein beliebiger physischer Standort). Wenn Sie mehr als zehn Entwickler haben oder Aspose an mehr als zehn Standorten einsetzen möchten, können Sie eine Mehrplatzlizenz für kleine Unternehmen erwerben. Diese Lizenz unterstützt nicht die Weitergabe der mit dieser Lizenz erstellten Software an andere Organisationen.

Preisgestaltung: Ab 3995 $ pro Jahr.

Gemessene OEM-Lizenz

Eine Metered OEM-Lizenz unterstützt eine unbegrenzte Anzahl von Entwicklern, eine unbegrenzte Anzahl von Standorten und eine unbegrenzte Anzahl von Endbenutzer-Software. Sie ermöglicht es den Benutzern, die Endbenutzersoftware an Dritte weiterzugeben. Die kostenpflichtige OEM-Lizenz ist für öffentlich zugängliche Websites/Apps und kann zur Unterstützung von Extranets oder SaaS-Projekten verwendet werden. Sie erstellt Endbenutzersoftware, die in einer Entwicklungsbibliothek mit einer API oder einem SDK verwendet wird.

Preisgestaltung: Ab $1999 pro Jahr.

Ein Vergleich zwischen IronOCR und Aspose.OCR - Abbildung 9: Aspose Preisgestaltung

Aspose Preisgestaltung

Die IronOCR Lite-Lizenz einschließlich eines Entwicklerpakets mit einem Jahr Support kostet rund 499 US-Dollar, während Aspose.OCR mit einem Entwicklerpaket 799 US-Dollar mit kostenlosem technischen Support und 1.198 US-Dollar mit kostenpflichtigem Support kostet. Die IronOCR Professional-Lizenz, die 10 Entwicklerpakete und ein Jahr Support beinhaltet, kostet $999, während die Aspose Site OEM-Lizenz, die 10 Entwicklerpakete beinhaltet, $11.186 pro Jahr mit kostenlosem technischem Support kostet, während bezahlte technische Releases und Updates diese Zahl auf $23.171 erhöhen.

Die IronOCR Lite und Professional Pakete haben SaaS-Service oder OEM und eine 5-Jahres-Supportoption. Das Lite-Paket, das ein Ein-Entwickler-Paket mit 5-Jahres-Support sowie SaaS- und OEM-Service umfasst, kostet 2.897 US-Dollar, während Aspose SaaS- oder OEM-Service und kundenspezifische Support-Optionen bietet. Die IronOCR Professional-Lizenz umfasst ein 10-Entwickler-Paket mit einem Jahr kostenpflichtigem Support sowie SaaS- und OEM-Service zum Preis von 23.171 US-Dollar, während Aspose ein 10-Entwickler-Paket ohne Support, aber mit SaaS- und OEM-Service zum Preis von 11.186 US-Dollar anbietet.

7.0 Schlussfolgerung

IronOCR im Kontext des .NET-Frameworks bietet Tesseract, das unkompliziert und einfach zu bedienen ist. Es unterstützt Fotos und PDF-Dokumente auf vielfältige Weise. Außerdem bietet es eine Reihe von Einstellungen zur Verbesserung der Leistung der Tesseract OCR-Bibliothek. Verschiedene Sprachen werden in einem einzigen Arbeitsgang unterstützt. Wenn Sie mehr über Tesseract OCR erfahren möchten, besuchen Sie die Website des Unternehmens.

Aspose OCR ist eine Softwareanwendung, die eine künstliche Intelligenz verwendet, um Bilder und PDF-Dokumente zu erkennen. Es bietet auch verschiedene Einstellungen, um die Leistung des OCR-Prozesses zu verbessern. Außerdem bietet es die Möglichkeit, mehrere Sprachen auszuwählen und dann OCR durchzuführen. Aspose hat einige Einschränkungen bei der Verwendung von Seitenumwandlungen. Es hat auch einen unterschiedlichen Preis für verschiedene Betriebssysteme.

IronOCR-Pakete bieten im Vergleich zu Aspose eine bessere Lizenzierung und Unterstützung. Außerdem ist Aspose teurer. IronOCR kostet ab 499 $, während Aspose bei 999 $ pro Jahr beginnt. Außerdem bietet IronOCR im Vergleich zu Aspose mehr Funktionen und unterstützt mehrere Plattformen zu einem einzigen Preis.

Also, worauf warten Sie noch? Der kostenlose Test ist für alle zugänglich. Sie können die lizenz hier und beginnen Sie sofort.

< PREVIOUS
Ein Vergleich zwischen IronOCR und Nanonets OCR
NÄCHSTES >
Ein Vergleich zwischen IronOCR und Syncfusion OCR

Sind Sie bereit, loszulegen? Version: 2024.10 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 2,561,036 Lizenzen anzeigen >