VERGLEICH MIT ANDEREN KOMPONENTEN

Ein Vergleich zwischen IronOCR und Asprise OCR

Veröffentlicht 8. Juni 2022
Teilen Sie:

Wenn wir von OCR sprechen, ist damit die optische Zeichenerkennung gemeint. Der Begriff wird in der Geschäftswelt häufig verwendet, um den Prozess der Konvertierung eines Bildes oder einer grafischen Darstellung eines beliebigen textbasierten Dokuments zu beschreiben (z.B. eine gescannte oder gefaxte Seite) mit Hilfe von Computersoftware in ein bearbeitbares Textformat oder ein durchsuchbares Dokumentformat umgewandelt werden.

Die Abkürzung OCR steht für Optical Character Recognition (optische Zeichenerkennung), eine Aufgabe, die von einer speziell für diesen Zweck entwickelten Computersoftware ausgeführt wird. Diese Art von Software scannt die Seite und erkennt alle Textinformationen, die sich darauf befinden, und wandelt sie in eine digitale Form um, so dass sie ohne Qualitätsverluste bearbeitet und digital reproduziert werden können.

Es gibt viele Anwendungen für OCR, aber der beliebteste Anwendungsfall ist die Umwandlung gescannter Dokumente in digitale Dateien, die formatiert und in Datenbanken indiziert und analysiert werden können. Andere Beispiele sind die Umwandlung von handschriftlichen Notizen in getippte Notizen und die Umwandlung von Text auf Visitenkarten in die entsprechenden Kontaktinformationen.

In diesem Artikel werden wir zwei der gängigsten Bibliotheken und Anwendungen für OCR und PDF-Dokumente vergleichen. Diese sind:

  • Asprise OCR
  • IronOCR

1.0 Einführung

1.1 Asprise OCR Einführung und Funktionen

Die Asprise C# .NET OCR (optische Zeichenerkennung) und Barcode-Erkennung SDK bietet eine leistungsstarke API-Bibliothek, mit der Sie Ihre C# .NET-Anwendungen ausstatten können (Windows-Anwendungen, Silverlight, ASP.NET-Webdienstanwendungen, ActiveX-Steuerungen usw.) mit der Funktion, Text- und Barcode-Informationen aus gescannten Dokumenten zu extrahieren.

Sie können Bilder konvertieren (in verschiedenen Formaten wie JPEG, PNG, TIFF, PDF, usw.) in bearbeitbare Dokumentenformate (Word, XML, durchsuchbares PDF, etc.). Zusammen mit anderen Angeboten wie dem Asprise Image Scanning SDK (das Dokumente von Scannern erfasst)können Sie problemlos vollständige Dokumentenmanagementlösungen implementieren.

Die Merkmale von Asprise OCR

Genaue Texterkennung

Mit verbesserten Bildverarbeitungs- und Texterkennungsalgorithmen kann Asprise OCR auch schwierige Dokumente mit schlechter Bildqualität problemlos erkennen. Die Parameter können so eingestellt werden, dass die Genauigkeit gegenüber der Geschwindigkeit leicht bevorzugt wird.

Hochgeschwindigkeits-OCR-Engine

Asprise OCR verwendet eine optimierte OCR-Engine, um eine hervorragende Erkennung innerhalb eines kurzen Zeitrahmens durchzuführen. Die Geschwindigkeit kann durch Multithreading und optionale GPU-Beschleunigung weiter erhöht werden.

20+ unterstützte Sprachen

Asprise OCR erkennt über 20 Sprachen wie Englisch, Spanisch, Französisch, Deutsch, Italienisch, Ungarisch, Finnisch, Schwedisch, Rumänisch, Polnisch, Malaiisch, Arabisch, Indonesisch und Russisch.

Alle gängigen Barcode-Formate

Alle gängigen Barcodeformate werden unterstützt: EAN-8, EAN-13, UPC-A, UPC-E, ISBN-10, ISBN-13, Interleaved 2 of 5, Code 39, Code 128, PDF417 und QR-Code.

Bilder in durchsuchbares PDF

Mit ein paar Zeilen Code können Sie verschiedene Bildformate wie JPEG, PNG, TIFF und PDF in durchsuchbare PDF-Dateien umwandeln.

Einfache Bereitstellung

Kein Software-Schutz-Dongle, kein Lizenzierungsserver erforderlich. Der Einsatz von Asprise OCR SDK ist so einfach, wie Sie damit entwickeln.

Budgetfreundlich, lizenzfrei

Lizenzgebührenfrei bedeutet, dass Sie bei der Bestellung einer Entwicklungslizenz zahlen, aber Sie müssen nicht noch einmal zahlen, wenn Sie Ihre Software auf Tausenden von Servern oder bei Tausenden von Endbenutzern einsetzen.

Ausgezeichneter Support

Ihr Team ist nicht nur freundlich, sondern auch in der Lage, Ihnen einen erstklassigen technischen Support zu bieten.

1.2 IronOCR - Einführung und Funktionen

IronOCR bietet Software für Ingenieure, die IronOCR for .NET zum Lesen von Textinhalten aus Fotos und PDFs in .NET-Anwendungen und Websites verwenden. Es scannt Fotos nach Text und Barcodes und unterstützt zahlreiche Sprachen weltweit; die Ausgabe kann dann entweder als reiner Text oder als strukturierte Daten erfolgen. Die OCR-Bibliothek von Iron Software kann in MVC-, Web-, Konsolen- und Desktop-.NET-Anwendungen verwendet werden. Für kommerzielle Einsätze wird die Lizenzierung mit direkter Unterstützung durch das Entwicklungsteam durchgeführt.

  • Mit der neuesten Tesseract 5-Engine liest IronOCR Text, Barcodes und QR-Codes aus jedem Bild- oder PDF-Format. Diese Bibliothek erweitert Desktop-, Konsolen- und Webanwendungen schnell um OCR.
  • IronOCR unterstützt 127 internationale Sprachen. Es unterstützt auch benutzerdefinierte Sprach- und Wortlisten.
  • IronOCR ist in der Lage, mehr als 20 Barcodeformate und QR-Codes zu lesen.
  • IronOCR unterstützt mehrseitige Gifs und Tiff-Bildformate.
  • IronOCR bietet Korrekturen für gescannte Bilder von schlechter Qualität.
  • IronOCR unterstützt Multithreading - es führt einen oder mehrere Prozesse gleichzeitig aus.
  • IronOCR kann strukturierte Datenausgaben für Seiten, Absätze, Zeilen, Wörter, Zeichen usw. liefern.
  • IronOCR unterstützt eine Vielzahl von Betriebssystemen wie Windows, Linux, macOS, etc.

2.0 Erstellen eines neuen Projekts in Visual Studio

Öffnen Sie die Visual Studio-Software und gehen Sie zum Menü "Datei". Wählen Sie "Neues Projekt" und dann "Konsolenanwendung".

Geben Sie den Projektnamen ein und wählen Sie den Dateipfad in dem entsprechenden Textfeld aus. Klicken Sie dann auf die Schaltfläche "Erstellen" und wählen Sie das gewünschte .NET-Framework aus, wie in der folgenden Abbildung dargestellt.

Das Visual Studio-Projekt generiert nun die Struktur für die ausgewählte Anwendung, und wenn Sie die Konsolen-, Windows- und Webanwendung ausgewählt haben, wird nun die Datei program.cs geöffnet, in die Sie den Code eingeben und die Anwendung erstellen/ausführen können.

Als nächstes können wir die Bibliothek hinzufügen, um den Code zu testen.

3.0 Installieren

3.1 Installieren Installieren Sie Asprise OCR

Wir können die Asprise OCR herunterladen hier.

Es gibt zwei Möglichkeiten: Installation mit NuGet oder manuelles Herunterladen des SDK von asprise.com.

Möglichkeit 1: NuGet PM> Install-Package asprise-ocr-api

Erstellen Sie zunächst eine neue Visual C#/Visual Basic Windows Form Application oder verwenden Sie ein bestehendes Projekt. Wenn diese Lösung geöffnet ist, öffnen Sie die NuGet-Paketmanager-Konsoleund geben Sie den folgenden Befehl ein:

Install-Package asprise-ocr-api

Danach können Sie das OCR-Demoformular aufrufen, indem Sie den folgenden Code in Program.cs kopieren (für C#):

static class Program 
{ 
    [STAThread]
    static void Main() {
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
static class Program 
{ 
    [STAThread]
    static void Main() {
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
Friend Module Program
	<STAThread>
	Sub Main()
		Application.EnableVisualStyles()
		Application.SetCompatibleTextRenderingDefault(False)
		Application.Run(New asprise_ocr_api.OcrSampleForm())
	End Sub
End Module
VB   C#

Option 2: Laden Sie das OCR SDK von Asprise.com herunter

Laden Sie eine Kopie des Asprise OCR SDK von www.asprise.com/product/ocr. Entpacken Sie sie einfach in einen leeren Ordner.

Die Dateiorganisation der Asprise OCR SDK Distribution ist wie folgt:


OCR SDK

--- aocr.dll, aocr_x64.dll [erforderliche DLL]

--- Beispiel-Projekte [.NET API und Beispielprojekt]

+--- Bilder [Beispielbilder]

Navigieren Sie zum Ordner sample-projects und öffnen Sie die Lösung: ocr-samples-vs.sln. Es gibt zwei Projekte:

  • asprise-ocr-api: die .NET OCR API
  • asprise-ocr-api-sample: Demo-Programm

    Klicken Sie mit der rechten Maustaste auf das Projekt asprise-ocr-api-sample und wählen Sie "Set as StartUp Project", dann klicken Sie auf die Schaltfläche "Start" oder drücken Sie F5 und Sie sehen die gleiche Benutzeroberfläche wie abgebildet.

3.2 IronOCR installieren

IronOCR Library kann auf vier Arten heruntergeladen und installiert werden.

Diese sind:

  • Verwendung von Visual Studio
  • Verwendung der Visual Studio-Befehlszeile.
  • Direkter Download von der NuGet-Website.
  • Direktes Herunterladen von der IronPDF-Website.

3.2.1 Verwendung von Visual Studio

Visual Studio bietet die Option NuGet Package Manager, um das Paket direkt in der Lösung zu installieren. Der folgende Screenshot zeigt, wie Sie den NuGet Package Manager öffnen.

Es bietet ein Suchfeld, um die Liste der Pakete von der NuGet-Website anzuzeigen. Im Paketmanager müssen wir nach dem Schlüsselwort IronOCR suchen, wie im folgenden Screenshot dargestellt:

In der obigen Abbildung sehen Sie die Liste der verwandten Suchbegriffe. Wir müssen die gewünschte Option auswählen, um das Paket in der Lösung zu installieren.

3.2.2 Verwendung der Visual Studio-Befehlszeile

Gehen Sie in Visual Studio zu Werkzeuge -> NuGet-Paketmanager -> Paketmanager-Konsole

Geben Sie auf der Registerkarte Paketmanager-Konsole die folgende Zeile ein:

Install-Package IronOcr

Anschließend wird das Paket in das aktuelle Projekt heruntergeladen/installiert und ist sofort einsatzbereit.

3.2.3 Direkter Download von der NuGet-Website

Die dritte Möglichkeit ist, das NuGet-Paket direkt von der Website herunterzuladen.

  • Navigieren Sie zum Link.
  • Wählen Sie im Menü auf der rechten Seite die Option Paket herunterladen.
  • Doppelklicken Sie auf das heruntergeladene Paket. Sie wird automatisch installiert.
  • Laden Sie anschließend die Lösung neu und verwenden Sie sie im Projekt.

3.2.4 Direktes Herunterladen von der IronOCR-Website

Klicken Sie auf die link hier, um das neueste Paket direkt von der Website herunterzuladen. Führen Sie nach dem Download die folgenden Schritte aus, um das Paket zum Projekt hinzuzufügen.

  • Klicken Sie mit der rechten Maustaste auf das Projekt im Lösungsfenster.
  • Wählen Sie dann die Option Referenz und suchen Sie den Speicherort der heruntergeladenen Referenz.
  • Klicken Sie anschließend auf OK, um die Referenz hinzuzufügen.

4.0 OCR-Bild

Sowohl IronOCR als auch Asprise OCR verfügen über eine OCR-Technologie, mit der Bilder in Text umgewandelt werden können.

4.1 Verwendung von Asprise

Der folgende Code demonstriert die grundlegende Verwendung von Asprise OCR.

using asprise_ocr_api;
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
Console.WriteLine("OCR Result: " + s);
// process more images here ...
ocr.StopEngine();
using asprise_ocr_api;
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
Console.WriteLine("OCR Result: " + s);
// process more images here ...
ocr.StopEngine();
Imports asprise_ocr_api
AspriseOCR.SetUp()
Dim ocr As New AspriseOCR()
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST)
Dim s As String = ocr.Recognize("C:\path\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT)
Console.WriteLine("OCR Result: " & s)
' process more images here ...
ocr.StopEngine()
VB   C#

Asprise OCR unterstützt die folgenden Bildformate: GIF, PNG, JPEG, TIFF und PDF. Für den OCR-Beispielcode im obigen Abschnitt sieht die Eingabe wie folgt aus:

Die OCR-Ausgabe erfolgt im Klartextformat:


Asprise OCR und Barcode-Erkennung

Leistungsstarke, lizenzgebührenfreie OCR- und Barcode-Erkennung unter Windows,

...

ISBN-l3, Interleaved 2 of 5, Code 39, Code 128, PDF417 und QR-Code.

[[QR-Code: www.asprise.com]]

[[CODE-128: Asprise]].

Die letzten beiden Zeilen stellen den Auszug der Barcode-Informationen dar. Hinweis: Sowohl das Format als auch der Inhalt des Strichcodes sind in '[[ ]]' Paare.

4.2 Verwendung von IronOCR

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("3.png")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Console.ReadKey()
End Using
VB   C#

Die Tesseract 5 API, mit der wir Bilddateien in Text umwandeln können, wird oben demonstriert. In der obigen Codezeile erstellen wir ein Objekt für Iron Tesseract. Wir erstellen auch ein OcrInput-Objekt, mit dem wir eine oder mehrere Bilddateien hinzufügen können. Es kann sein, dass wir den verfügbaren Bildpfad im Code angeben müssen, wenn wir die Methode add des OcrInput-Objekts verwenden. Es können beliebig viele Bilder hinzugefügt werden. Die Funktion "Lesen" im Objekt Irontesseract, das wir zuvor konstruiert haben, kann verwendet werden, um die Bilder zu erhalten, indem die Bilddatei geparst und das Ergebnis in das OCR-Ergebnis extrahiert wird. Es ist in der Lage, Text aus Fotos zu extrahieren und in eine Zeichenkette zu konvertieren.

Wir können auch Tesseract verwenden, um Bilder mit mehreren Bildern hinzuzufügen. "AddMultiFrameTiff" ist eine andere Methode für diesen Vorgang. Die Tesseract-Bibliothek liest jedes Einzelbild des Bildes, und jedes Einzelbild wird als eine eigene Seite behandelt. Der Prozess liest das erste Bild und fährt dann mit dem nächsten Bild fort, bis alle Bilder des Bildes gescannt worden sind. Nur das Tiff-Bildformat wird von dieser Methode unterstützt.

Das obige Bild ist die Ausgabe des IronOCR-Ergebnisses, das die Daten präzise in bearbeitbaren Text umgewandelt hat.

5.0 OCR-PDF-Dateien

IronOCR und Asprise OCR konvertieren PDF-Dateien in bearbeitbaren Text. Asprise OCR stellt dem Benutzer eine Liste von Optionen zur Verfügung, wie z.B. das Speichern der Seite, das Bearbeiten des Bildes, das Erkennen der Seite, usw. Es bietet auch Speicheroptionen wie Text, Dokument, HTML-Format, etc. IronOCR ermöglicht es uns auch, die konvertierte OCR-Datei in HTML, Text, PDF, etc. zu speichern.

5.1 Verwendung von Asprise OCR

Wenn Sie das Ausgabeformat als OUTPUT_FORMAT_PDF festlegen, müssen Sie die PDF-Ausgabedatei als Ziel angeben:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf
PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf
PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, "PROP_PDF_OUTPUT_FILE=ocr-result.pdf PROP_PDF_OUTPUT_TEXT_VISIBLE=true")
VB   C#

Im obigen Code werden die Eigenschaften in einer einzigen Zeichenkette angegeben, die durch (mit Schlüssel und Wert getrennt durch =). Alternativ können Sie die Eigenschaften auch paarweise getrennt angeben:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf", AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, True)
VB   C#

Um den Text unsichtbar oder transparent zu machen, setzen Sie PROP_PDF_OUTPUT_TEXT_VISIBLE einfach auf "false". Sowohl normales PDF als auch PDF/A werden unterstützt. Bitte beachten Sie die Asprise OCR Property Summary. Legen Sie das Ausgabeformat als OUTPUT_FORMAT_RTF fest. Sie können dann .rtf-Dateien ausgeben, die in den meisten Textverarbeitungsprogrammen bearbeitet werden können (Microsoft Word, Libre Office, TextEdit, usw.).

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF, "PROP_RTF_OUTPUT_FILE=ocr-result.rtf")
VB   C#

Sobald die OCR abgeschlossen ist, können Sie die RTF-Datei in einem Textverarbeitungsprogramm anzeigen oder bearbeiten:

Mit der folgenden Methode führen Sie OCR an einer PDF-Eingabedatei durch:

5.2 Verwendung von IronOCR

Wir können OCRInput auch zur Verwaltung von PDF-Dateien verwenden. Jede Seite der Dokumente wird von der Klasse Iron Tesseract gelesen werden. Der Text wird dann aus den Seiten extrahiert. Wir können geschützte Dokumente auch mit einer zweiten Funktion namens "AddPDF" öffnen, mit der wir PDFs zu unserer Dokumentenliste hinzufügen können (passwort, wenn es geschützt ist). Der folgende Code zeigt, wie ein kennwortgeschütztes PDF-Dokument geöffnet werden kann:

var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract() ' nothing to configure
Using Input = New OcrInput()
	Input.AddPdf("example.pdf", "password")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

Mit "Addpdfpage" können wir den Inhalt einer einzelnen Seite in einem PDF-Dokument lesen und extrahieren Es muss nur die Seitenzahl angegeben werden, aus der wir den Text extrahieren wollen. mit "AddPdfPage" können wir Text aus zahlreichen Seiten extrahieren, die wir angeben. In IEnumerablekönnen wir problemlos mehrere Seiten angeben. Wir müssen auch den Speicherort der Datei sowie die Erweiterung der Datei angeben. Dies wird im folgenden Codebeispiel veranschaulicht:

IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
Dim numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
 Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	'single page
	Input.AddPdfPage("example.pdf",10)
	'Multiple page
	Input.AddPdfPages("example.pdf", numbers)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Result.SaveAsTextFile("ocrtext.txt")
End Using
VB   C#

Mit der Funktion SaveAsTextFile können wir das Ergebnis als Textdatei speichern, so dass wir die Datei in den Pfad des Ausgabeverzeichnisses herunterladen können. Außerdem können wir die Datei mit SaveAsHocrFile in einer HTML-Datei speichern.

6.0 Sonstige Merkmale

6.1 Verwendung von Asprise OCR

Asprise OCR hat einige zusätzliche Optionen, wie z.B. Textbereich zeichnen, Bildbereich zeichnen, Tabellenbereich zeichnen, Erkennungsbereich zeichnen, usw. Sie alle helfen dem Benutzer, die Leistung der OCR zu verbessern. Die Anwendung führt nicht nur OCR durch, sondern wir sind auch in der Lage, Operationen wie das Kombinieren von PDFs, das Teilen von PDFs, das Bearbeiten von PDFs usw. durchzuführen.

6.2 Verwendung von IronOCR

IronOCR verfügt über einzigartige Funktionen, mit denen wir Barcodes und QR-Codes von gescannten Dokumenten lesen können. Die folgenden Codes zeigen, wie wir einen Barcode aus einem bestimmten Bild oder Dokument lesen können.

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("barcode.gif")
	Dim Result = Ocr.Read(Input)

	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
VB   C#

Der obige Code hilft, einen Barcode aus einem bestimmten Bild oder PDF-Dokument zu lesen. Es kann mehr als einen Barcode von einer Seite/einem Bild lesen. Um einen Strichcode zu lesen, verfügt IronOCR über eine einzigartige Einstellung, Ocr.Configuration.ReadBarCodes, die das Lesen eines Strichcodes erleichtert. Der Standardwert ist auf false gesetzt.

Nach dem Lesen der Eingabe werden die Daten in dem Objekt OCRResult gespeichert. Diese hat eine Eigenschaft namens Barcodes und enthält alle verfügbaren Barcodedaten in einer Liste. Mit der for-each-Schleife können wir alle Barcode-Details nacheinander abrufen. Außerdem wird der Barcode gescannt und der Wert des Barcodes gelesen - zwei Vorgänge, die in einem Arbeitsgang erledigt werden.

Es wird auch Threading-Optionen unterstützen. Wir können mehrere OCR-Prozesse auf einmal durchführen. IronOCR ist auch in der Lage, einen bestimmten Bereich aus einer bestimmten Region zu erkennen.

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
} 
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
} 
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	Input.Add("document.png", ContentArea)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

Der obige Code ist ein Beispiel für die Durchführung von OCR in einer bestimmten Region. Wir müssen nur den rechteckigen Bereich im Bild oder PDF angeben. Die Tesseract-Engine in IronOCR hilft uns, den Text zu erkennen.

7.0 IronOCR und Asprise OCR Lizenzmodelle und Preisgestaltung

IronOCR-Lizenzmodelle und Preise

Eine 30-Tage-Geld-zurück-Garantie: Beim Kauf der Lizenz erhalten Sie 30 Tage lang Ihr Geld zurück, wenn die Lizenz nicht funktioniert.

Einfache Integration: Die Integration von IronOCR in ein Projekt und eine Umgebung ist so einfach, dass wir nur eine einzige Codezeile schreiben und sie aus dem NuGet-Paket hinzufügen müssen. Oder wir können sie aus dem Internet herunterladen und auf diese Weise in unsere Umgebung integrieren.

Dauerlizenzierung: Jede Lizenz wird einmal erworben und muss nicht erneuert werden.

Kostenloser Support und Produkt-Updates: Jede Lizenz beinhaltet ein Jahr lang kostenlose Produkt-Updates und Support durch das Team, das das Produkt entwickelt hat. Es ist jederzeit möglich, Erweiterungen zu erwerben. Erweiterungen können eingesehen werden.

Sofortige Lizenzen: Registrierte Lizenzschlüssel werden sofort nach Zahlungseingang verschickt.

Alle Lizenzen sind unbefristet und gelten für Entwicklung, Staging und Produktion.

Die Lite-Lizenz:

  • 1 Entwickler
  • 1 Standort
  • 1 Projekt
  • Unbefristete Lizenz

    Dieses Paket ermöglicht es einem einzelnen Softwareentwickler in einem Unternehmen, Iron Software an einem einzigen Ort zu nutzen. Iron Software kann in einer einzelnen Webanwendung, einer Intranetanwendung oder einem Desktop-Softwareprogramm verwendet werden. Lizenzen sind nicht übertragbar und können nicht außerhalb einer Organisation oder einer Agentur-/Kundenbeziehung weitergegeben werden. Dieser Lizenztyp, wie auch alle anderen Lizenztypen, schließt ausdrücklich alle Rechte aus, die nicht ausdrücklich im Rahmen der Vereinbarung gewährt werden, ohne OEM-Weitergabe und Nutzung der Iron Software als SaaS ohne Erwerb einer zusätzlichen Abdeckung.

    Preisgestaltung: Beginnt bei $749 pro Jahr.

    Die Berufslizenz:

  • 10 Entwickler
  • 10 Standorte
  • 10 Projekte
  • Unbefristete Lizenz

    Dieses Paket ermöglicht es einer bestimmten Anzahl von Softwareentwicklern in einem Unternehmen, Iron Software an einzelnen Standorten zu nutzen, bis zu einer Höchstzahl von zehn. Die Iron Software kann in beliebig vielen Websites, Intranetanwendungen oder Desktop-Softwareanwendungen verwendet werden. Die Lizenzen sind nicht übertragbar und können nicht außerhalb einer Organisation oder einer Agentur-/Kundenbeziehung weitergegeben werden. Dieser Lizenztyp schließt, wie alle anderen Lizenztypen, ausdrücklich alle Rechte aus, die nicht ausdrücklich im Rahmen der Vereinbarung gewährt werden, einschließlich der OEM-Weitergabe und der Nutzung der Iron Software als SaaS ohne den Erwerb einer zusätzlichen Abdeckung. Diese Lizenz kann in ein einzelnes Projekt integriert werden, bis zu einer Höchstzahl von 10.

    Preisgestaltung: Beginnt bei $999 pro Jahr.

    Die Unbegrenzte Lizenz:

  • Unbegrenzt viele Entwickler
  • Unbegrenzte Anzahl von Standorten
  • Unbegrenzte Projekte
  • Unbefristete Lizenz

    Dadurch kann eine unbegrenzte Anzahl von Softwareentwicklern in einem Unternehmen Iron Software an einer unbegrenzten Anzahl von Standorten nutzen. Die Iron Software kann in beliebig vielen Websites, Intranetanwendungen oder Desktop-Softwareanwendungen verwendet werden. Die Lizenzen sind nicht übertragbar und können nicht außerhalb einer Organisation oder einer Agentur-/Kundenbeziehung weitergegeben werden. Dieser Lizenztyp schließt, wie alle anderen Lizenztypen, ausdrücklich alle Rechte aus, die nicht ausdrücklich im Rahmen der Vereinbarung gewährt werden, einschließlich der OEM-Weitergabe und der Nutzung der Iron Software als SaaS ohne den Erwerb einer zusätzlichen Abdeckung.

    Preisgestaltung: Beginnt bei $2999 pro Jahr.

    Lizenzfreie Weiterverbreitung: Damit können Sie die Iron Software als Teil verschiedener kommerzieller Produkte in unterschiedlichen Paketen vertreiben (ohne Lizenzgebühren zahlen zu müssen) basierend auf der Anzahl der Projekte, die von der Basislizenz abgedeckt werden. Sie ermöglicht die Bereitstellung von Iron Software im Rahmen von SaaS-Software-Services, basierend auf der Anzahl der von der Basislizenz abgedeckten Projekte.

    Preisgestaltung: Beginnt bei $1599 pro Jahr.

Asprise OCR Lizenzmodelle und Preisgestaltung

Die Lite-Lizenz:

  • Unbegrenzte Anzahl von Endnutzern
  • Erkennen von Text
  • Liest 1D-Barcodes: UPC, EAN, Code39, Code128
  • Text-, XML- und PDF-Ausgabe
  • Einfacher Einsatz
  • Unterstützt nur 2 Betriebssysteme
  • Sitze 1
  • Unterstützung: Nein

    Preisgestaltung: Beginnt bei $liteLicense`8 pro Jahr.

    Die Standardlizenz:

  • Unbegrenzte Anzahl von Endnutzern
  • BMP, GIF, PNG, JPEG, TIFF und PDF-Eingabe.
  • Erkennen von Text
  • Liest 1D-Barcodes: UPC, EAN, Code39, Code128
  • Lesen einiger 2D: nur QR und Data Matrix
  • Text-, XML- und PDF-Ausgabe
  • Einfacher Einsatz
  • Unterstützung: Nein

    Preisgestaltung: Beginnt bei $7998 pro Jahr.

    Die Unternehmenslizenz:

  • Unbegrenzte Anzahl von Endnutzern
  • BMP, GIF, PNG, JPEG, TIFF und PDF-Eingabe.
  • Erkennen von Text
  • Liest 1D-Barcodes: UPC, EAN, Code39, Code128
  • 2D: QR, PDF 417, Data Matrix und Aztec
  • Text-, XML- und PDF-Ausgabe
  • Einfacher Einsatz
  • Multi-Threading, Multi-Processing

    Preisangaben: Beginnt bei $12.998.

    IronOCR Lite einschließlich eines Pakets für einen Entwickler mit einem Jahr Support kostet etwa $749, während Asprise Lite einschließlich eines Pakets für einen Entwickler $7498 ohne technischen Support und $6296 mit bezahltem technischen Support kostet. Die IronOCR Professional-Lizenz einschließlich eines 10-Entwickler-Pakets mit einem Jahr technischem Support kostet $999, während die entsprechende Asprise-Lizenz einschließlich eines 10-Entwickler-Pakets ohne technischen Support $37.998 pro Jahr kostet, aber mit bezahlten technischen Releases und Updates sowie Support für ein Jahr $46.999,00.

Die IronOCR Lite und Professional Pakete haben SaaS-Service oder OEM und eine 5-Jahres-Supportoption. Die Lite-Version, die ein Entwicklerpaket mit 5-Jahres-Support sowie Saas- und OEM-Service enthält, kostet 2897 US-Dollar, während Asprise einen SaaS- oder OEM-Service und eine kundenspezifische Supportoption anbietet. Die IronOCR Professional Version beinhaltet ein 10-Entwickler-Paket mit einem Jahr bezahltem Support und Saas- und OEM-Service und kostet $3397, während die Asprise Version mit einem 10-Entwickler-Paket ohne 1-Jahres-Support und mit SaaS- und OEM-Service $59.996,00 kostet.

8.0 Schlussfolgerung

IronOCR im Kontext des .NET-Frameworks bietet Tesseract, das unkompliziert und einfach zu bedienen ist. Es unterstützt Fotos und PDF-Dokumente auf vielfältige Weise. Außerdem bietet es eine Reihe von Einstellungen zur Verbesserung der Leistung der Tesseract OCR-Bibliothek. Es werden verschiedene Sprachen unterstützt, auch mehrere Sprachen in einem einzigen Vorgang. Wenn Sie mehr über Tesseract OCR erfahren möchten, besuchen Sie die Website des Unternehmens.

Asprise ist eine Softwareanwendung, die eine künstliche Intelligenz verwendet, um Bilder und PDF-Dokumente zu erkennen. Es bietet auch verschiedene Einstellungen, um die Leistung des OCR-Prozesses zu verbessern. Darüber hinaus bietet es die Möglichkeit, mehrere Sprachen auszuwählen. Asprise hat einige Einschränkungen bei der Verwendung von Seitenumwandlungen. Es hat auch einen unterschiedlichen Preis für verschiedene Betriebssysteme.

IronOCR-Pakete bieten im Vergleich zu Asprise eine bessere Lizenzierung und Support. Asprise OCR hat angepasste und feste Pakete, die teurer sind. IronOCR beginnt bei $749, während Asprise OCR ab $7494 pro Jahr erhältlich ist. Unser Produkt ist also kostengünstiger und bietet gleichzeitig mehr Funktionen als Aspire. Außerdem unterstützt es mehrere Plattformen zu einem einzigen Preis.

Also, worauf warten Sie noch? Der kostenlose Test ist für alle zugänglich. Sie können die Lizenz hier und beginnen Sie sofort.

< PREVIOUS
Ein Vergleich zwischen IronOCR und Leadtools OCR

Sind Sie bereit, loszulegen? Version: 2024.10 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 2,561,036 Lizenzen anzeigen >