VERGLEICH MIT ANDEREN KOMPONENTEN

Ein Vergleich zwischen IronOCR und Asprise OCR

Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

Kannapat Udonpant

8. Juni 2022

Teilen Sie:

Wenn wir von OCR sprechen, ist damit die optische Zeichenerkennung gemeint. Der Begriff wird oft in der Geschäftswelt verwendet, um den Prozess der Umwandlung eines Bildes oder einer grafischen Darstellung eines textbasierten Dokuments (z. B. einer gescannten oder gefaxten Seite) in ein bearbeitbares Word-Format oder ein durchsuchbares Textdokumentformat mithilfe von Computersoftware zu bezeichnen.

Die Abkürzung OCR steht für Optical Character Recognition (optische Zeichenerkennung), eine Aufgabe, die von einer speziell für diesen Zweck entwickelten Computersoftware ausgeführt wird. Diese Art von Software scannt die Seite und erkennt alle Textinformationen, die sich darauf befinden, und wandelt sie in eine digitale Form um, so dass sie ohne Qualitätsverluste bearbeitet und digital reproduziert werden können.

Es gibt viele Anwendungen für OCR, aber der beliebteste Anwendungsfall ist die Umwandlung gescannter Dokumente in digitale Dateien, die formatiert und in Datenbanken indiziert und analysiert werden können.

In diesem Artikel werden wir zwei der gängigsten Bibliotheken und Anwendungen für OCR und PDF-Dokumente vergleichen. Diese sind:

Asprise OCR
IronOCR

1.0 Einführung

1.1 Asprise OCR Einführung und Funktionen

Das Asprise C# .NET OCR (optische Zeichenerkennung) und Barcode-Erkennungs-SDK bietet eine leistungsstarke API-Bibliothek, mit der Sie Ihre C# .NET-Anwendungen (Windows-Anwendungen, Silverlight, ASP.NET-Webdienstanwendungen, ActiveX-Steuerelemente usw.) mit der Funktionalität zur Extraktion von Text und Barcode-Informationen aus gescannten Dokumenten ausstatten können.

Sie können Bilder (in verschiedenen Formaten wie JPEG, PNG, TIFF, PDF usw.) in bearbeitbare Dokumentformate (Word, XML, durchsuchbare PDF usw.) umwandeln. Neben anderen Angeboten wie dem Asprise Image Scanning SDK (das Dokumente von Scannern erfasst), können Sie problemlos vollständige Dokumentenmanagementlösungen implementieren.

Die Merkmale von Asprise OCR

Genaues Texterkennung

Mit verbesserten Bildverarbeitungs- und Texterkennungsalgorithmen kann Asprise OCR auch schwierige Dokumente mit schlechter Bildqualität problemlos erkennen. Die Parameter können so eingestellt werden, dass die Genauigkeit gegenüber der Geschwindigkeit leicht bevorzugt wird.

Hochgeschwindigkeits-OCR-Engine

Asprise OCR verwendet eine optimierte OCR-Engine, um eine hervorragende Erkennung innerhalb eines kurzen Zeitrahmens durchzuführen. Die Geschwindigkeit kann durch Multithreading und optionale GPU-Beschleunigung weiter erhöht werden.

Über 20 unterstützte Sprachen

Asprise OCR erkennt über 20 Sprachen wie Englisch, Spanisch, Französisch, Deutsch, Italienisch, Ungarisch, Finnisch, Schwedisch, Rumänisch, Polnisch, Malaiisch, Arabisch, Indonesisch und Russisch.

Alle gängigen Barcode-Formate

Alle gängigen Barcodeformate werden unterstützt: EAN-8, EAN-13, UPC-A, UPC-E, ISBN-10, ISBN-13, Interleaved 2 of 5, Code 39, Code 128, PDF417 und QR-Code.

Bilder zu durchsuchbarem PDF

Mit ein paar Zeilen Code können Sie verschiedene Bildformate wie JPEG, PNG, TIFF und PDF in durchsuchbare PDF-Dateien umwandeln.

Einfache Bereitstellung

Kein Software-Schutz-Dongle, kein Lizenzierungsserver erforderlich. Der Einsatz von Asprise OCR SDK ist so einfach, wie Sie damit entwickeln.

Budgetfreundlich, gebührenfrei

Lizenzgebührenfrei bedeutet, dass Sie bei der Bestellung einer Entwicklungslizenz zahlen, aber Sie müssen nicht noch einmal zahlen, wenn Sie Ihre Software auf Tausenden von Servern oder bei Tausenden von Endbenutzern einsetzen.

Preisgekrönter Support

Ihr Team ist nicht nur freundlich, sondern auch in der Lage, Ihnen einen erstklassigen technischen Support zu bieten.

1.2 IronOCR - Einführung und Funktionen

IronOCR bietet Software für Ingenieure, die IronOCR for .NET zum Lesen von Textinhalten aus Fotos und PDFs in .NET-Anwendungen und Websites verwenden. Es scannt Fotos nach Text und Barcodes und unterstützt zahlreiche Sprachen weltweit; die Ausgabe kann dann entweder als reiner Text oder als strukturierte Daten erfolgen. Die OCR-Bibliothek von Iron Software kann in MVC-, Web-, Konsolen- und Desktop-.NET-Anwendungen verwendet werden. Für kommerzielle Einsätze wird die Lizenzierung mit direkter Unterstützung durch das Entwicklungsteam durchgeführt.

Mit der neuesten Tesseract 5-Engine liest IronOCR Text, Barcodes und QR-Codes aus jedem Bild- oder PDF-Format. Diese Bibliothek erweitert Desktop-, Konsolen- und Webanwendungen schnell um OCR.
IronOCR unterstützt 127 internationale Sprachen. Es unterstützt auch benutzerdefinierte Sprach- und Wortlisten.
IronOCR ist in der Lage, mehr als 20 Barcodeformate und QR-Codes zu lesen.
IronOCR unterstützt mehrseitige Gifs und Tiff-Bildformate.
IronOCR bietet Korrekturen für gescannte Bilder von schlechter Qualität.
IronOCR unterstützt Multithreading - es führt einen oder mehrere Prozesse gleichzeitig aus.
IronOCR kann strukturierte Datenausgaben für Seiten, Absätze, Zeilen, Wörter, Zeichen usw. liefern.
IronOCR unterstützt eine Vielzahl von Betriebssystemen wie Windows, Linux, macOS, etc.

2.0 Erstellen eines neuen Projekts in Visual Studio

Öffnen Sie die Visual Studio-Software und gehen Sie zum Menü "Datei". Wählen Sie "Neues Projekt" und dann "Konsolenanwendung".

Geben Sie den Projektnamen ein und wählen Sie den Dateipfad in dem entsprechenden Textfeld aus. Klicken Sie dann auf die Schaltfläche "Erstellen" und wählen Sie das gewünschte .NET-Framework aus, wie in der folgenden Abbildung dargestellt.

Das Visual Studio-Projekt generiert nun die Struktur für die ausgewählte Anwendung, und wenn Sie die Konsolen-, Windows- und Webanwendung ausgewählt haben, wird nun die Datei program.cs geöffnet, in die Sie den Code eingeben und die Anwendung erstellen/ausführen können.

Als nächstes können wir die Bibliothek hinzufügen, um den Code zu testen.

3.0 Installieren

3.1 Installieren Installieren Sie Asprise OCR

Wir können das Asprise OCR [hier](https://asprise.com/royalty-free-library/c%23-sharp.net-ocr-for-windows-mac-linux-download.html" target="_blank" rel="nofollow noopener noreferrer) herunterladen.

Es gibt zwei Optionen: Installation mit NuGet oder manuelles Herunterladen des SDK von [asprise.com](http://asprise.com/" target="_blank" rel="nofollow noopener noreferrer).

Möglichkeit 1: NuGet PM> Install-Package asprise-ocr-api

Erstellen Sie zunächst eine neue Visual C#/Visual Basic Windows Form Application oder verwenden Sie ein bestehendes Projekt. Mit dieser geöffneten Lösung öffnen Sie die [NuGet Package Manager Console](https://docs.nuget.org/consume/package-manager-console" target="_blank" rel="nofollow noopener noreferrer) und geben Sie den folgenden Befehl ein:

:InstallCmd Install-Package asprise-ocr-api

:InstallCmd Install-Package asprise-ocr-api

SHELL

Sobald dies erledigt ist, können Sie das OCR-Demoformular aufrufen, indem Sie den folgenden Code in Program.cs (für C#) kopieren:

static class Program 
{ 
    [STAThread]
    static void Main() {
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}

static class Program 
{ 
    [STAThread]
    static void Main() {
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}

Friend Module Program
	<STAThread>
	Sub Main()
		Application.EnableVisualStyles()
		Application.SetCompatibleTextRenderingDefault(False)
		Application.Run(New asprise_ocr_api.OcrSampleForm())
	End Sub
End Module

$vbLabelText $csharpLabel

Option 2: Laden Sie das OCR SDK von Asprise.com herunter

Laden Sie eine Kopie des Asprise OCR SDKs von [www.asprise.com/product/ocr](http://www.asprise.com/product/ocr" target="_blank" rel="nofollow noopener noreferrer) herunter. Entpacken Sie sie einfach in einen leeren Ordner.

Die Dateiorganisation der Asprise OCR SDK Distribution ist wie folgt:


OCR SDK

--- aocr.dll, aocr_x64.dll [erforderliche DLL]

Beispielprojekte        [.NET API und Beispielprojekt]

+--- Bilder                 [Beispielbilder]

Navigieren Sie zum Ordner sample-projects und öffnen Sie die Lösung: ocr-samples-vs.sln. Es gibt zwei Projekte:

asprise-ocr-api: die .NET OCR API
asprise-ocr-api-sample: Demo-Programm
Klicken Sie mit der rechten Maustaste auf das Projekt asprise-ocr-api-sample und wählen Sie "Set as StartUp Project", dann klicken Sie auf die Schaltfläche "Start" oder drücken Sie F5 und Sie sehen die gleiche Benutzeroberfläche wie abgebildet.

3.2 IronOCR installieren

IronOCR Library kann auf vier Arten heruntergeladen und installiert werden.

Diese sind:

Verwendung von Visual Studio
Verwendung der Visual Studio-Befehlszeile.
Direkter Download von der NuGet-Website.
Direktes Herunterladen von der IronPDF-Website.

3.2.1 Verwendung von Visual Studio

Visual Studio bietet die Option NuGet Package Manager, um das Paket direkt in der Lösung zu installieren. Der folgende Screenshot zeigt, wie Sie den NuGet Package Manager öffnen.

Es bietet ein Suchfeld, um die Liste der Pakete von der NuGet-Website anzuzeigen. Im Paketmanager müssen wir nach dem Schlüsselwort IronOCR suchen, wie im untenstehenden Screenshot:

In der obigen Abbildung sehen Sie die Liste der verwandten Suchbegriffe. Wir müssen die gewünschte Option auswählen, um das Paket in der Lösung zu installieren.

3.2.2 Verwendung der Visual Studio-Befehlszeile

Gehen Sie in Visual Studio zu Werkzeuge -> NuGet-Paketmanager -> Paketmanager-Konsole

Geben Sie auf der Registerkarte Paketmanager-Konsole die folgende Zeile ein:

Install-Package IronOcr

Anschließend wird das Paket in das aktuelle Projekt heruntergeladen/installiert und ist sofort einsatzbereit.

3.2.3 Direkter Download von der NuGet-Website

Die dritte Möglichkeit ist, das NuGet-Paket direkt von der Website herunterzuladen.

Gehen Sie zu dem [Link](https://www.nuget.org/packages/Ironocr" target="_blank" rel="nofollow).
Wählen Sie im Menü auf der rechten Seite die Option Paket herunterladen.
Doppelklicken Sie auf das heruntergeladene Paket. Sie wird automatisch installiert.
Laden Sie anschließend die Lösung neu und verwenden Sie sie im Projekt.

3.2.4 Direktes Herunterladen von der IronOCR-Website

Klicken Sie [hier](/csharp/ocr/" target="_blank), um das neueste Paket direkt von der Website herunterzuladen. Nach dem Download folgen Sie den unten aufgeführten Schritten, um das Paket dem Projekt hinzuzufügen.

Klicken Sie mit der rechten Maustaste auf das Projekt im Lösungsfenster.
Wählen Sie dann die Option Referenz und suchen Sie den Speicherort der heruntergeladenen Referenz.
Klicken Sie anschließend auf OK, um die Referenz hinzuzufügen.

4.0 OCR-Bild

Sowohl IronOCR als auch Asprise OCR verfügen über eine OCR-Technologie, mit der Bilder in Text umgewandelt werden können.

4.1 Verwendung von Asprise

Der folgende Code demonstriert die grundlegende Verwendung von Asprise OCR.

using asprise_ocr_api;
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
Console.WriteLine("OCR Result: " + s);
// process more images here ...
ocr.StopEngine();

using asprise_ocr_api;
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
Console.WriteLine("OCR Result: " + s);
// process more images here ...
ocr.StopEngine();

Imports asprise_ocr_api
AspriseOCR.SetUp()
Dim ocr As New AspriseOCR()
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST)
Dim s As String = ocr.Recognize("C:\path\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT)
Console.WriteLine("OCR Result: " & s)
' process more images here ...
ocr.StopEngine()

$vbLabelText $csharpLabel

Asprise OCR unterstützt die folgenden Bildformate: GIF, PNG, JPEG, TIFF und PDF. Für den OCR-Beispielcode im obigen Abschnitt sieht die Eingabe wie folgt aus:

Die OCR-Ausgabe erfolgt im Klartextformat:


Asprise OCR und Barcode-Erkennung

Leistungsstarke, lizenzgebührenfreie OCR- und Barcode-Erkennung unter Windows,

...

ISBN-l3, Interleaved 2 of 5, Code 39, Code 128, PDF417 und QR-Code.

[[QR-Code: www.asprise.com]]

[[CODE-128: Asprise]].

Die letzten beiden Zeilen stellen den Auszug der Barcode-Informationen dar. Hinweis: Sowohl das Format als auch der Inhalt des Barcodes sind in ‘[[ ]]’ Paare eingeschlossen.

4.2 Verwendung von IronOCR

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}

Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("3.png")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Console.ReadKey()
End Using

$vbLabelText $csharpLabel

Die Tesseract 5 API, mit der wir Bilddateien in Text umwandeln können, wird oben demonstriert. In der obigen Codezeile erstellen wir ein Objekt für Iron Tesseract. Wir erstellen auch ein OcrInput-Objekt, mit dem wir eine oder mehrere Bilddateien hinzufügen können. Es kann sein, dass wir den verfügbaren Bildpfad im Code angeben müssen, wenn wir die Methode add des OcrInput-Objekts verwenden. Es können beliebig viele Bilder hinzugefügt werden. Die Funktion "Lesen" im Objekt Irontesseract, das wir zuvor konstruiert haben, kann verwendet werden, um die Bilder zu erhalten, indem die Bilddatei geparst und das Ergebnis in das OCR-Ergebnis extrahiert wird. Es ist in der Lage, Text aus Fotos zu extrahieren und in eine Zeichenkette zu konvertieren.

Wir können auch Tesseract verwenden, um Bilder mit mehreren Bildern hinzuzufügen. "AddMultiFrameTiff" ist eine andere Methode für diesen Vorgang. Die Tesseract-Bibliothek liest jedes Einzelbild des Bildes, und jedes Einzelbild wird als eine eigene Seite behandelt. Der Prozess liest das erste Bild und fährt dann mit dem nächsten Bild fort, bis alle Bilder des Bildes gescannt worden sind. Nur das Tiff-Bildformat wird von dieser Methode unterstützt.

Das obige Bild ist die Ausgabe des IronOCR-Ergebnisses, das die Daten präzise in bearbeitbaren Text umgewandelt hat.

5.0 OCR-PDF-Dateien

IronOCR und Asprise OCR konvertieren PDF-Dateien in bearbeitbaren Text. Asprise OCR stellt dem Benutzer eine Liste von Optionen zur Verfügung, wie z.B. das Speichern der Seite, das Bearbeiten des Bildes, das Erkennen der Seite, usw. Es bietet auch Speicheroptionen wie Text, Dokument, HTML-Format, etc. IronOCR ermöglicht es uns auch, die konvertierte OCR-Datei in HTML, Text, PDF, etc. zu speichern.

5.1 Verwendung von Asprise OCR

Wenn Sie das Ausgabeformat als OUTPUT_FORMAT_PDF festlegen, müssen Sie die PDF-Ausgabedatei als Ziel angeben:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf
PROP_PDF_OUTPUT_TEXT_VISIBLE=true");

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf
PROP_PDF_OUTPUT_TEXT_VISIBLE=true");

ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, "PROP_PDF_OUTPUT_FILE=ocr-result.pdf PROP_PDF_OUTPUT_TEXT_VISIBLE=true")

$vbLabelText $csharpLabel

Im obigen Code werden die Eigenschaften in einer einzigen Zeichenkette angegeben, die durch (mit Schlüssel und Wert getrennt durch =). Alternativ können Sie die Eigenschaften auch paarweise getrennt angeben:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);

ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf", AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, True)

$vbLabelText $csharpLabel

Um den Text unsichtbar oder transparent zu machen, setzen Sie PROP_PDF_OUTPUT_TEXT_VISIBLE einfach auf "false". Sowohl normales PDF als auch PDF/A werden unterstützt. Bitte beachten Sie die Asprise OCR Property Summary. Legen Sie das Ausgabeformat als OUTPUT_FORMAT_RTF fest. Sie können dann .rtf-Dateien ausgeben, die in den meisten Textverarbeitungsprogrammen (Microsoft Word, Libre Office, TextEdit, etc.) bearbeitet werden können.

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");

ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF, "PROP_RTF_OUTPUT_FILE=ocr-result.rtf")

$vbLabelText $csharpLabel

Sobald die OCR abgeschlossen ist, können Sie die RTF-Datei in einem Textverarbeitungsprogramm anzeigen oder bearbeiten:

Mit der folgenden Methode führen Sie OCR an einer PDF-Eingabedatei durch:

5.2 Verwendung von IronOCR

Wir können OCRInput auch zur Verwaltung von PDF-Dateien verwenden. Jede Seite der Dokumente wird von der Klasse Iron Tesseract gelesen werden. Der Text wird dann aus den Seiten extrahiert. Wir können auch geschützte Dokumente mit einer zweiten Funktion namens "AddPDF" öffnen, die es uns ermöglicht, PDFs unserer Dokumentenliste hinzuzufügen (Passwort, falls es geschützt ist). Der folgende Code zeigt, wie ein kennwortgeschütztes PDF-Dokument geöffnet werden kann:

var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

Dim Ocr = New IronTesseract() ' nothing to configure
Using Input = New OcrInput()
	Input.AddPdf("example.pdf", "password")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using

$vbLabelText $csharpLabel

Mit "Addpdfpage" können wir den Inhalt einer einzelnen Seite in einem PDF-Dokument lesen und extrahieren Es muss nur die Seitenzahl angegeben werden, aus der wir den Text extrahieren wollen. mit "AddPdfPage" können wir Text aus zahlreichen Seiten extrahieren, die wir angeben. In IEnumerablekönnen wir problemlos mehrere Seiten angeben. Wir müssen auch den Speicherort der Datei sowie die Erweiterung der Datei angeben. Dies wird im folgenden Codebeispiel veranschaulicht:

IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}

IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}

Dim numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
 Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	'single page
	Input.AddPdfPage("example.pdf",10)
	'Multiple page
	Input.AddPdfPages("example.pdf", numbers)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Result.SaveAsTextFile("ocrtext.txt")
End Using

$vbLabelText $csharpLabel

Mit der Funktion SaveAsTextFile können wir das Ergebnis als Textdatei speichern, so dass wir die Datei in den Pfad des Ausgabeverzeichnisses herunterladen können. Außerdem können wir die Datei mit SaveAsHocrFile in einer HTML-Datei speichern.

6.0 Sonstige Merkmale

6.1 Verwendung von Asprise OCR

Asprise OCR hat einige zusätzliche Optionen, wie z.B. Textbereich zeichnen, Bildbereich zeichnen, Tabellenbereich zeichnen, Erkennungsbereich zeichnen, usw. Sie alle helfen dem Benutzer, die Leistung der OCR zu verbessern. Die Anwendung führt nicht nur OCR durch, sondern wir sind auch in der Lage, Operationen wie das Kombinieren von PDFs, das Teilen von PDFs, das Bearbeiten von PDFs usw. durchzuführen.

6.2 Verwendung von IronOCR

IronOCR verfügt über einzigartige Funktionen, mit denen wir Barcodes und QR-Codes von gescannten Dokumenten lesen können. Die folgenden Codes zeigen, wie wir einen Barcode aus einem bestimmten Bild oder Dokument lesen können.

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}

Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("barcode.gif")
	Dim Result = Ocr.Read(Input)

	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using

$vbLabelText $csharpLabel

Der obige Code hilft, einen Barcode aus einem bestimmten Bild oder PDF-Dokument zu lesen. Es kann mehr als einen Barcode von einer Seite/einem Bild lesen. Um einen Strichcode zu lesen, verfügt IronOCR über eine einzigartige Einstellung, Ocr.Configuration.ReadBarCodes, die das Lesen eines Strichcodes erleichtert. Der Standardwert ist auf false gesetzt.

Nach dem Lesen der Eingabe werden die Daten in dem Objekt OCRResult gespeichert. Diese hat eine Eigenschaft namens Barcodes und enthält alle verfügbaren Barcodedaten in einer Liste. Mit der for-each-Schleife können wir alle Barcode-Details nacheinander abrufen. Außerdem wird der Barcode gescannt und der Wert des Barcodes gelesen - zwei Vorgänge, die in einem Arbeitsgang erledigt werden.

Es wird auch Threading-Optionen unterstützen. Wir können mehrere OCR-Prozesse auf einmal durchführen. IronOCR ist auch in der Lage, einen bestimmten Bereich aus einer bestimmten Region zu erkennen.

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	Input.Add("document.png", ContentArea)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using

$vbLabelText $csharpLabel

Der obige Code ist ein Beispiel für die Durchführung von OCR in einer bestimmten Region. Wir müssen nur den rechteckigen Bereich im Bild oder PDF angeben. Die Tesseract-Engine in IronOCR hilft uns, den Text zu erkennen.

7.0 IronOCR und Asprise OCR Lizenzmodelle und Preisgestaltung

IronOCR-Lizenzmodelle und Preise

Eine 30-tägige Geld-zurück-Garantie: Beim Kauf der Lizenz erhalten Sie eine 30-tägige Geld-zurück-Garantie, falls die Lizenz nicht funktioniert.

Einfache Integration: die Integration von IronOCR in ein Projekt und eine Umgebung ist so einfach, dass wir es durch das Schreiben nur einer einzigen Codezeile und das Hinzufügen aus dem NuGet-Paket erledigen können. Oder wir können sie aus dem Internet herunterladen und auf diese Weise in unsere Umgebung integrieren.

Unbefristete Lizenzierung: Jede Lizenz wird einmal gekauft und erfordert keine Erneuerung.

Kostenloser Support und Produkt-Updates: Jede Lizenz beinhaltet ein Jahr lang kostenlose Produkt-Updates und Support durch das Team, das das Produkt entwickelt hat. Es ist jederzeit möglich, Erweiterungen zu erwerben. Erweiterungen können eingesehen werden.

Sofortige Lizenzen: Registrierte Lizenzschlüssel werden sofort nach Zahlungseingang versendet.

Alle Lizenzen sind unbefristet und gelten für Entwicklung, Staging und Produktion.

Die Lite-Lizenz:

1 Entwickler
1 Standort
1 Projekt
Unbefristete Lizenz
Dieses Paket ermöglicht es einem einzelnen Softwareentwickler in einem Unternehmen, Iron Software an einem einzigen Ort zu nutzen. Iron Software kann in einer einzelnen Webanwendung, einer Intranetanwendung oder einem Desktop-Softwareprogramm verwendet werden. Lizenzen sind nicht übertragbar und können nicht außerhalb einer Organisation oder einer Agentur-/Kundenbeziehung weitergegeben werden. Dieser Lizenztyp, wie auch alle anderen Lizenztypen, schließt ausdrücklich alle Rechte aus, die nicht ausdrücklich im Rahmen der Vereinbarung gewährt werden, ohne OEM-Weitergabe und Nutzung der Iron Software als SaaS ohne Erwerb einer zusätzlichen Abdeckung.
Preisgestaltung: Beginnt bei $749 pro Jahr.
Die Professional License:
10 Entwickler
10 Standorte
10 Projekte
Unbefristete Lizenz
Dieses Paket ermöglicht es einer bestimmten Anzahl von Softwareentwicklern in einem Unternehmen, Iron Software an einzelnen Standorten zu nutzen, bis zu einer Höchstzahl von zehn. Die Iron Software kann in beliebig vielen Websites, Intranetanwendungen oder Desktop-Softwareanwendungen verwendet werden. Die Lizenzen sind nicht übertragbar und können nicht außerhalb einer Organisation oder einer Agentur-/Kundenbeziehung weitergegeben werden. Dieser Lizenztyp schließt, wie alle anderen Lizenztypen, ausdrücklich alle Rechte aus, die nicht ausdrücklich im Rahmen der Vereinbarung gewährt werden, einschließlich der OEM-Weitergabe und der Nutzung der Iron Software als SaaS ohne den Erwerb einer zusätzlichen Abdeckung. Diese Lizenz kann in ein einzelnes Projekt integriert werden, bis zu einer Höchstzahl von 10.
Preise: Beginnt ab 999 $ pro Jahr.
Die Unlimited License:
Unbegrenzt viele Entwickler
Unbegrenzte Anzahl von Standorten
Unbegrenzte Projekte
Unbefristete Lizenz
Dadurch kann eine unbegrenzte Anzahl von Softwareentwicklern in einem Unternehmen Iron Software an einer unbegrenzten Anzahl von Standorten nutzen. Die Iron Software kann in beliebig vielen Websites, Intranetanwendungen oder Desktop-Softwareanwendungen verwendet werden. Die Lizenzen sind nicht übertragbar und können nicht außerhalb einer Organisation oder einer Agentur-/Kundenbeziehung weitergegeben werden. Dieser Lizenztyp schließt, wie alle anderen Lizenztypen, ausdrücklich alle Rechte aus, die nicht ausdrücklich im Rahmen der Vereinbarung gewährt werden, einschließlich der OEM-Weitergabe und der Nutzung der Iron Software als SaaS ohne den Erwerb einer zusätzlichen Abdeckung.
Preise: Ab 2999 $ pro Jahr.
Lizenzfreie Weiterverbreitung: Dies erlaubt Ihnen, die Iron Software als Teil einer Reihe unterschiedlich verpackter kommerzieller Produkte zu vertreiben (ohne Lizenzgebühren zahlen zu müssen), basierend auf der Anzahl der durch die Basislizenz abgedeckten Projekte. Sie ermöglicht die Bereitstellung von Iron Software im Rahmen von SaaS-Software-Services, basierend auf der Anzahl der von der Basislizenz abgedeckten Projekte.
Preise: Ab $1599 pro Jahr.

Asprise OCR Lizenzmodelle und Preisgestaltung

Die Lite-Lizenz:

Unbegrenzte Anzahl von Endnutzern
Erkennen von Text
Liest 1D-Barcodes: UPC, EAN, Code39, Code128
Text-, XML- und PDF-Ausgabe
Einfacher Einsatz
Unterstützt nur 2 Betriebssysteme
Sitze 1
Unterstützung: Nein
Preise: Beginnt bei $7498 pro Jahr.
Die Standard-Lizenz:
Unbegrenzte Anzahl von Endnutzern
BMP, GIF, PNG, JPEG, TIFF und PDF-Eingabe.
Erkennen von Text
Liest 1D-Barcodes: UPC, EAN, Code39, Code128
Lesen einiger 2D: nur QR und Data Matrix
Text-, XML- und PDF-Ausgabe
Einfacher Einsatz
Unterstützung: Nein
Preise: Beginnt ab 7998 $ pro Jahr.
Die Enterprise-Lizenz:
Unbegrenzte Anzahl von Endnutzern
BMP, GIF, PNG, JPEG, TIFF und PDF-Eingabe.
Erkennen von Text
Liest 1D-Barcodes: UPC, EAN, Code39, Code128
2D: QR, PDF 417, Data Matrix und Aztec
Text-, XML- und PDF-Ausgabe
Einfacher Einsatz
Multi-Threading, Multi-Processing
Preisgestaltung: Ab $12,998.
Die IronOCR Lite -Version, inklusive eines Ein-Entwickler-Pakets mit einem Jahr Support, kostet ungefähr $749, während Asprise Lite inklusive eines Ein-Entwickler-Pakets $7498 ohne technischen Support kostet und $6296 mit kostenpflichtigem technischen Support. Die IronOCR Professional-Lizenz einschließlich eines 10-Entwickler-Pakets mit einem Jahr technischen Supports kostet 999 $, während die gleichwertige Asprise-Lizenz einschließlich eines 10-Entwickler-Pakets 37.998 $ pro Jahr ohne technischen Support, aber mit bezahlten technischen Veröffentlichungen und Aktualisierungen, plus Support für ein Jahr, 46.999,00 $ kostet.

Die IronOCR Lite und Professional Pakete bieten SaaS-Service oder OEM und eine 5-Jahres-Support-Option. Die Lite-Version, die ein Entwicklerpaket mit 5-jährigem Support sowie Saas- und OEM-Service umfasst, kostet 2897 USD, während Asprise einen SaaS- oder OEM-Service sowie eine maßgeschneiderte Supportoption anbietet. Die Professional-Version von IronOCR beinhaltet ein 10-Entwickler-Paket mit einem Jahr bezahltem Support und SaaS- sowie OEM-Service für 3.397 $, während die Asprise-Version mit einem 10-Entwickler-Paket ohne 1-jährigen Support und mit SaaS- und OEM-Service 59.996,00 $ kostet.

8.0 Schlussfolgerung

IronOCR im Kontext des .NET-Frameworks bietet Tesseract, das unkompliziert und einfach zu bedienen ist. Es unterstützt Fotos und PDF-Dokumente auf vielfältige Weise. Außerdem bietet es eine Reihe von Einstellungen zur Verbesserung der Leistung der Tesseract OCR-Bibliothek. Es werden verschiedene Sprachen unterstützt, auch mehrere Sprachen in einem einzigen Vorgang. Wenn Sie mehr über Tesseract OCR erfahren möchten, besuchen Sie die Website des Unternehmens.

Asprise ist eine Softwareanwendung, die eine künstliche Intelligenz verwendet, um Bilder und PDF-Dokumente zu erkennen. Es bietet auch verschiedene Einstellungen, um die Leistung des OCR-Prozesses zu verbessern. Darüber hinaus bietet es die Möglichkeit, mehrere Sprachen auszuwählen. Asprise hat einige Einschränkungen bei der Verwendung von Seitenumwandlungen. Es hat auch einen unterschiedlichen Preis für verschiedene Betriebssysteme.

IronOCR-Pakete bieten bessere Lizenzierungen und Unterstützung im Vergleich zu Asprise. Asprise OCR hat angepasste und feste Pakete, die teurer sind. IronOCR beginnt ab $749, während Asprise OCR ab $7494 pro Jahr beginnt, sodass unser Produkt kostengünstiger ist und auch mehr Funktionen als Asprise bietet. Es unterstützt zudem mehrere Plattformen zu einem einzigen Preis.

Also, worauf warten Sie noch? Der kostenlose Test ist für alle zugänglich. Sie können die [Lizenz](/csharp/ocr/licensing/" target="_blank) hier erhalten und sofort beginnen.

Kannapat Udonpant

Jetzt mit dem Ingenieurteam chatten

Software-Ingenieur

Bevor er Software-Ingenieur wurde, promovierte Kannapat an der Universität Hokkaido in Japan im Bereich Umweltressourcen. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Abteilung für Bioproduktionstechnik ist. Im Jahr 2022 wechselte er mit seinen C#-Kenntnissen zum Engineering-Team von Iron Software, wo er sich auf IronPDF konzentriert. Kannapat schätzt an seiner Arbeit, dass er direkt von dem Entwickler lernt, der den Großteil des in IronPDF verwendeten Codes schreibt. Neben dem kollegialen Lernen genießt Kannapat auch den sozialen Aspekt der Arbeit bei Iron Software. Wenn er nicht gerade Code oder Dokumentationen schreibt, kann man Kannapat normalerweise beim Spielen auf seiner PS5 oder beim Wiedersehen mit The Last of Us antreffen.

< PREVIOUS
Ein Vergleich zwischen IronOCR und Leadtools OCR