Zum Fußzeileninhalt springen
MIT ANDEREN KOMPONENTEN VERGLEICHEN

Ein Vergleich zwischen IronOCR und Asprise OCR

Wenn wir über OCR sprechen, bezieht es sich auf die optische Zeichenerkennung. Der Begriff wird oft in der Geschäftswelt verwendet, um den Prozess der Umwandlung eines Bildes oder einer grafischen Darstellung eines beliebigen textbasierten Dokuments (z. B. einer gescannten oder gefaxten Seite) in ein bearbeitbares Word-Format oder ein textdurchsuchbares Dokumentenformat mittels Computer-Software zu beschreiben.

Das Akronym OCR steht für Optical Character Recognition, eine Aufgabe, die von einer speziellen Software durchgeführt wird. Diese Art von Software scannt die Seite und erkennt alle darauf befindlichen Textinformationen, indem sie sie in eine digitale Form umwandelt, sodass sie ohne Qualitätsverlust digital bearbeitet und reproduziert werden kann.

Es gibt viele Anwendungen für OCR, aber die beliebteste Anwendungsart ist die Umwandlung gescannter Dokumente in digitale Dateien, die formatiert und in Datenbanken indiziert und analysiert werden können.

In diesem Artikel werden wir zwei der gebräuchlichsten Bibliotheken und Anwendungen für OCR und PDF-Dokumentbilder vergleichen. Diese sind:

  • Asprise OCR
  • IronXL

1.0 Einführung

1.1 Einführung und Funktionen von Asprise OCR

Das Asprise C# .NET OCR (optische Zeichenerkennung) und Barcode-Erkennung SDK bietet eine leistungsstarke API-Bibliothek, mit der Sie Ihre C# .NET-Anwendungen (Windows-Anwendungen, Silverlight, ASP.NET-Webdienstanwendungen, ActiveX-Steuerelemente usw.) mit der Funktionalität zur Extraktion von Text- und Barcode-Informationen aus gescannten Dokumenten ausstatten können.

Sie können Bilder (in verschiedenen Formaten wie JPEG, PNG, TIFF, PDF usw.) in bearbeitbare Dokumentenformate (Word, XML, durchsuchbare PDF usw.) umwandeln. Zusammen mit anderen Angeboten wie dem Asprise Image Scanning SDK (das Dokumente von Scannern erfasst) können Sie problemlos vollständige Dokumentenmanagementlösungen implementieren.

Die Funktionen von Asprise OCR

Präzise Texterkennung Mit verbesserten Bildverarbeitungs- und Texterkennungsalgorithmen kann Asprise OCR problemlos schwierige Dokumente mit schlechter Bildqualität erkennen. Parameter können verwendet werden, um die Genauigkeit leicht gegenüber der Geschwindigkeit zu bevorzugen.

Hochgeschwindigkeits-OCR-Engine Asprise OCR verwendet eine optimierte OCR-Engine, um eine hervorragende Erkennung innerhalb eines kurzen Zeitrahmens zu ermöglichen. Die Geschwindigkeit kann weiter durch Multithreading und optionale GPU-Beschleunigung verbessert werden.

Unterstützung für über 20 Sprachen Asprise OCR erkennt über 20 Sprachen wie Englisch, Spanisch, Französisch, Deutsch, Italienisch, Ungarisch, Finnisch, Schwedisch, Rumänisch, Polnisch, Malaiisch, Arabisch, Indonesisch und Russisch.

Alle gängigen Barcode-Formate Alle gängigen Barcode-Formate werden unterstützt: EAN-8, EAN-13, UPC-A, UPC-E, ISBN-10, ISBN-13, Interleaved 2 von 5, Code 39, Code 128, PDF417 und QR-Code.

Bilder zu durchsuchbarem PDF Mit wenigen Codezeilen können Sie verschiedene Bildformate wie JPEG, PNG, TIFF und PDF in durchsuchbare PDF-Dateien umwandeln.

Einfache Bereitstellung Kein Softwareschutz-Dongle, kein Lizenzierungsserver erforderlich. Die Bereitstellung des Asprise OCR SDK ist so einfach wie die Entwicklung damit.

Kostengünstig, lizenzgebührenfrei Lizenzgebührenfreie Nutzung bedeutet, dass Sie bei Bestellung einer Entwicklungslizenz bezahlen, aber nicht erneut zahlen müssen, wenn Sie Ihre Software auf Tausende von Servern oder an Tausende von Endnutzern bereitstellen.

Preisgekrönter Support Ihr Team ist nicht nur freundlich, sondern auch in der Lage, Ihnen erstklassigen technischen Support zu bieten.

1.2 IronOCR — Einführung und Funktionen

IronOCR bietet Software für Ingenieure, die IronOCR für .NET verwenden, um Textinhalte aus Fotos und PDFs in .NET-Anwendungen und Websites zu lesen. Es scannt Fotos nach Text und Barcodes und unterstützt zahlreiche weltweite Sprachen; es kann dann die Ausgabe entweder als einfachen Text oder als strukturierte Daten liefern. Die OCR-Bibliothek von Iron Software kann in MVC-, Web-, Konsolen- und Desktop .NET-Anwendungen verwendet werden. Für kommerzielle Bereitstellungen wird mit direkter Unterstützung durch das Entwicklungsteam eine Lizenzierung angeboten.

  • Mit der neuesten Tesseract-5-Engine liest IronOCR Text, Barcodes und QR-Codes aus jedem Bild- oder PDF-Format. Diese Bibliothek fügt Desktop-, Konsolen- und Webanwendungen schnell OCR hinzu.
  • IronOCR unterstützt 125 internationale Sprachen. Es unterstützt auch benutzerdefinierte Sprach- und Wortlisten.
  • IronOCR kann mehr als 20 Barcode-Formate und QR-Codes lesen.
  • IronOCR unterstützt mehrseitige GIF- und TIFF-Bildformate.
  • IronOCR bietet eine Korrektur für qualitativ minderwertige gescannte Bilder.
  • IronOCR unterstützt Multithreading - es führt einen oder mehrere Prozesse gleichzeitig aus.
  • IronOCR kann strukturierte Datenausgaben für Seiten, Absätze, Zeilen, Wörter, Zeichen usw. bereitstellen.
  • IronOCR unterstützt verschiedene Betriebssysteme wie Windows, Linux, macOS usw.

2.0 Erstellen eines neuen Projekts in Visual Studio

Öffnen Sie die Visual Studio Software und gehen Sie zum "Dateimenü". Wählen Sie "Neues Projekt" und dann "Konsolenanwendung".

class="content-img-align-center">
class="center-image-wrapper"> Abbyy Finereader Ocr Alternatives 1 related to 2.0 Erstellen eines neuen Projekts in Visual Studio

Geben Sie den Projektnamen ein und wählen Sie den Dateipfad im entsprechenden Textfeld aus. Klicken Sie dann auf die Schaltfläche Erstellen und wählen Sie das erforderliche .NET Framework, wie im folgenden Screenshot.

class="content-img-align-center">
class="center-image-wrapper"> Abbyy Finereader Ocr Alternatives 2 related to 2.0 Erstellen eines neuen Projekts in Visual Studio

Das Visual Studio-Projekt wird jetzt die Struktur für die ausgewählte Anwendung generieren, und wenn Sie die Konsole, die Windows- und Webanwendung ausgewählt haben, wird jetzt die Program.cs-Datei geöffnet, in der Sie den Code eingeben und die Anwendung erstellen/ausführen können.

class="content-img-align-center">
class="center-image-wrapper"> Abbyy Finereader Ocr Alternatives 3 related to 2.0 Erstellen eines neuen Projekts in Visual Studio

Als nächstes können wir die Bibliothek hinzufügen, um den Code zu testen.

3.0 Installieren

3.1 Asprise OCR installieren

We can download the Asprise OCR here.

There are two options: install using NuGet or manually download the SDK from asprise.com.

Option 1: NuGet PM> Install-Package asprise-ocr-api

Erstellen Sie zunächst ein neues Visual C#/Visual Basic Windows Form Application-Projekt oder verwenden Sie ein bestehendes Projekt. With this solution opened, open the NuGet Package Manager Console and type the following command:

Install-Package asprise-ocr-api

Sobald dies erledigt ist, können Sie das OCR-Demo-Formular aufrufen, indem Sie folgenden Code in Program.cs (für C#) kopieren:

using System;
using System.Windows.Forms;
using asprise_ocr_api;

static class Program
{
    // Main application entry point
    [STAThread]
    static void Main()
    {
        // Enable visual styles and set text rendering mode
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);

        // Launch the OCR sample form
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
using System;
using System.Windows.Forms;
using asprise_ocr_api;

static class Program
{
    // Main application entry point
    [STAThread]
    static void Main()
    {
        // Enable visual styles and set text rendering mode
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);

        // Launch the OCR sample form
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
Imports System
Imports System.Windows.Forms
Imports asprise_ocr_api

Friend Module Program
	' Main application entry point
	<STAThread>
	Sub Main()
		' Enable visual styles and set text rendering mode
		Application.EnableVisualStyles()
		Application.SetCompatibleTextRenderingDefault(False)

		' Launch the OCR sample form
		Application.Run(New asprise_ocr_api.OcrSampleForm())
	End Sub
End Module
$vbLabelText   $csharpLabel

Option 2: Laden Sie das OCR SDK von Asprise.com herunter

Download a copy of the Asprise OCR SDK from www.asprise.com/product/ocr. Entpacken Sie es einfach in einen leeren Ordner.

Die Dateiorganisation der Asprise OCR SDK-Distribution ist wie folgt:

OCR SDK
|--- aocr.dll, aocr_x64.dll [erforderliche DLL]
|--- sample-projects [.NET API und Beispielprojekt]
+--- images [Beispielbilder]

Navigieren Sie zum Ordner sample-projects und öffnen Sie die Lösung: ocr-samples-vs.sln. Es gibt zwei Projekte:

  • asprise-ocr-api: die .NET OCR-API
  • asprise-ocr-api-sample: Demo-Programm

Klicken Sie mit der rechten Maustaste auf das asprise-ocr-api-sample-Projekt und "Als Startprojekt festlegen", dann drücken Sie die "Start"-Taste oder die Taste F5 und Sie werden die gleiche Benutzeroberfläche sehen wie gezeigt.

3.2 Installation von IronOCR

Die IronOCR-Bibliothek kann auf vier Arten heruntergeladen und installiert werden.

Diese sind:

  • Verwendung von Visual Studio
  • Verwenden der Visual Studio-Befehlszeile
  • Direkter Download von der NuGet-Webseite
  • Direkt von der IronPDF-Website herunterladen

3.2.1 Mit Visual Studio

Die Visual Studio-Software bietet die NuGet-Paket-Manager-Option, um das Paket direkt in die Lösung zu installieren. Der folgende Screenshot zeigt, wie der NuGet-Paketmanager geöffnet wird.

class="content-img-align-center">
class="center-image-wrapper"> Abbyy Finereader Ocr Alternatives 6 related to 3.2.1 Mit Visual Studio

Es bietet ein Suchfeld zur Anzeige der Pakete von der NuGet-Website. Im Paket-Manager müssen wir nach dem Schlüsselwort IronOCR suchen, wie im folgenden Screenshot:

class="content-img-align-center">
class="center-image-wrapper"> Abbyy Finereader Ocr Alternatives 7 related to 3.2.1 Mit Visual Studio

Aus dem obigen Bild erhalten wir die Liste der verwandten Suchergebnisse. Wir müssen die erforderliche Option auswählen, um das Paket in der Lösung zu installieren.

3.2.2 Mit der Visual Studio-Befehlszeile

In Visual Studio gehen Sie zu Werkzeuge -> NuGet-Paket-Manager -> Paket-Manager-Konsole

Geben Sie die folgende Zeile im Paket-Manager-Konsolen-Tab ein:

Install-Package IronOcr

Als Nächstes wird das Paket im aktuellen Projekt heruntergeladen/installiert und ist bereit zur Verwendung.

3.2.3 Direkt von der NuGet-Website herunterladen

Der dritte Weg ist, das NuGet-Paket direkt von der Website herunterzuladen.

  • Navigate to the Link.
  • Wählen Sie die Download-Paket-Option im Menü auf der rechten Seite.
  • Doppelklicken Sie auf das heruntergeladene Paket. Es wird automatisch installiert.
  • Laden Sie dann die Lösung neu und beginnen Sie, es im Projekt zu verwenden.

3.2.4 Direkt von der IronOCR-Website herunterladen

Click the link here to download the latest package direct from the website. Once downloaded, follow the steps below to add the package to the project.

  • Klicken Sie mit der rechten Maustaste auf das Projekt im Lösungsfenster.
  • Wählen Sie dann die Option Referenz aus und durchsuchen Sie den Speicherort der heruntergeladenen Referenz.
  • Klicken Sie anschließend auf OK, um die Referenz hinzuzufügen.

4.0 OCR-Bild

Sowohl IronOCR als auch Asprise OCR verfügen über eine OCR-Technologie, die Bilder in Textsuche umwandelt.

4.1 Verwendung von Asprise

Der folgende Code zeigt die grundlegende Verwendung von Asprise OCR.

using System;
using asprise_ocr_api;

class Example
{
    static void Main()
    {
        // Set up OCR engine
        AspriseOCR.SetUp();
        AspriseOCR ocr = new AspriseOCR();
        ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);

        // Recognize text from the given image
        string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, 
            AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);

        // Output the recognized text to the console
        Console.WriteLine("OCR Result: " + s);

        // Stop the OCR engine
        ocr.StopEngine();
    }
}
using System;
using asprise_ocr_api;

class Example
{
    static void Main()
    {
        // Set up OCR engine
        AspriseOCR.SetUp();
        AspriseOCR ocr = new AspriseOCR();
        ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);

        // Recognize text from the given image
        string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, 
            AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);

        // Output the recognized text to the console
        Console.WriteLine("OCR Result: " + s);

        // Stop the OCR engine
        ocr.StopEngine();
    }
}
Imports System
Imports asprise_ocr_api

Friend Class Example
	Shared Sub Main()
		' Set up OCR engine
		AspriseOCR.SetUp()
		Dim ocr As New AspriseOCR()
		ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST)

		' Recognize text from the given image
		Dim s As String = ocr.Recognize("C:\path\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT)

		' Output the recognized text to the console
		Console.WriteLine("OCR Result: " & s)

		' Stop the OCR engine
		ocr.StopEngine()
	End Sub
End Class
$vbLabelText   $csharpLabel

Asprise OCR unterstützt die folgenden Bildformate: GIF, PNG, JPEG, TIFF und PDF. Für den Beispiel-OCR-Code im obigen Abschnitt sieht der Eingabe wie folgt aus:

class="content-img-align-center">
class="center-image-wrapper">Asprise Ocr Alternatives 6 related to 4.1 Verwendung von Asprise

Der OCR-Ausgang wird im Klartext-Format sein:

Asprise OCR und Barcode-Erkennung

Hochleistung, lizenzgebührenfreie OCR und Barcode-Erkennung auf Windows,
...
ISBN-13, Interleaved 2 von 5, Code 39, Code 128, PDF417 und QR-Code.

[[QR-Code: www.asprise.com]]
[[CODE-128: Asprise]].

Die letzten zwei Zeilen stellen Barcode-Informationsausschnitte dar. Hinweis: Sowohl das Format als auch der Inhalt des Barcodes sind in ‚[[ ]]‘ Klammern eingeschlossen.

4.2 Verwendung von IronOCR

using System;
using IronOcr;

class Example
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();
        Ocr.Language = OcrLanguage.EnglishBest;

        // Specify to use Tesseract 5 engine
        Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

        // Create OcrInput to hold the images
        using (var Input = new OcrInput())
        {
            // Add an image to the OcrInput
            Input.AddImage(@"3.png");

            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Output the recognized text to the console
            Console.WriteLine(Result.Text);
            Console.ReadKey();
        }
    }
}
using System;
using IronOcr;

class Example
{
    static void Main()
    {
        // Create an instance of IronTesseract
        var Ocr = new IronTesseract();
        Ocr.Language = OcrLanguage.EnglishBest;

        // Specify to use Tesseract 5 engine
        Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

        // Create OcrInput to hold the images
        using (var Input = new OcrInput())
        {
            // Add an image to the OcrInput
            Input.AddImage(@"3.png");

            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Output the recognized text to the console
            Console.WriteLine(Result.Text);
            Console.ReadKey();
        }
    }
}
Imports System
Imports IronOcr

Friend Class Example
	Shared Sub Main()
		' Create an instance of IronTesseract
		Dim Ocr = New IronTesseract()
		Ocr.Language = OcrLanguage.EnglishBest

		' Specify to use Tesseract 5 engine
		Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5

		' Create OcrInput to hold the images
		Using Input = New OcrInput()
			' Add an image to the OcrInput
			Input.AddImage("3.png")

			' Perform OCR on the input image
			Dim Result = Ocr.Read(Input)

			' Output the recognized text to the console
			Console.WriteLine(Result.Text)
			Console.ReadKey()
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Die Tesseract 5 API, die es uns ermöglicht Bilddateien in Text zu konvertieren, wird oben demonstriert. Wir erstellen ein Objekt für Iron Tesseract in der obigen Codezeile. Wir erstellen auch ein OcrInput-Objekt, mit dem wir ein oder mehrere Bilddateien hinzufügen können. Möglicherweise müssen wir den verfügbaren Bildpfad im Code angeben, wenn wir die OcrInput-Objektmethode hinzufügen verwenden. Beliebig viele Bilder können hinzugefügt werden. Die Funktion Read im Objekt IronTesseract, die wir zuvor konstruiert haben, kann verwendet werden, um die Bilder zu erhalten, indem die Bilddatei geparst und das Ergebnis in das OCR-Ergebnis extrahiert wird. Es kann Text von Fotos extrahieren und in einen String umwandeln.

Wir können auch Tesseract verwenden, um Mehrbilddateien hinzuzufügen. "AddMultiFrameTiff" ist eine andere Methode für diese Operation. Die Tesseract-Bibliothek liest jeden Frame im Bild und jeder Frame wird als eigenständige Seite behandelt. Der Prozess wird den ersten Frame des Bildes lesen und dann mit dem nächsten Frame fortfahren, und so weiter, bis alle Frames des Bildes gescannt wurden. Nur das TIFF-Bildformat wird von dieser Methode unterstützt.

class="content-img-align-center">
class="center-image-wrapper">Asprise Ocr Alternatives 7 related to 4.2 Verwendung von IronOCR

Das obige Bild ist das Ergebnis des IronOCR, das die Daten genau in bearbeitbaren Text umgewandelt hat.

5.0 OCR-PDF-Dateien

IronOCR und Asprise OCR konvertieren PDF-Dateien in bearbeitbaren Text. Asprise OCR bietet dem Benutzer eine Liste von Optionen wie Seite speichern, Bild bearbeiten, Seite erkennen usw. Außerdem bietet es Speicheroptionen wie Text, Dokument, HTML-Format usw. IronOCR ermöglicht es uns auch, die konvertierte OCR-Datei in HTML, Text, PDF usw. zu speichern.

5.1 Verwendung von Asprise OCR

Wenn Sie das Ausgabeformat als OUTPUT_FORMAT_PDF festlegen, müssen Sie die Zieldatei des PDF-Ausgangs wie folgt angeben:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf|PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf|PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, "PROP_PDF_OUTPUT_FILE=ocr-result.pdf|PROP_PDF_OUTPUT_TEXT_VISIBLE=true")
$vbLabelText   $csharpLabel

Im obigen Code sind Eigenschaften in einer einzigen Zeichenkette angegeben, die durch| (mit Schlüssel und Wert getrennt durch =). Alternativ können Sie Eigenschaften paarweise separat angeben:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf", AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, True)
$vbLabelText   $csharpLabel

Um den Text unsichtbar oder transparent zu machen, setzen Sie einfach PROP_PDF_OUTPUT_TEXT_VISIBLE auf "false". Sowohl normales PDF als auch PDF/A werden unterstützt. Bitte beachten Sie die Zusammenfassung der Asprise OCR Eigenschaften. Setzen Sie das Ausgabeformat als OUTPUT_FORMAT_RTF. Sie können dann .rtf-Dateien ausgeben, die in den meisten Textverarbeitungsprogrammen (Microsoft Word, Libre Office, TextEdit usw.) bearbeitet werden können.

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF, "PROP_RTF_OUTPUT_FILE=ocr-result.rtf")
$vbLabelText   $csharpLabel

Sobald die OCR abgeschlossen ist, können Sie die RTF-Datei mit einem Textverarbeitungsprogramm anzeigen oder bearbeiten:

class="content-img-align-center">
class="center-image-wrapper">Asprise Ocr Alternatives 8 related to 5.1 Verwendung von Asprise OCR

Sie verwenden die folgende Methode, um OCR auf einer PDF-Eingabedatei durchzuführen:

class="content-img-align-center">
class="center-image-wrapper">Asprise Ocr Alternatives 9 related to 5.1 Verwendung von Asprise OCR

5.2 Verwendung von IronOCR

Wir können auch OCRInput verwenden, um PDF-Dateien zu verwalten. Jede Seite von Dokumenten wird von der Iron Tesseract Klasse gelesen. Anschließend wird der Text von den Seiten extrahiert. Wir können auch geschützte Dokumente mit einer zweiten Funktion namens AddPdf öffnen, die es uns erlaubt, PDFs zu unserer Liste von Dokumenten hinzuzufügen (Passwort, falls es geschützt ist). Der folgende Code zeigt, wie man ein passwortgeschütztes PDF-Dokument öffnet:

using IronOcr;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Add a password protected PDF
    Input.AddPdf("example.pdf", "password");

    // Read the PDF document
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Add a password protected PDF
    Input.AddPdf("example.pdf", "password");

    // Read the PDF document
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Using Input = New OcrInput()
	' Add a password protected PDF
	Input.AddPdf("example.pdf", "password")

	' Read the PDF document
	Dim Result = Ocr.Read(Input)

	' Output the recognized text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

Wir können Inhalte von einer Seite in einem PDF-Dokument mit AddpdfPage lesen und extrahieren. Nur die Seitenzahl, aus der wir den Text extrahieren möchten, muss angegeben werden. AddPdfPage erlaubt es uns, Text aus mehreren Seiten zu extrahieren, die wir angeben. In IEnumerable<int> können wir leicht mehrere Seiten angeben. Wir müssen auch den Dateispeicherort sowie die Dateierweiterung angeben. Dies wird im folgenden Codebeispiel dargestellt:

using IronOcr;
using System.Collections.Generic;

IEnumerable<int> numbers = new List<int> {2, 8, 10};
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Extract single page
    Input.AddPdfPage("example.pdf", 10);

    // Extract multiple pages
    Input.AddPdfPages("example.pdf", numbers);

    // Read the pages and extract content
    var Result = Ocr.Read(Input);

    // Output the recognized text and save to a text file
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
using IronOcr;
using System.Collections.Generic;

IEnumerable<int> numbers = new List<int> {2, 8, 10};
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Extract single page
    Input.AddPdfPage("example.pdf", 10);

    // Extract multiple pages
    Input.AddPdfPages("example.pdf", numbers);

    // Read the pages and extract content
    var Result = Ocr.Read(Input);

    // Output the recognized text and save to a text file
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
Imports IronOcr
Imports System.Collections.Generic

Private numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
	' Extract single page
	Input.AddPdfPage("example.pdf", 10)

	' Extract multiple pages
	Input.AddPdfPages("example.pdf", numbers)

	' Read the pages and extract content
	Dim Result = Ocr.Read(Input)

	' Output the recognized text and save to a text file
	Console.WriteLine(Result.Text)
	Result.SaveAsTextFile("ocrtext.txt")
End Using
$vbLabelText   $csharpLabel

Mithilfe der SaveAsTextFile-Funktion können wir das Ergebnis als Textdatei speichern, die es uns ermöglicht, die Datei in den Ausgabeordnerpfad herunterzuladen. Außerdem können wir die Datei mit SaveAsHocrFile in eine HTML-Datei speichern.

6.0 Weitere Funktionen

6.1 Verwendung von Asprise OCR

Asprise OCR hat einige zusätzliche Optionen wie Textbereich zeichnen, Bildbereich zeichnen, Tabellenbereich zeichnen, Erkennungsbereich zeichnen usw. Diese alle helfen dem Benutzer, die Leistung der OCR zu verbessern. Die Anwendung führt nicht nur OCR aus, wir können auch Operationen wie PDFs kombinieren, PDFs teilen, PDFs bearbeiten usw. durchführen.

6.2 Verwendung von IronOCR

IronOCR bietet einzigartige Funktionen, mit denen wir Barcodes und QR-Codes aus gescannten Dokumenten lesen können. Die unten stehenden Codes zeigen, wie wir einen Barcode von einem gegebenen Bild oder Dokument lesen können.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    // Add an image containing a barcode
    Input.AddImage("barcode.gif");

    // Read the image to recognize text and barcodes
    var Result = Ocr.Read(Input);

    // Loop through barcodes and output the value
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    // Add an image containing a barcode
    Input.AddImage("barcode.gif");

    // Read the image to recognize text and barcodes
    var Result = Ocr.Read(Input);

    // Loop through barcodes and output the value
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	' Add an image containing a barcode
	Input.AddImage("barcode.gif")

	' Read the image to recognize text and barcodes
	Dim Result = Ocr.Read(Input)

	' Loop through barcodes and output the value
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
$vbLabelText   $csharpLabel

Das obige ist der Code, der hilft, einen Barcode aus einem gegebenen Bild oder PDF-Dokument zu lesen. Es kann mehr als einen Barcode von einer Seite/Bild lesen. Um einen Barcode zu lesen, hat IronOCR eine einzigartige Einstellung, Ocr.Configuration.ReadBarCodes, die beim Lesen eines Barcodes hilft. Der Standardwert ist auf 'false' gesetzt.

Nach dem Lesen der Eingabe wird die Daten in das Objekt namens OCRResult gespeichert. Diese hat eine Eigenschaft namens Barcodes, und es wird alle verfügbaren Barcodedaten in einer Liste haben. Durch die Verwendung der For-Each-Schleife können wir alle Barcode-Details nacheinander abrufen. Außerdem scannt es den Barcode und liest den Wert des Barcodes – zwei Operationen werden in einem Prozess abgeschlossen.

Es unterstützt auch Threading-Optionen. Wir können mehrere OCR-Prozesse gleichzeitig durchführen. IronOCR kann auch einen bestimmten Bereich aus einer angegebenen Region erkennen.

using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Define the area to recognize text
    var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };

    // Add the document with the specified content area
    Input.Add("document.png", ContentArea);

    // Perform OCR on the specified region
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
} 
using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    // Define the area to recognize text
    var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };

    // Add the document with the specified content area
    Input.Add("document.png", ContentArea);

    // Perform OCR on the specified region
    var Result = Ocr.Read(Input);

    // Output the recognized text to the console
    Console.WriteLine(Result.Text);
} 
Imports IronOcr
Imports System.Drawing

Private Ocr = New IronTesseract()
Using Input = New OcrInput()
	' Define the area to recognize text
	Dim ContentArea = New Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}

	' Add the document with the specified content area
	Input.Add("document.png", ContentArea)

	' Perform OCR on the specified region
	Dim Result = Ocr.Read(Input)

	' Output the recognized text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

Das obige ist der Beispielcode, um OCR in einer bestimmten Region durchzuführen. Wir müssen nur den rechteckigen Bereich im Bild oder PDF angeben. Die Tesseract-Engine in IronOCR hilft uns, den Text zu erkennen.

7.0 IronOCR und Asprise OCR Lizenzmodelle und Preisgestaltung

IronOCR Lizenzmodelle und Preise

30-Tage-Geld-zurück-Garantie: Wenn die Lizenz gekauft wird, erhalten Sie 30 Tage Geld zurück, wenn die Lizenz nicht funktioniert.

Einfache Integration: Die Integration von IronOCR in ein Projekt und eine Umgebung ist so einfach, dass wir dies mit nur einer einzigen Codezeile und dem Hinzufügen aus dem NuGet-Paket tun können. Oder wir können es aus dem Web herunterladen und auf diese Weise in unsere Umgebung integrieren.

Dauerlizenz: Jede Lizenz wird einmal gekauft und muss nicht erneuert werden.

Kostenloser Support und Produktaktualisierungen: Jede Lizenz beinhaltet ein Jahr kostenlose Produktaktualisierungen und Support von dem Team hinter dem Produkt. Es ist möglich, jederzeit Erweiterungen zu kaufen. Erweiterungen können eingesehen werden.

Sofortige Lizenzen: Registrierte Lizenzschlüssel werden sofort nach Zahlungseingang versendet.

Sofortige Lizenzen: Registrierte Lizenzschlüssel werden sofort nach Zahlungseingang versendet.

Die Lite-Lizenz: Das Lite-Paket:

  • 1 Entwickler
  • 1 Standort
  • 1 Projekt

Dieses Paket erlaubt einem einzelnen Softwareentwickler in einer Organisation, Iron Software an einem einzigen Ort zu nutzen. Iron Software kann in einer einzelnen Webanwendung, Intranetanwendung oder Desktop-Software verwendet werden. Lizenzen sind nicht übertragbar, und sie dürfen nicht außerhalb einer Organisation oder einer Agentur-/Kundenbeziehung geteilt werden. Diese Lizenzart, wie alle anderen Lizenzarten, schließt ausdrücklich alle Rechte aus, die nicht ausdrücklich unter der Vereinbarung gewährt werden, ohne OEM-Weiterverbreitung und Nutzung der Iron Software als SaaS ohne den Kauf zusätzlicher Deckung.

Preis: Beginnt bei $799 pro Jahr.

Die professionelle Lizenz: Professionelle Lizenz:

  • 10 Entwickler
  • 10 Standorte
  • 1 Projekt

Dieses Paket erlaubt einer vorher festgelegten Anzahl von Softwareentwicklern in einer Organisation, Iron Software an einzelnen Standorten zu nutzen, bis zu einem Maximum von zehn. Die Iron Software kann in so vielen Websites, Intranetanwendungen oder Desktop-Softwareanwendungen verwendet werden, wie Sie wünschen. Lizenzen sind nicht übertragbar und dürfen nicht außerhalb einer Organisation oder einer Agentur-/Kundenbeziehung geteilt werden. Dieser Lizenztyp, wie alle anderen Lizenztypen, schließt ausdrücklich alle unter dem Vertrag nicht ausdrücklich gewährten Rechte aus, einschließlich der OEM-Weiterverteilung und der Nutzung der Iron Software als SaaS, ohne zusätzliche Abdeckung zu erwerben. Diese Lizenz kann in ein einziges Projekt integriert werden bis zu maximal 10.

Preisgestaltung: Beginnt bei $999 pro Jahr.

Die unbegrenzte Lizenz:

Unbegrenzte Lizenz:

  • Unbegrenzte Entwickler
  • Unbegrenzte Standorte
  • 1 Projekt

Dies erlaubt einer unbegrenzten Anzahl von Softwareentwicklern in einer Organisation, Iron Software an einer unbegrenzten Anzahl von Standorten zu nutzen. Die Iron Software kann in so vielen Websites, Intranetanwendungen oder Desktop-Softwareanwendungen verwendet werden, wie Sie wünschen. Lizenzen sind nicht übertragbar und dürfen nicht außerhalb einer Organisation oder einer Agentur-/Kundenbeziehung geteilt werden. Dieser Lizenztyp, wie alle anderen Lizenztypen, schließt ausdrücklich alle unter dem Vertrag nicht ausdrücklich gewährten Rechte aus, einschließlich der OEM-Weiterverteilung und der Nutzung der Iron Software als SaaS, ohne zusätzliche Abdeckung zu erwerben.

Preisgestaltung: Beginnt bei $2,999 pro Jahr.

Lizenzgebührenfreie Weiterverbreitung: Dies erlaubt es Ihnen, die Iron Software als Teil einer Reihe unterschiedlich verpackter kommerzieller Produkte (ohne Lizenzgebühren zu zahlen) zu vertreiben, basierend auf der Anzahl der Projekte, die von der Basislizenz abgedeckt werden. Es ermöglicht die Bereitstellung von Iron Software innerhalb von SaaS-Software-Diensten, basierend auf der Anzahl der Projekte, die durch die Grundlizenz abgedeckt sind.

Preisgestaltung: Beginnt bei $1,599 pro Jahr.

class="content-img-align-center">
class="center-image-wrapper">Asprise Ocr Alternatives 10 related to IronOCR Lizenzmodelle und Preise

Asprise OCR Lizenzmodelle und Preisgestaltung

Die Lite-Lizenz:

  • Unbegrenzte Endnutzer
  • Text erkennen
  • 1D-Barcodes lesen: UPC, EAN, Code39, Code128
  • Text-, XML- und PDF-Ausgabe
  • Einfache Bereitstellung
  • Unterstützt nur 2 Betriebssysteme
  • Sitze 1
  • Support: Nein

Preisgestaltung: Beginnt bei $7998 pro Jahr.

Die Standardlizenz:

  • Unbegrenzte Endnutzer
  • BMP-, GIF-, PNG-, JPEG-, TIFF- und PDF-Eingabe.
  • Text erkennen
  • 1D-Barcodes lesen: UPC, EAN, Code39, Code128
  • Einige 2D lesen: QR und Data Matrix nur
  • Text-, XML- und PDF-Ausgabe
  • Einfache Bereitstellung
  • Support: Nein

Preisgestaltung: Beginnt bei $7,998 pro Jahr.

Die Enterprise-Lizenz:

  • Unbegrenzte Endnutzer
  • BMP-, GIF-, PNG-, JPEG-, TIFF- und PDF-Eingabe.
  • Text erkennen
  • 1D-Barcodes lesen: UPC, EAN, Code39, Code128
  • 2D: QR, PDF 417, Data Matrix & Aztek
  • Text-, XML- und PDF-Ausgabe
  • Einfache Bereitstellung
  • Multithreading, Multiprocessing

Preisgestaltung: Beginnt bei $12,998.

class="content-img-align-center">
class="center-image-wrapper">Asprise Ocr Alternatives 11 related to Asprise OCR Lizenzmodelle und Preisgestaltung

Die IronOCR Lite, einschließlich eines Einzelentwicklerpakets mit einem Jahr Support, kosten etwa $799, während Asprise Lite, einschließlich eines Einzelentwicklerpakets, $7998 ohne technischen Support und $6,296 mit bezahltem technischen Support kostet. Die IronOCR Professional-Lizenz, einschließlich eines 10-Entwickler-Pakets mit einem Jahr technischem Support, kostet $999, während die äquivalente Asprise-Lizenz, einschließlich eines 10-Entwickler-Pakets, $37,998 pro Jahr ohne technischen Support, aber mit bezahlten technischen Releases und Updates sowie Unterstützung für ein Jahr kostet $46,999.00.

Die IronOCR Lite- und Professional-Pakete haben SaaS-Service oder OEM und eine 5-Jahres-Support-Option. Die Lite-Version, einschließlich eines Einzelentwicklerpakets mit 5-jährigem Support und SaaS- und OEM-Dienstleistungen, kostet 2897 USD, während Asprise ein SaaS- oder OEM-Dienstleistung und eine angepasste Supportoption hat. Die IronOCR Professional-Version enthält ein 10-Entwickler-Paket mit einem Jahr bezahltem Support und SaaS- und OEM-Dienstleistungen für 3397 USD, während die Asprise-Version mit einem 10-Entwickler-Paket ohne 1 Jahr Support und mit SaaS- und OEM-Dienstleistungen $59,996 kostet.

8.0 Fazit

IronOCR im .NET Framework-Kontext stellt Tesseract bereit, das einfach und leicht zu verwenden ist. Es unterstützt Fotos und PDF-Dokumente auf verschiedene Weise. Es bietet auch eine Reihe von Einstellungen, um die Leistung der Tesseract-OCR-Bibliothek zu verbessern. Verschiedene Sprachen werden unterstützt und mehrere Sprachen in einem einzigen Vorgang. Um mehr über die Tesseract-OCR zu erfahren, besuchen Sie deren Website.

Asprise ist eine Softwareanwendung, die eine künstliche Intelligenz-Engine verwendet, um Bilder und PDF-Dokumente zu erkennen. Es bietet auch verschiedene Einstellungen, um die Leistung des OCR-Prozesses zu verbessern. Darüber hinaus bietet es die Möglichkeit, mehrere Sprachen auszuwählen. Asprise hat einige Einschränkungen bei der Nutzung von Seitentransformationen. Es hat auch unterschiedliche Preise für verschiedene Betriebssysteme.

IronOCR-Pakete bieten bessere Lizenzierung und Support im Vergleich zu Asprise. Asprise OCR hat maßgeschneiderte und feste Pakete, die teurer sind. IronOCR beginnt bei $799, während Asprise OCR bei $7994 pro Jahr beginnt, daher ist unser Produkt kostengünstiger und bietet mehr Funktionen als Asprise. Es unterstützt auch mehrere Plattformen zu einem einzigen Preis.

Was warten Sie also noch? Die kostenlose Testversion ist für alle offen. You can obtain the License here and begin straightaway.

Hinweis:Aspose ist eine eingetragene Marke des jeweiligen Eigentümers. Diese Seite ist weder mit Aspose verbunden, noch von Aspose genehmigt oder gesponsert. Alle Produktnamen, Logos und Marken sind Eigentum ihrer jeweiligen Eigentümer. Vergleiche dienen nur zu Informationszwecken und spiegeln öffentlich zugängliche Informationen zum Zeitpunkt des Schreibens wider.

Häufig gestellte Fragen

Was ist optische Zeichenerkennung?

Optische Zeichenerkennung (OCR) ist die Technologie, die verwendet wird, um verschiedene Arten von Dokumenten, wie gescannte Papierdokumente, PDFs oder von einer Digitalkamera aufgenommene Bilder, in bearbeitbare und durchsuchbare Daten zu konvertieren. Tools wie IronOCR werden verwendet, um OCR durchzuführen, indem sie Bilder von Text in tatsächliche Textdaten umwandeln.

Wie kann ich Bilder in Text umwandeln mit C#?

IronOCR bietet eine robuste Lösung, um Bilder in Text in C# umzuwandeln. Sie können dessen leistungsstarke OCR-Funktionen nutzen, um Bilddateien zu verarbeiten und Text zu extrahieren, sogar von minderwertigen Bildern, unter Verwendung der Tesseract-5-Engine.

Welche Formate unterstützt IronOCR für OCR-Operationen?

IronOCR unterstützt eine breite Palette von Formaten für OCR-Operationen, einschließlich JPEG, PNG, GIF, BMP, TIFF und PDF. Es kann auch mehrseitige Dokumente und passwortgeschützte PDFs verarbeiten.

Wie installiere ich IronOCR in meinem C#-Projekt?

Sie können IronOCR in Ihrem C#-Projekt mit dem NuGet-Paket-Manager in Visual Studio installieren. Alternativ können Sie die Befehlszeile mit Install-Package IronOCR verwenden oder es direkt von der IronOCR-Website herunterladen.

Was sind die Vorteile der Verwendung von IronOCR gegenüber anderen OCR-Bibliotheken?

IronOCR bietet umfangreiche Sprachauswahl, exzellente Leistung bei minderwertigen Bildern und Funktionen wie Barcode- und QR-Code-Erkennung. Es bietet kostengünstige Lizenzierung und unterstützt mehrere Plattformen zu einem einzigen Preis, was es zu einer vielseitigen Wahl für Entwickler macht.

Kann IronOCR mehrseitige Dokumente verarbeiten?

Ja, IronOCR kann mehrseitige Dokumente verarbeiten, einschließlich TIFFs und PDFs, und Text effizient von jeder Seite extrahieren. Dies ist besonders nützlich für die Bearbeitung großer Dokumente oder das Batch-Processing.

Welche Lizenzierungsoptionen sind für IronOCR verfügbar?

IronOCR bietet flexible, unbefristete Lizenzierungsoptionen, einschließlich Lite-, Professional- und Unlimited-Lizenzen. Diese Lizenzen sind lizenzgebührenfrei und unterstützen SaaS- und OEM-Dienste, was sie für eine Vielzahl von Bereitstellungsszenarien geeignet macht.

Wie geht IronOCR mit der Textextraktion aus minderwertigen Bildern um?

IronOCR zeichnet sich in der Textextraktion aus minderwertigen Bildern aus, indem es fortschrittliche Vorverarbeitungstechniken verwendet, um die Bildqualität zu verbessern, bevor das OCR durchgeführt wird. Dies verbessert die Genauigkeit der Texterkennung erheblich.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen