In diesem Artikel vergleichen wir zwei der gängigsten Bibliotheken und Anwendungen für OCR-Rasterformate und PDF-Dokumentbilder. Diese sind:
Aspose.OCR
IronOCR
1.0 Einführung
1.1 Aspose.OCR Einführung und Funktionen
Aspose.OCR für .NET ist ein leistungsstarkes und robustes Paket für die optische Zeichenerkennung. Dies ist eine hervorragende Ergänzung zu jeder Anwendung und kann den Prozess automatisieren. Die eigenständige OCR-API ist erweiterbar, benutzerfreundlich und kompakt. Es enthält einen einfachen Satz von Klassen, die alle Funktionen bieten, die Sie benötigen, um Text ohne zusätzlichen Aufwand zu erkennen und die korrekte Textreihenfolge beizubehalten. Aspose.OCR kann über 100 verschiedene Formate lesen und bietet eine Vielzahl nützlicher Funktionen, die von der Fähigkeit, Schriftarten zu lesen, Stil-Effekte (fett/kursiv) anzuwenden, bis hin zur Entfernung von Rauschen aus Ihrem Bild reichen. Die API kann den Grafikprozessor für die optische Zeichenerkennung nutzen und so den Stromverbrauch der CPU senken.
Merkmale von Aspose.OCR
Programmgesteuertes Erkennen, Identifizieren und Lesen von Zeichen aus Bildern.
Scannen Sie das gesamte Bild oder nur einen bestimmten Teil des Bildes.
Schräglagenkorrektur für OCR-Betrieb. Gedrehte Bilder scannen.
Unterstützt JPEG, PNG, GIF, etc. Die vollständige Liste der unterstützten Dateiformate finden Sie auf der Seite Unterstützte Dateiformate, und abonnieren Sie das Aspose-Produkt.
Unterstützung für viele Zeichen, einschließlich Zahlen und Alphabete. Eine vollständige Liste der unterstützten Zeichen finden Sie auf der Seite Unterstützte Zeichen.
Derzeit werden 20 europäische Sprachen und Chinesisch unterstützt.
Erkennen und lesen Sie gängige Schriftarten wie Arial, Times New Roman, Courier New, Tahoma, Calibri und Verdana.
Unterstützt normale, fette und kursive Schriftstile.
Anwendung verschiedener Rauschunterdrückungsfilter zur Unterstützung der Bilderkennung.
Berechnen Sie die Begrenzungsrahmen von Zeilen oder Absätzen.
Erhalten Sie für jedes erkannte Zeichen eine Auswahlmöglichkeit.
URI übergeben und das Bild daraus erkennen.
Erkennen Sie mehrere Bilder in einem Ordner oder Zip-Archiv.
Ergebnisse im JSON-Format abrufen.
Speichern der Ergebnisse im Text-, DOCX- oder PDF-Format
Für die Integration der Toggle-Navigation ist Aspose eine gute Option, die es gibt. Die Konsole für erkannten Text und die Dokumententexterkennung oder die Bild-zu-Text- oder Bild-OCR-API sind Beispiele für Funktionen, die nützlich sein können.
Zusätzlich zur automatischen Rechtschreibprüfung ist die Bilddetektionssoftware auch so konzipiert, dass sie eine Vielzahl von Ausgabeformaten (wie PNG) unterstützt und nicht-textuelle Blöcke ignoriert, ohne eine zusätzliche OCR-API zu benötigen. Auf eigenständige API-Funktionen kann in der Entwicklungsumgebung zugegriffen werden, um Text aus Bildern zu erfassen.
1.2 IronOCR - Einführung und Funktionen
IronOCR for .NET liest Textinhalte aus Fotos und PDFs in .NET-Anwendungen und Websites. Die Software hilft beim Scannen von Fotos nach Text und Barcodes. Es gibt den Inhalt als reinen Text oder als strukturierte Daten aus. IronOCR unterstützt zahlreiche Sprachen weltweit. Die OCR-Bibliothek kann in MVC-, Web-, Konsolen- und Desktop-.NET-Anwendungen verwendet werden. Für kommerzielle Einsätze wird die Lizenzierung mit direkter Unterstützung durch das Entwicklungsteam durchgeführt.
Mit der neuesten Tesseract 5-Engine liest IronOCR Text, Barcodes und QR-Codes aus jedem Bild- oder PDF-Format. Diese Bibliothek erweitert Desktop-, Konsolen- und Webanwendungen schnell um OCR.
IronOCR unterstützt 127 internationale Sprachen. Es unterstützt auch benutzerdefinierte Sprachen und Wortlisten.
Es kann mehr als 20 Barcode- und QR-Code-Formate lesen.
IronOCR unterstützt die mehrseitigen Bildformate GIF und TIFF.
Sie korrigiert gescannte Bilder von schlechter Qualität.
IronOCR unterstützt Multithreading. Er kann einen oder mehrere Prozesse gleichzeitig ausführen.
IronOCR kann strukturierte Daten auf Seiten, Absätzen, Zeilen, Wörtern, Zeichen usw. ausgeben.
IronOCR unterstützt Betriebssysteme wie Windows, Linux, macOS, etc.
2. Erstellen eines neuen Projekts in Visual Studio
Öffnen Sie Visual Studio und rufen Sie das Menü Datei auf. Wählen Sie Neues Projekt und dann Konsolenanwendung.
Konsolen-App
Geben Sie den Projektnamen ein und wählen Sie den Dateipfad in dem entsprechenden Textfeld aus. Klicken Sie dann auf die Schaltfläche Create und wählen Sie ein .NET-Framework aus:
Neue Projektkonfiguration
Das Projekt wird nun die Struktur für die ausgewählte Anwendung generieren.
Datei Program.cs
3.0 Installieren
3.1 Aspose.OCR installieren
Installation von Aspose.OCR für .NET über NuGet
Wir können die Aspose.OCR API in unserer Anwendung mit NuGet installieren. Gehen Sie einfach zum Menü Tools in Visual Studio und wählen Sie den NuGet Package Manager. Wählen Sie im Seitenmenü NuGet-Paket für eine Lösung verwalten aus. Es öffnet sich ein Fenster des NuGet Package Managers. Gehen Sie auf die Registerkarte Durchsuchen und suchen Sie nach Aspose.OCR. Wählen Sie dann die Aspose API aus den Suchergebnissen aus und klicken Sie auf die Schaltfläche "Installieren". Die Aspose-API wird installiert und ist bereit, im Projekt verwendet zu werden.
Installieren oder aktualisieren Sie Aspose.OCR über die Paketmanager-Konsole
Auf ähnliche Weise können Sie Aspose.OCR über die Konsole installieren. Öffnen Sie die NuGet-Konsole, die sich normalerweise am unteren Rand eines Visual Studio-Projekts befindet, geben Sie den folgenden Befehl ein und drücken Sie die Eingabetaste.
“Install-Package Aspose.OCR -Version x.x.0”
3.2 IronOCR installieren
Die IronOCR-Bibliothek kann auf vier Arten heruntergeladen und installiert werden.
Diese sind:
Visual Studio verwenden.
Verwendung der Befehlszeile.
Laden Sie die Software direkt von der NuGet-Website herunter.
Download von der IronPDF-Website.
3.2.1 Verwendung von Visual Studio
Der folgende Screenshot zeigt, wie Sie den NuGet Package Manager öffnen.
NuGet-Paketmanager
Klicken Sie im Fenster des Paketmanagers auf Durchsuchen und suchen Sie nach dem Schlüsselwort "IronOCR", wie in der folgenden Abbildung dargestellt:
IronOCR-Installation
In der obigen Abbildung sehen wir die Liste der verwandten Suchanfragen. Wir müssen die gewünschte Option auswählen, um das Paket in der Lösung zu installieren.
3.2.2 Verwendung der Kommandozeile
In Visual Studio: Gehen Sie zu Tools -> NuGet-Paket-Manager -> Paket-Manager-Konsole
Geben Sie auf der Registerkarte Konsole die folgende Zeile ein.
Install-Package IronOcr
Jetzt wird das Paket in das aktuelle Projekt heruntergeladen/installiert und ist einsatzbereit.
3.2.3 Direktes Herunterladen von der NuGet-Website
Die dritte Möglichkeit ist, das NuGet-Paket direkt von der Website herunterzuladen.
Wählen Sie im Menü auf der rechten Seite die Option Paket herunterladen.
Doppelklicken Sie auf das heruntergeladene Paket. Sie wird automatisch installiert.
Laden Sie anschließend die Lösung neu und verwenden Sie sie im Projekt.
3.2.4 Download direkt von der IronOCR-Website
Klicken Sie hier, um das neueste Paket direkt von der Website herunterzuladen. Nach dem Herunterladen folgen Sie den unten stehenden Schritten, um das Paket dem Projekt hinzuzufügen.
Klicken Sie mit der rechten Maustaste auf das Projekt im Projektmappenfenster.
Wählen Sie dann die Option Referenz und suchen Sie den Speicherort der heruntergeladenen Referenz.
Klicken Sie anschließend auf OK, um die Referenz hinzuzufügen.
4.0 OCR-Bild
Sowohl IronOCR als auch Aspose.OCR verfügen über eine OCR-Technologie, die Bilder in Text umwandeln kann.
4.1 Aspose.OCR verwenden
Der folgende Codeausschnitt demonstriert die Verwendung der RecognizeImage-Methode, um eine OCR-Operation auf dem Bild einer Seite durchzuführen.
// For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();
// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();
// Recognize image
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");
// Display the recognized text
Console.WriteLine(result);
// For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();
// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();
// Recognize image
string result = api.RecognizeImage(dataDir + "Sampleocr.bmp");
// Display the recognized text
Console.WriteLine(result);
' For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
' The path to the documents directory.
Dim dataDir As String = RunExamples.GetDataDir_OCR()
' Initialize an instance of AsposeOcr
Dim api As New AsposeOcr()
' Recognize image
Dim result As String = api.RecognizeImage(dataDir & "Sampleocr.bmp")
' Display the recognized text
Console.WriteLine(result)
$vbLabelText $csharpLabel
Der folgende Codeausschnitt demonstriert die Verwendung der RecognizeLine-Methode, um eine OCR-Operation auf einem Bild mit einer einzigen Zeile durchzuführen.
// For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();
// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();
// Recognize image
string result = api.RecognizeLine(dataDir + "sample_line.png");
// Display the recognized text
Console.WriteLine(result);
// For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_OCR();
// Initialize an instance of AsposeOcr
AsposeOcr api = new AsposeOcr();
// Recognize image
string result = api.RecognizeLine(dataDir + "sample_line.png");
// Display the recognized text
Console.WriteLine(result);
' For complete examples and data files, please go to https://github.com/aspose-ocr/Aspose.OCR-for-.NET
' The path to the documents directory.
Dim dataDir As String = RunExamples.GetDataDir_OCR()
' Initialize an instance of AsposeOcr
Dim api As New AsposeOcr()
' Recognize image
Dim result As String = api.RecognizeLine(dataDir & "sample_line.png")
' Display the recognized text
Console.WriteLine(result)
$vbLabelText $csharpLabel
4.2 Verwendung von IronOCR
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
Input.AddImage(@"3.png");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
Console.ReadKey();
}
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
Input.AddImage(@"3.png");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
Console.ReadKey();
}
Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
Input.AddImage("3.png")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
Console.ReadKey()
End Using
$vbLabelText $csharpLabel
Die Tesseract 5 API, mit der wir Bilddateien in Text umwandeln können, wird oben demonstriert. Wir erstellen ein Objekt für IronTesseract in der obigen Codezeile. Wir erstellen außerdem ein OcrInput-Objekt, das es uns ermöglicht, ein oder mehrere Bilddateien hinzuzufügen. Wir müssen möglicherweise den verfügbaren Bildpfad im Code angeben, wenn wir die Methode OcrInput Objekt add verwenden. Es können beliebig viele Bilder hinzugefügt werden. Die Funktion "Read" in dem zuvor erstellten IronTesseract-Objekt kann verwendet werden, um die Bilder zu erhalten, indem die Bilddatei geparst und das Ergebnis in das OCR-Ergebnis extrahiert wird. Es ist in der Lage, Text aus Fotos zu extrahieren und in eine Zeichenkette zu konvertieren.
Wir können auch Tesseract verwenden, um Bilder mit mehreren Bildern hinzuzufügen. AddMultiFrameTiff ist eine andere Methode für diesen Vorgang. Die Tesseract-Bibliothek liest jedes Einzelbild des Bildes, und jedes Einzelbild wird als eine eigene Seite behandelt. Der Prozess liest das erste Bild und fährt dann mit dem nächsten Bild fort, bis alle Bilder des Bildes gescannt worden sind. Nur das TIFF-Bildformat wird von dieser Methode unterstützt.
IronOCR-Installation
Das obige Bild ist die Ausgabe des IronOCR-Ergebnisses, das die Daten genau in bearbeitbaren Text umgewandelt hat.
5.0 OCR-PDF-Dateien
IronOCR und Aspose.OCR konvertieren PDF-Dateien in bearbeitbaren Text. Aspose.OCR bietet dem Benutzer eine Reihe von Optionen, z. B. Speichern der Seite, Bearbeiten des Bildes, Erkennen der Seite usw. Es bietet auch Speicheroptionen wie Text, Dokument, HTML-Format, etc. IronOCR ermöglicht es uns auch, eine konvertierte OCR-Datei in HTML, Text, PDF usw. zu speichern.
5.1 Aspose.OCR verwenden
Aspose.OCR bietet die Methode RecognizePdf, die Text in den aus gescannten PDF-Dateien extrahierten Bildern erkennen kann. Die RecognizePdf-Methode nimmt den PDF-Pfad als Parameter und das DocumentRecognitionSettings-Objekt. Der folgende Codeausschnitt demonstriert die Verwendung der RecognizePdf-Methode, um Bilder aus einer gescannten mehrseitigen PDF-Datei zu erkennen.
// The path to the PDF file
string dataDir = RunExamples.GetDataDir_OCR();
// Archive Path
string fullPath = dataDir + "OCR.pdf";
// Recognize images from PDF
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
set.DetectAreas = false;
List<RecognitionResult> result = api.RecognizePdf(imgPath, set);
// Print result
int pageNumber = 0;
foreach (var page in result)
{
System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
}
// The path to the PDF file
string dataDir = RunExamples.GetDataDir_OCR();
// Archive Path
string fullPath = dataDir + "OCR.pdf";
// Recognize images from PDF
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
set.DetectAreas = false;
List<RecognitionResult> result = api.RecognizePdf(imgPath, set);
// Print result
int pageNumber = 0;
foreach (var page in result)
{
System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
}
' The path to the PDF file
Dim dataDir As String = RunExamples.GetDataDir_OCR()
' Archive Path
Dim fullPath As String = dataDir & "OCR.pdf"
' Recognize images from PDF
Dim [set] As New DocumentRecognitionSettings()
[set].DetectAreas = False
Dim result As List(Of RecognitionResult) = api.RecognizePdf(imgPath, [set])
' Print result
Dim pageNumber As Integer = 0
For Each page In result
'INSTANT VB WARNING: An assignment within expression was extracted from the following statement:
'ORIGINAL LINE: System.Console.WriteLine(string.Format("Page: {0} text: {1}", pageNumber++, page.RecognitionText));
System.Console.WriteLine($"Page: {pageNumber} text: {page.RecognitionText}")
pageNumber += 1
Next page
$vbLabelText $csharpLabel
5.2 Verwendung von IronOCR
Wir können auch OCRInput verwenden, um PDF-Dateien zu verwalten. Jede Seite eines Dokuments wird von der IronTesseract-Klasse gelesen. Der Text wird dann aus den Seiten extrahiert. Wir können auch geschützte Dokumente mit einer zweiten Funktion namens AddPDF öffnen, die es uns ermöglicht, PDFs zu unserer Liste von Dokumenten hinzuzufügen (Passwort, falls es geschützt ist). Der folgende Code zeigt, wie ein kennwortgeschütztes PDF-Dokument geöffnet werden kann:
var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
Input.AddPdf("example.pdf", "password");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
Input.AddPdf("example.pdf", "password");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract() ' nothing to configure
Using Input = New OcrInput()
Input.AddPdf("example.pdf", "password")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
$vbLabelText $csharpLabel
Wir können Inhalte von einer einzelnen Seite in einem PDF-Dokument mit AddPdfPage lesen und extrahieren. Es muss nur die Seitenzahl angegeben werden, aus der wir den Text extrahieren wollen. AddPdfPage ermöglicht es uns, Text von zahlreichen von uns angegebenen Seiten zu extrahieren. In IEnumerable<int> können wir einfach mehrere Seiten angeben. Wir müssen auch den Speicherort der Datei sowie die Erweiterung der Datei angeben. Dies wird im folgenden Codebeispiel veranschaulicht:
IEnumerable<int> numbers = new List<int> {2,8,10 };
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
//single page
Input.AddPdfPage("example.pdf",10);
//Multiple page
Input.AddPdfPages("example.pdf", numbers);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
Result.SaveAsTextFile("ocrtext.txt");
}
IEnumerable<int> numbers = new List<int> {2,8,10 };
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
//single page
Input.AddPdfPage("example.pdf",10);
//Multiple page
Input.AddPdfPages("example.pdf", numbers);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
Result.SaveAsTextFile("ocrtext.txt");
}
Dim numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
'single page
Input.AddPdfPage("example.pdf",10)
'Multiple page
Input.AddPdfPages("example.pdf", numbers)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
Result.SaveAsTextFile("ocrtext.txt")
End Using
$vbLabelText $csharpLabel
Mit der Funktion SaveAsTextFile können wir das Ergebnis als Textdatei speichern, wodurch es uns ermöglicht wird, die Datei in das Ausgabeverzeichnis herunterzuladen. Außerdem können wir die Datei mit SaveAsHocrFile in einer HTML-Datei speichern.
6.0 Sonstige Merkmale
6.1 Aspose.OCR verwenden
Aspose.OCR verfügt über einige zusätzliche Optionen wie Draw Text Area, Draw Picture Area, Draw Table Area, Draw Recognize Area, etc. Sie alle helfen dem Benutzer, die Leistung der OCR zu verbessern. Die Anwendung führt nicht nur OCR durch, sondern wir sind auch in der Lage, Operationen wie das Kombinieren von PDFs, das Teilen von PDFs, das Bearbeiten von PDFs usw. durchzuführen.
6.2 Verwendung von IronOCR
IronOCR verfügt über einzigartige Funktionen, mit denen wir Barcodes und QR-Codes von gescannten Dokumenten lesen können. Die folgenden Codes zeigen, wie wir einen Barcode aus einem bestimmten Bild oder Dokument lesen können.
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
Input.AddImage("barcode.gif");
var Result = Ocr.Read(Input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
}
}
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
Input.AddImage("barcode.gif");
var Result = Ocr.Read(Input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
}
}
Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
Input.AddImage("barcode.gif")
Dim Result = Ocr.Read(Input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
Next Barcode
End Using
$vbLabelText $csharpLabel
Der obige Code hilft, einen Barcode aus einem bestimmten Bild oder PDF-Dokument zu lesen. Es kann mehr als einen Barcode von einer Seite/einem Bild lesen. Um den Barcode zu lesen, verfügt IronOCR über eine einzigartige Einstellung, Ocr.Configuration.ReadBarCodes. Der Standardwert ist auf false gesetzt.
Nach dem Einlesen der Eingabe wird die Daten in das Objekt namens OCRResult gespeichert. Dies hat eine Eigenschaft namens Barcodes, und es werden alle verfügbaren Barcodedaten in einer Liste enthalten sein. Mit der foreach-Schleife können wir alle Barcode-Details nacheinander abrufen. Außerdem wird der Barcode gescannt und der Wert des Barcodes gelesen - zwei Vorgänge, die in einem Arbeitsgang erledigt werden.
Es wird auch Threading-Optionen unterstützen. Wir können mehrere OCR-Prozesse auf einmal durchführen. IronOCR ist auch in der Lage, einen bestimmten Bereich aus einer bestimmten Region zu erkennen.
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
$vbLabelText $csharpLabel
Der obige Code ist ein Beispiel für die Durchführung von OCR in einer bestimmten Region. Wir müssen nur den rechteckigen Bereich im Bild oder PDF angeben. Die Tesseract-Engine in IronOCR hilft uns, den Text zu erkennen.
IronOCR und Aspose.OCR Lizenzierungsmodelle und Preisgestaltung
IronOCR Lizenzmodelle und Preise
Eine 30-tägige Geld-zurück-Garantie: IronOCR hat eine 30-tägige Geld-zurück-Richtlinie. Wenn Sie also nach dem Kauf der Software Ihre Meinung ändern, können Sie Ihr Geld innerhalb von 30 Tagen zurückfordern.
Einfache Integration: Die Integration von IronOCR in ein Projekt und eine Umgebung ist so einfach, dass wir dies durch das Schreiben einer einzigen Codezeile und das Hinzufügen aus dem NuGet-Paket erreichen können. Oder wir können sie aus dem Internet herunterladen und auf diese Weise in unsere Umgebung integrieren.
Unbefristete Lizenzierung: Jede Lizenz wird einmalig erworben und erfordert keine Erneuerung.
Kostenloser Support und Produktaktualisierungen: Jede Lizenz beinhaltet ein Jahr kostenlose Produktaktualisierungen und Support vom Team hinter dem Produkt. Es ist jederzeit möglich, Erweiterungen zu erwerben. Erweiterungen können eingesehen werden.
Sofortige Lizenzen: Registrierte Lizenzschlüssel werden versendet, sobald die Zahlung eingegangen ist.
Alle Lizenzen sind unbefristet und gelten für Entwicklung, Staging und Produktion.
Das Lite-Paket
1 Entwickler
1 Standort
1 Projekt
Unbefristete Lizenz
Mit diesem Paket kann ein einzelner Softwareentwickler in einem Unternehmen die Iron Software an einem einzigen Ort nutzen. Es kann in einer einzelnen Webanwendung, Intranetanwendung oder einem Desktop-Softwareprogramm verwendet werden. Lizenzen sind nicht übertragbar und können nicht außerhalb einer Organisation oder einer Agentur-/Kundenbeziehung weitergegeben werden. Dieser Lizenztyp, wie auch alle anderen Lizenztypen, schließt ausdrücklich alle Rechte aus, die nicht ausdrücklich im Rahmen der Vereinbarung gewährt werden, ohne OEM-Weitergabe und Nutzung von Iron Software als SaaS ohne Erwerb einer zusätzlichen Abdeckung.
Preisgestaltung: Beginnt bei $499 pro Jahr.
Die Berufslizenz
10 Entwickler
10 Standorte
10 Projekte
Unbefristete Lizenz
Dadurch kann eine festgelegte Anzahl von Softwareentwicklern in einem Unternehmen diese Iron Software an einzelnen Standorten nutzen, bis zu einer Höchstzahl von zehn. IronOCR kann in beliebig vielen Websites, Intranetanwendungen oder Desktop-Softwareanwendungen verwendet werden. Dieser Lizenztyp, wie auch alle anderen Lizenztypen, schließt ausdrücklich alle Rechte aus, die nicht ausdrücklich im Rahmen der Vereinbarung gewährt werden, einschließlich der OEM-Weiterverbreitung und der Nutzung der Iron Software als SaaS ohne den Erwerb einer zusätzlichen Abdeckung. Diese Lizenz kann in ein einzelnes Projekt integriert werden, bis zu einer Höchstzahl von 10.
Preise: Beginnt ab $999 pro Jahr.
Die Unbegrenzte Lizenz
Unbegrenzt viele Entwickler
Unbegrenzte Anzahl von Standorten
Unbegrenzte Projekte
Unbefristete Lizenz
Dies ermöglicht es einer unbegrenzten Anzahl von Softwareentwicklern in einem Unternehmen, diese Iron Software an einer unbegrenzten Anzahl von Standorten zu nutzen. Sie kann in beliebig vielen Websites, Intranetanwendungen oder Desktop-Softwareanwendungen verwendet werden. Lizenzen sind nicht übertragbar und können nicht außerhalb einer Organisation oder einer Agentur/Kundenbeziehung weitergegeben werden. Dieser Lizenztyp, wie auch alle anderen Lizenztypen, schließt ausdrücklich alle Rechte aus, die nicht ausdrücklich im Rahmen der Vereinbarung gewährt werden, einschließlich der OEM-Weitergabe und der Nutzung der Iron Software als SaaS ohne Erwerb einer zusätzlichen Abdeckung.
Preise: Ab 2999 $ pro Jahr.
Lizenzfreie Weiterverteilung — Dies ermöglicht es Ihnen, diese Iron Software als Teil einer Reihe von unterschiedlich verpackten kommerziellen Produkten zu vertreiben (ohne Lizenzgebühren zahlen zu müssen), basierend auf der Anzahl von Projekten, die durch die Basislizenz abgedeckt sind. Sie ermöglicht die Bereitstellung der Iron Software im Rahmen von SaaS-Software-Services, basierend auf der Anzahl der Projekte, die von der Basislizenz abgedeckt werden.
Preise: Ab $1599 pro Jahr.
Preisgestaltung
Aspose Lizenzmodelle und Preisgestaltung
Die Entwickler-Kleinunternehmerlizenz
Eine Entwickler-Kleinunternehmenslizenz erlaubt es einem Entwickler, mit dem Produkt eine unbegrenzte Anzahl von Endbenutzersoftware zu erstellen und sie nur an einem physischen Standort innerhalb seiner Organisation zu installieren. Wenn Sie Software für Endbenutzer bereitstellen, müssen Sie für jeden Entwickler in Ihrem Entwicklungsteam oder für jeden physischen Standort, an dem die Software verwendet wird, eine Lizenz erwerben. Die Entwickler-Lizenz für kleine Unternehmen erlaubt es Ihnen nicht, Ihre Endbenutzer-Software an Dritte, öffentlich zugängliche Websites und Anwendungen, Extranets, Multi-Site-Intranets oder Nutzungsszenarien von Software as a Service (SaaS) zu verteilen. Sie können die Anwendungen, die Sie mit einer OEM-Lizenz entwickeln, nur auf einem einzigen Client einsetzen. Wenn Sie Bibliotheken zur Verwendung durch andere Unternehmen erstellen oder Ihre Kreationen als Open-Source-Software verbreiten wollen, benötigen Sie eine andere Art von Lizenz.
Preise: Beginnt bei 799 $ pro Jahr.
Die OEM-Lizenz für Entwickler
Die OEM-Lizenz für Entwickler bedeutet, dass ein Entwickler das Produkt auf einer beliebigen Anzahl von Computern an einem beliebigen Standort verwenden kann. Wenn Sie also in einem Büro arbeiten, aber eine Stunde lang in einem anderen Büro etwas erledigen müssen, ist das mit dieser Art von Lizenz möglich. Eine OEM-Entwicklerlizenz deckt einen Hersteller von Softwareprodukten ab - d. h. jemanden, der kein autorisierter Händler des Produkts ist, sondern Software herstellt, die dessen Funktionen nutzt. Um Endbenutzer-Software an einen Endbenutzer weiterzugeben, benötigen Sie diesen Lizenztyp. Um die Verteilung von Endbenutzer-Software an Dritte, öffentlich zugängliche Websites/Anwendungen, Extranets, Intranets mit mehreren Standorten oder SaaS-Projektnutzungsszenarien zu ermöglichen, muss für jeden Entwickler im Entwicklungsteam eine Entwicklerlizenz erworben werden. Diese Lizenz unterstützt nicht die Erstellung von Software wie z. B. einer API oder eines SDK für Endbenutzer.
Preise: Ab $2397 pro Jahr.
Die Site Small Business License
Eine Site Small Business-Lizenz erlaubt bis zu zehn Entwicklern, unbegrenzt Endbenutzersoftware unter Verwendung des Produkts zu erstellen, die an jedem Ihrer zehn physischen Standorte genutzt werden kann (z. B. separate Bürogebäude oder, falls Sie kein Unternehmen mit mehreren Büros sind, an jedem physischen Standort). Wenn Sie mehr als zehn Entwickler haben oder Aspose an mehr als zehn Standorten einsetzen möchten, können Sie eine Mehrplatzlizenz für kleine Unternehmen erwerben. Diese Lizenz unterstützt nicht die Weitergabe der mit dieser Lizenz erstellten Software an andere Organisationen.
Preise: Beginnt ab 3995 $ pro Jahr.
Gemessene OEM-Lizenz
Eine Metered OEM-Lizenz unterstützt eine unbegrenzte Anzahl von Entwicklern, eine unbegrenzte Anzahl von Standorten und eine unbegrenzte Anzahl von Endbenutzer-Software. Sie ermöglicht es den Benutzern, die Endbenutzersoftware an Dritte weiterzugeben. Die kostenpflichtige OEM-Lizenz ist für öffentlich zugängliche Websites/Apps und kann zur Unterstützung von Extranets oder SaaS-Projekten verwendet werden. Sie erstellt Endbenutzersoftware, die in einer Entwicklungsbibliothek mit einer API oder einem SDK verwendet wird.
Preise: Ab $1999 pro Jahr.
Aspose Preisgestaltung
Die IronOCR Lite-Lizenz, einschließlich eines Entwicklerpakets mit einem Jahr Support, kostet etwa 499 $, während Aspose.OCR mit einem Ein-Entwickler-Paket 799 $ mit kostenlosem technischem Support kostet und 1.198 $ mit bezahltem Support. Die IronOCR Professional-Lizenz, die 10 Entwicklerpakete und ein Jahr Support umfasst, kostet 999 $, während die Aspose Site OEM mit 10 Entwicklerpaketen 11.186 $ pro Jahr kostet und kostenlosen technischen Support bietet. Kostenpflichtige technische Releases und Updates erhöhen diesen Betrag auf 23.171 $.
Die IronOCR Lite und Professional Pakete bieten SaaS-Service oder OEM und eine 5-Jahres-Support-Option. Das Lite-Paket, einschließlich eines Entwicklerpakets mit 5 Jahren Support sowie SaaS- und OEM-Dienstleistungen, kostet 2.897 $, während Aspose SaaS- oder OEM-Dienste und angepasste Supportoptionen bietet. Die IronOCR Professional Lizenz umfasst ein 10-Entwickler-Paket mit einem Jahr bezahltem Support sowie SaaS- und OEM-Service, alles zum Preis von $23.171, während Aspose ein 10-Entwickler-Paket ohne Support, aber mit SaaS- und OEM-Service für den Preis von $11.186 anbietet.
7.0 Schlussfolgerung
IronOCR im Kontext des .NET-Frameworks bietet Tesseract, das unkompliziert und einfach zu bedienen ist. Es unterstützt Fotos und PDF-Dokumente auf vielfältige Weise. Außerdem bietet es eine Reihe von Einstellungen zur Verbesserung der Leistung der Tesseract OCR-Bibliothek. Verschiedene Sprachen werden in einem einzigen Arbeitsgang unterstützt. Wenn Sie mehr über Tesseract OCR erfahren möchten, besuchen Sie die Website des Unternehmens.
Aspose OCR ist eine Softwareanwendung, die eine künstliche Intelligenz verwendet, um Bilder und PDF-Dokumente zu erkennen. Es bietet auch verschiedene Einstellungen, um die Leistung des OCR-Prozesses zu verbessern. Außerdem bietet es die Möglichkeit, mehrere Sprachen auszuwählen und dann OCR durchzuführen. Aspose hat einige Einschränkungen bei der Verwendung von Seitenumwandlungen. Es hat auch einen unterschiedlichen Preis für verschiedene Betriebssysteme.
IronOCR-Pakete bieten bessere Lizenzierung und Support im Vergleich zu Aspose. Außerdem ist Aspose teurer. IronOCR kostet ab 499 $, während Aspose bei 999 $ pro Jahr beginnt. Außerdem bietet IronOCR im Vergleich zu Aspose mehr Funktionen und unterstützt mehrere Plattformen zu einem einzigen Preis.
Also, worauf warten Sie noch? Der kostenlose Test ist für alle zugänglich. Sie können die Lizenz hier erwerben und sofort beginnen.
Bevor er Software-Ingenieur wurde, promovierte Kannapat an der Universität Hokkaido in Japan im Bereich Umweltressourcen. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Abteilung für Bioproduktionstechnik ist. Im Jahr 2022 wechselte er mit seinen C#-Kenntnissen zum Engineering-Team von Iron Software, wo er sich auf IronPDF konzentriert. Kannapat schätzt an seiner Arbeit, dass er direkt von dem Entwickler lernt, der den Großteil des in IronPDF verwendeten Codes schreibt. Neben dem kollegialen Lernen genießt Kannapat auch den sozialen Aspekt der Arbeit bei Iron Software. Wenn er nicht gerade Code oder Dokumentationen schreibt, kann man Kannapat normalerweise beim Spielen auf seiner PS5 oder beim Wiedersehen mit The Last of Us antreffen.
< PREVIOUS Ein Vergleich zwischen IronOCR und Nanonets OCR
NÄCHSTES > Ein Vergleich zwischen IronOCR und Syncfusion OCR