Zum Fußzeileninhalt springen
MIT ANDEREN KOMPONENTEN VERGLEICHEN

Ein Vergleich zwischen Google OCR & IronOCR

OCR steht für Optical Character Recognition. Es bietet die Möglichkeit, eine Bilddatei in maschinenkodierten Text zu konvertieren. Die gescannten Dokumente werden vom Computer immer als Bilddatei gespeichert. Die Daten in diesen Bilddateien können nicht durchsucht, bearbeitet oder im Textformat mithilfe eines normalen Texteditors oder sogar einer Textverarbeitungsanwendung gespeichert werden. Die OCR-Verarbeitung hilft, diese Bilder in maschinenlesbaren Text umzuwandeln, um von seinen Benutzern weiterverarbeitet werden zu können.

In diesem modernen Zeitalter werden über das Internet geteilte gescannte Dokumente in digitalem Format bereitgestellt, meist in Form von PDFs oder Bildern. Es gibt eine Vielzahl von Online-Ressourcen, die das Bild in Text umwandeln. Jedoch benötigen die meisten Unternehmen diese Funktionalität in ihren Softwareanwendungen. Vor diesem Hintergrund gibt es viele Bibliotheken, die OCR-Verarbeitungstechnologie bereitstellen, um in Softwareanwendungen eingebettet zu werden.

In diesem Artikel werden wir zwei der beliebtesten OCR-Bibliotheken für C# diskutieren. Diese sind:

  • IronOCR
  • Google Cloud Vision OCR (Vision API)

IronOCR - C# Bibliothek

IronOCR für .NET ist eine C#-Bibliothek zum Scannen, Suchen und Lesen von Bildern & PDFs. Es nimmt eine Bild- oder PDF-Datei als Eingabe und verwendet die neueste benutzerdefinierte Tesseract 5 .NET OCR-Engine, um Text, strukturierte Daten oder durchsuchbare PDF-Dokumente auszugeben. Tesseract ist in über 125 Sprachen verfügbar, zusammen mit plattformübergreifendem Support in .NET Core und .NET Standard, von 2.0 bis 7.

IronOCR ist eine benutzerfreundliche API, die es C#-Entwicklern ermöglicht, Bilder automatisch in Text zu konvertieren, mithilfe der IronTesseract-Klasse und einem API-Schlüssel. Es priorisiert Geschwindigkeit, Genauigkeit und Benutzerfreundlichkeit. Es unterstützt auch die Computer Vision API, um Text mit einer trainierten Modellsammlung zu finden.

Ein weiteres leistungsstarkes Merkmal von IronOCR ist, dass es Barcodes & QR-Codes aus allen Bilddateien scannen und deren Text lesen kann. Weitere wichtige Funktionen von IronOCR sind unten aufgeführt.

Funktionen

  • Internationale Sprachen: Über 125 und Unterstützung von benutzerdefinierten Sprachen mit hoher und schneller Qualitätsleistung
  • Text- und Barcode-Lesen: Lesen von Text & Zahlen aus mehreren Sprachen gleichzeitig
  • Spezialistendokumente: Spezifisches Lesen von Texten von Quittungen, Schecks, Rechnungen
  • Lesen aus vielen Formaten: Bilder (PNG, JPG, GIF, TIFF, BMP), System.Drawing-Objekte, Streams, PDF-Dokumente (optimierte Ziel-DPI)
  • Filter: Filterassistent, Bildkorrektur, Bildausrichtung korrigieren, Bildfarben korrigieren
  • Einfache Datenausgabe: .NET-Textfolgen, Barcode- und QR-Daten, Bilder

Nun schauen wir uns die Google Cloud Vision API an.

Google Cloud Vision OCR

Google Cloud Vision API ist eine Google Cloud OCR-Kundenbibliothek, die die C#-Sprache unterstützt. Sie ermöglicht es C#-Entwicklern, leicht Funktionen zur Erkennung von Computer-Vision in Softwareanwendungen zu integrieren. Sie führt OCR durch und erkennt Text aus Bilddateien, Bildbeschriftungen, Gesichtserkennung und Landmarkenerkennung.

Die Google Cloud Vision API verwendet REST- und RPC-APIs, um ein leistungsstarkes vortrainiertes ML-Modell (Machine Learning) bereitzustellen. Mit der Cloud Vision API können Sie Bilder schnell in Millionen von bereits vordefinierten Kategorien klassifizieren. Es kann auch Objekte erkennen und Text aus gedruckten Dokumenten und handgeschriebener Schrift lesen.

Funktionen

  • Bildertext-Erkennung: OCR eines Bildes zur Texterkennung und Umwandlung in maschinensprachlichen Code
  • Dokumententext-Erkennung: OCR einer Datei (PDF/TIFF), dichter Text
  • Landmarkenerkennung: Gibt Koordinaten erkannter Objekte zurück
  • Logo-Erkennung: Gibt eine Textbeschreibung zurück
  • Beschriftungserkennung: Gibt allgemeine Beschriftungen für das Bild zurück

Der Rest des Artikels geht wie folgt weiter:

  1. Erstellen eines Visual Studio Projekts
  2. Installation von AWS OCR Textract
  3. Installation von Google OCR
  4. Bild zu Text
  5. Barcode und QR-Code zu Text
  6. PDF zu Text
  7. Lizenzierung

1. Erstellen eines Visual Studio-Projekts

1. Erstellen eines Visual Studio Projekts

In diesem Tutorial werden wir Visual Studio 2022, die neueste Version, verwenden. Daher gehe ich davon aus, dass Sie es bereits für C# heruntergeladen und installiert haben. Falls nicht, können Sie es von der Visual Studio-Website herunterladen.

Jetzt müssen wir ein Konsolenprojekt erstellen, um mit beiden Bibliotheken zu starten. Befolgen Sie die Schritte, um ein Projekt zu erstellen:

  • Öffnen Sie Ihr Visual Studio 2022.
  • Klicken Sie auf Neues Projekt erstellen.

    So drucken Sie Barcode in C# Windows-Anwendung Abbildung 1 - Neues Projekt erstellen

  • Wählen Sie C# Konsolenanwendung aus den angegebenen Optionen aus.

    So drucken Sie Barcode in C# Windows-Anwendung Abbildung 2 - Konsolenanwendung

  • Konfigurieren Sie Ihr neues Projekt mit einem Namen und dem Speicherort. Z.B. "OCRProject".
  • Klicken Sie auf Weiter.

    So drucken Sie Barcode in C# Windows-Anwendung Abbildung 3 - Projekt konfigurieren

  • Wählen Sie aus den zusätzlichen Informationen .NET 6.0 Framework, da dies die stabilste Version ist.

    So drucken Sie Barcode in C# Windows-Anwendung Abbildung 4 - Zusätzliche Informationen

  • Jetzt klicken Sie auf Erstellen und das Projekt wird an Ihrem angegebenen Ort erstellt.

Als nächstes installieren wir die Bibliotheken in unserem Projekt zum Vergleich.

3. Installation von AWS OCR Textract

Es gibt mehrere Möglichkeiten, die IronOCR-Bibliothek zu installieren. Schauen wir sie uns der Reihe nach an.

2.1. Verwenden des Visual Studio NuGet Package Manager

NuGet ist der Paketmanager zum Herunterladen und Installieren von Abhängigkeiten in Ihrem Projekt. Seine Pakete enthalten den kompilierten Code (DLL) und die Manifestdatei. Greifen Sie darauf zu, indem Sie die folgende Methode verwenden:

  • Klicken Sie auf die Registerkarte Werkzeuge
  • Erweitern Sie die Option NuGet Paket-Manager
  • Klicken Sie auf NuGet-Pakete für die Lösung verwalten

    So drucken Sie Barcode in C# Windows-Anwendung Abbildung 5 - NuGet Package Manager

  • Oder klicken Sie mit der rechten Maustaste auf den Projektmappen-Explorer
  • Klicken Sie auf NuGet-Pakete verwalten

    So drucken Sie Barcode in C# Windows-Anwendung Abbildung 6 - Projektmappen-Explorer

Jetzt öffnet sich das NuGet-Paketmanager-Fenster. Suchen Sie nach IronOCR und klicken Sie auf Installieren.

So drucken Sie Barcode in C# Windows-Anwendung Abbildung 7 - IronOCR

2.2. Download von der NuGet-Website

Es kann direkt von der offiziellen NuGet-Website heruntergeladen werden. Befolgen Sie die angegebenen Schritte:

  1. Klicken Sie auf den Link zur NuGet-Website.
  2. Klicken Sie auf der rechten Seite der Seite auf die Option Paket herunterladen.
  3. Öffnen Sie das heruntergeladene Paket, und es wird mit der Installation beginnen.
  4. Laden Sie schließlich die Lösung neu und es ist erledigt.

2.3. Download über die IronOCR-Webseite

Besuchen Sie einfach die Iron Software-Website und navigieren Sie zur IronOCR für .NET-Webseite. Scrollen Sie nach unten und klicken Sie auf DLL herunterladen oder Windows Installer herunterladen.

So drucken Sie Barcode in C# Windows-Anwendung Abbildung 8 - Iron Software-Website

Eine Zip-Datei wird heruntergeladen. Extrahieren Sie sie und fügen Sie sie zur Ihrem Projekt hinzu oder führen Sie den Windows-Installer aus. Befolgen Sie die unten angegebenen Schritte, um sie zu Ihrem Projekt hinzuzufügen.

  1. Klicken Sie mit der rechten Maustaste auf die Abhängigkeiten des Projekts in Visual Studio aus dem Projektmappen-Explorer heraus.
  2. Wählen Sie dann die Option Projektverweis hinzufügen.
  3. Suchen Sie nach dem Speicherort der heruntergeladenen DLL-Datei.
  4. Klicken Sie schließlich auf OK, um den Projektverweis hinzuzufügen.

2.4. Verwenden der Befehlszeile in Visual Studio

  1. Navigieren Sie zur Registerkarte Werkzeuge in Visual Studio.
  2. Erweitern Sie die Option NuGet Paket-Manager.
  3. Wählen Sie Paket-Manager-Konsole aus und geben Sie den folgenden Befehl ein:
Install-Package IronOcr

Dies wird IronOCR automatisch herunterladen und in Ihrem Projekt installieren.

Nun sind wir bereit, IronOCR in unserem Projekt zu verwenden.

2.5. Hinzufügen der erforderlichen IronOCR-Namensräume

Es gibt nur einen erforderlichen Namensraum und dieser muss oben in der Quelldatei hinzugefügt werden, in der wir auf seine Funktionen zugreifen möchten.

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

Nun installieren wir Google Vision OCR.

3. Installation von Google OCR

Um die Vision API in Ihrem C#-Projekt verwenden zu können, müssen Sie die folgenden Voraussetzungen erfüllen:

  1. Erstellen Sie ein Google-Konto
  2. Erstellen Sie ein neues Projekt aus der Google Cloud Console
  3. Aktivieren Sie die Abrechnung
  4. Aktivieren Sie die Vision-API
  5. Erstellen Sie ein Dienstkonto und legen Sie die Anmeldeinformationen fest
  6. Laden Sie den Dienstkonto-Schlüssel in JSON-Dateiformat herunter

Sie können die Einrichtung und Anforderungen zur Nutzung der Google Cloud Vision detailliert in der offiziellen Dokumentation hier einsehen.

Nun, um die Google Cloud-Kundenbibliothek für die Durchführung der OCR-Verarbeitung in Visual Studio zu installieren, müssen wir den NuGet Paket-Manager verwenden.

  • Sie können das AWS Textract SDK vom NuGet-Paketmanager herunterladen und installieren.

Greifen Sie darauf zu, indem Sie die folgende Methode verwenden:

  • Klicken Sie auf die Registerkarte Werkzeuge
  • Erweitern Sie die Option NuGet Paket-Manager
  • Klicken Sie auf NuGet-Pakete für die Lösung verwalten

    So drucken Sie Barcode in C# Windows-Anwendung Abbildung 9 - Werkzeuge-Registerkarte

  • Oder klicken Sie mit der rechten Maustaste auf den Projektmappen-Explorer
  • Klicken Sie auf NuGet-Pakete verwalten

    So drucken Sie Barcode in C# Windows-Anwendung Abbildung 10 - NuGet-Pakete verwalten

Jetzt öffnet sich das NuGet-Paketmanager-Fenster. Durchsuchen Sie Google Cloud Vision OCR und klicken Sie auf Installieren.

So drucken Sie Barcode in C# Windows-Anwendung Abbildung 11 - Google Cloud Vision OCR

3.2. Hinzufügen des Google Vision API-Namensraums

Fügen Sie den folgenden Namensraum hinzu, um Google OCR Vision API zu verwenden:

using Google.Cloud.Vision.V1;
using Google.Cloud.Vision.V1;
Imports Google.Cloud.Vision.V1
$vbLabelText   $csharpLabel

Legen Sie auch die Umgebungsvariable mit den in JSON-Dateiformat heruntergeladenen Schlüssel-Anmeldeinformationen fest.

Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json");
Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json");
Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json")
$vbLabelText   $csharpLabel

Nun ist alles eingerichtet und einsatzbereit.

4. Bild zu Text

Daten aus Bildern zu lesen, ist eine mühsame Aufgabe. Bildauflösung und -qualität spielen eine wichtige Rolle bei der Inhaltsextraktion. Beide Bibliotheken bieten eine Optical Character Recognition (OCR)-Funktion, um Text aus Bildern zu extrahieren.

IronOCR ermöglicht das Erkennen und Lesen von Text aus PDF-Dokumentformaten mithilfe des fortschrittlichen Tesseract.

IronOCR macht es Entwicklern sehr einfach, den Inhalt einer Bilddatei mit seiner leistungsstarken IronTesseract-Klasse zu lesen. Hier werden wir ein PNG-Bild verwenden, um Text aus einer Bilddatei zu lesen und der Code lautet wie folgt:

var ocr = new IronTesseract();
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/employmentapp.png");

    // Process the image
    var result = ocr.Read(input);

    // Output the extracted text
    Console.WriteLine(result.Text);
}
var ocr = new IronTesseract();
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/employmentapp.png");

    // Process the image
    var result = ocr.Read(input);

    // Output the extracted text
    Console.WriteLine(result.Text);
}
Dim ocr = New IronTesseract()
Using input = New OcrInput()
	' Add the image to be processed
	input.AddImage("test-files/employmentapp.png")

	' Process the image
	Dim result = ocr.Read(input)

	' Output the extracted text
	Console.WriteLine(result.Text)
End Using
$vbLabelText   $csharpLabel

EINGANGSBILD

So drucken Sie Barcode in C# Windows-Anwendung Abbildung 12 - Eingabe mit Begrenzungsrahmen

AUSGABE

So drucken Sie Barcode in C# Windows-Anwendung Abbildung 13 - Bildausgabe mit einzelnen Wörtern

Die Ausgabe von IronOCR entspricht dem ursprünglichen Bild, das ihm übergeben wurde. Der Code ist sauber und einfach zu verstehen, ohne jegliche Technikalitäten.

4.2. Nutzung von Google OCR

Google Cloud Vision OCR konvertiert auch das Bild in Text mit verschiedenen Schriftarten. Zuerst müssen wir einen Client mit der Anmeldedatei erstellen. Dann können wir mit diesem Client-Objekt die DetectText-Methode aufrufen, um eine Antwort in Form einer Annotation zu erhalten. Der Code lautet wie folgt:

Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json");
var client = ImageAnnotatorClient.Create();
var image = Google.Cloud.Vision.V1.Image.FromFile("test-files/employmentapp.png");
var response = client.DetectText(image);

foreach (var annotation in response)
{
    if (annotation.Description != null)
    {
        Console.WriteLine(annotation.Description);
    }
}
Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json");
var client = ImageAnnotatorClient.Create();
var image = Google.Cloud.Vision.V1.Image.FromFile("test-files/employmentapp.png");
var response = client.DetectText(image);

foreach (var annotation in response)
{
    if (annotation.Description != null)
    {
        Console.WriteLine(annotation.Description);
    }
}
Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json")
Dim client = ImageAnnotatorClient.Create()
Dim image = Google.Cloud.Vision.V1.Image.FromFile("test-files/employmentapp.png")
Dim response = client.DetectText(image)

For Each annotation In response
	If annotation.Description IsNot Nothing Then
		Console.WriteLine(annotation.Description)
	End If
Next annotation
$vbLabelText   $csharpLabel

Dasselbe Bild wird als Eingabe genommen, um die Ausgabe beider Bibliotheken zu vergleichen.

So drucken Sie Barcode in C# Windows-Anwendung Abbildung 14 - Ausgabe

Aus der obigen Ausgabe können Sie deutlich sehen, dass IronOCR die Bildausgabeformate beibehält. Obwohl Google OCR den Ausgangstext genau geliefert hat, wird das Format der Tabelle nicht beibehalten. IronOCR hat das Format der Tabelle genau wie im gegebenen Bild beibehalten.

5. Barcode und QR-Code zu Text

Der Code ist fast identisch mit dem vorherigen.

IronOCR bietet eine einzigartige und nützliche Funktion beim Lesen von Bildern, d.h., es kann Barcodes und QR-Codes lesen. Es kann Barcodes erkennen und ihren Wert mit Leichtigkeit anzeigen. Zuerst stellen Sie die ReadBarCodes-Konfiguration auf true ein, und dann durchlaufen Sie jeden der Barcodes in den OCR-Ergebnissen. Der Code zum Lesen von Barcodes lautet wie folgt:

var ocr = new IronTesseract();
ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");

    // Process the image
    var result = ocr.Read(input);

    // Iterate and output barcode values
    foreach (var barcode in result.Barcodes)
    {
        Console.WriteLine(barcode.Value);
    }
}
var ocr = new IronTesseract();
ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");

    // Process the image
    var result = ocr.Read(input);

    // Iterate and output barcode values
    foreach (var barcode in result.Barcodes)
    {
        Console.WriteLine(barcode.Value);
    }
}
Dim ocr = New IronTesseract()
ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
	' Add the image to be processed
	input.AddImage("test-files/Barcode.png")

	' Process the image
	Dim result = ocr.Read(input)

	' Iterate and output barcode values
	For Each barcode In result.Barcodes
		Console.WriteLine(barcode.Value)
	Next barcode
End Using
$vbLabelText   $csharpLabel

EINGANGSBILD

So drucken Sie Barcode in C# Windows-Anwendung Abbildung 15 - Eingang

AUSGABE

So drucken Sie Barcode in C# Windows-Anwendung Abbildung 16 - Bildausgabe

Alle drei Barcodes in der Eingabe wurden erfolgreich gelesen und ihr versteckter Text wurde angezeigt.

5.2. Nutzung von Google OCR

Google Vision API erlaubt diese Funktionalität noch nicht. Das Lesen von Barcodes kann in Softwareanwendungen praktisch sein. Jedoch erlaubt Google OCR, Text aus einem gescannten Dokument als Bilddatei zu extrahieren. Der Code zur Beschriftungserkennung lautet wie folgt:

var client = ImageAnnotatorClient.Create();
var image = Google.Cloud.Vision.V1.Image.FromUri("gs://cloud-samples-data/vision/using_curl/shanghai.jpeg");
var labels = client.DetectLabels(image);

Console.WriteLine("Labels (and confidence score):");
Console.WriteLine(new String('=', 30));

foreach (var label in labels)
{
    Console.WriteLine($"{label.Description} ({(int)(label.Score * 100)}%)");
}
var client = ImageAnnotatorClient.Create();
var image = Google.Cloud.Vision.V1.Image.FromUri("gs://cloud-samples-data/vision/using_curl/shanghai.jpeg");
var labels = client.DetectLabels(image);

Console.WriteLine("Labels (and confidence score):");
Console.WriteLine(new String('=', 30));

foreach (var label in labels)
{
    Console.WriteLine($"{label.Description} ({(int)(label.Score * 100)}%)");
}
Imports System

Dim client = ImageAnnotatorClient.Create()
Dim image = Google.Cloud.Vision.V1.Image.FromUri("gs://cloud-samples-data/vision/using_curl/shanghai.jpeg")
Dim labels = client.DetectLabels(image)

Console.WriteLine("Labels (and confidence score):")
Console.WriteLine(New String("="c, 30))

For Each label In labels
	Console.WriteLine($"{label.Description} ({CInt(Math.Truncate(label.Score * 100))}%)")
Next label
$vbLabelText   $csharpLabel

AUSGABE

So drucken Sie Barcode in C# Windows-Anwendung Abbildung 17 - Ausgabe der Beschriftungserkennung

6. PDF zu Text

6.1. Nutzung von IronOCR

PDF-Dateien zu lesen ist genauso einfach wie Bilddateien in IronOCR zu lesen. Sie müssen nur die AddImage-Methode zur AddPdf im Bildlesecode ändern. Der Code sieht wie folgt aus:

var ocr = new IronTesseract();
using (var input = new OcrInput())
{
    // Add the PDF to be processed
    input.AddPdf("test-files/example.PDF");

    // Process the PDF
    var result = ocr.Read(input);

    // Output the extracted text
    Console.WriteLine(result.Text);
}
var ocr = new IronTesseract();
using (var input = new OcrInput())
{
    // Add the PDF to be processed
    input.AddPdf("test-files/example.PDF");

    // Process the PDF
    var result = ocr.Read(input);

    // Output the extracted text
    Console.WriteLine(result.Text);
}
Dim ocr = New IronTesseract()
Using input = New OcrInput()
	' Add the PDF to be processed
	input.AddPdf("test-files/example.PDF")

	' Process the PDF
	Dim result = ocr.Read(input)

	' Output the extracted text
	Console.WriteLine(result.Text)
End Using
$vbLabelText   $csharpLabel

AUSGABE

Der extrahierte Text ist im selben Format wie die PDF-Datei.

So drucken Sie Barcode in C# Windows-Anwendung Abbildung 18 - PDF zu Text Ausgabe

6.2. Nutzung von Google OCR

Google OCR bietet auch die Möglichkeit, Text aus PDF/TIFF-Dokumenten zu extrahieren. Jedoch erkennt es nur Text, wenn die Datei im Google Cloud-Speicher ist. Dafür müssen Sie einen Google-Speicherbereich erstellen. Der Code für C# ist nicht direkt und ziemlich umfangreich, um ihn hier zu implementieren. Es gibt keine Beispiele für C#, um Texte in Dateien zu erkennen. Sie können Java-Code hier als Referenz ausprobieren.

7. Lizenzierung

IronOCR ist kostenlos für Entwicklungszwecke, muss jedoch für kommerzielle Nutzung lizenziert werden. Es bietet auch eine kostenlose Testversion, um alle Potenziale für Ihre Bedürfnisse zu testen. Das Lite-Paket beginnt ab einem bestimmten Betrag mit einer kostenlosen Testversion. IronOCR bietet ein Jahr kostenlosen Produktsupport und Updates an und danach kostet es 399 $. Alle Lizenzen sind unbefristet, d.h., nur ein einmaliger Kauf ohne versteckte Kosten. Sie können auch urheberrechtliche kostenfreie Wiederverteilungsabdeckung für SaaS- und OEM-Produkte mit nur einem einmaligen Kauf von 1999 $ wählen. Für weitere Informationen zu Lizenzpaketen und Preismodellen besuchen Sie bitte hier.

So drucken Sie Barcode in C# Windows-Anwendung Abbildung 19 - IronOCR Lizenz

Google Cloud Vision Preismodelle basieren auf der Anzahl der von der Anwendung auf einem Bild ausgeführten Operationen. Bei Dateien wie PDFs, die mehrere Seiten haben, wird jede Seite als Bild betrachtet. Zudem ist jede auf ein Bild angewandte Funktion eine separat abrechenbare Einheit. Zum Beispiel, wenn Sie Texterkennung und Beschriftungserkennung auf dasselbe Bild anwenden, wird jede Funktion separat abgerechnet. Die Preismodelle sind unten angegeben, und für weitere Informationen besuchen Sie diesen Link.

So drucken Sie Barcode in C# Windows-Anwendung Abbildung 20 - Google Cloud Vision OCR Lizenz

1. Erstellen eines Visual Studio-Projekts

IronOCR bietet C#-Entwicklern die fortschrittlichste Tesseract-API, die wir kennen, auf jeder Plattform. IronOCR kann auf Windows, Linux, Mac, Azure, AWS, Lambda eingesetzt werden und unterstützt .NET Framework-Projekte sowie .NET Standard und .NET Core-Projekte. Amazon Textract basiert auf der bewährten, hochskalierbaren Deep-Learning-Technologie, die von den Amazon-Forschungsteams für Computer Vision entwickelt wurde, um Milliarden von Bildern und Videos täglich zu analysieren.

Die Google Cloud Vision API ist eine fortschrittlich AI-gebaute API. Sie bietet eine Vielzahl von Bildanalyse-Funktionen, die sehr hilfreich beim Aufbau von ML-Anwendungen sein können. Sie ermöglicht Entwicklern, direkt mit der Google Cloud mithilfe eines API-Schlüssels zu kommunizieren, was bedeutet, dass Dateien nicht lokal gespeichert werden müssen.

IronOCR-Lizenzen sind benutzerbasiert, was bedeutet, dass Sie eine Lizenz basierend auf der Anzahl der Entwickler, die das Produkt verwenden werden, erwerben sollten. Google Cloud Vision-Lizenzen basieren auf der Anzahl der Bilder, aus denen Informationen extrahiert und die Daten analysiert werden sollen. Die Lizenzen sind monatlich und die Preise werden für eine große Anzahl von Bildern im Vergleich zu IronOCR-Lizenzen sehr hoch. Außerdem ist die IronOCR-Lizenz ein einmaliger Kauf und kann ein Leben lang genutzt werden, und sie unterstützt OEM- und SaaS-Vertrieb.

Im Gesamten besitzen beide Bibliotheken maschinelles Lernen-Fähigkeiten. IronOCR hat einen leichten Vorteil gegenüber Google OCR, da es speziell für das .NET-Framework von C# entwickelt wurde, das schnell und zeitsparend ist. Es bietet alle Funktionen mit sehr wenigen Codezeilen, wobei die Entwickler keine langen Codes schreiben müssen. Es basiert auf der beliebten Tesseract 5 API, die es einfach macht, Bilder und andere Dateiformate mit genauen Ausgaben zu integrieren und zu analysieren. Auf der anderen Seite ist Google Vision OCR auf AI aufgebaut und mehr auf Java, Python und REST fokussiert und kann nur ausgeführt werden, wenn es mit der Google Cloud verbunden ist. Dies kann zeitintensiv sein, da die Antwort vom Server kommt. Sie können die Bibliothek entsprechend Ihren spezifischen Bedürfnissen auswählen.

Jetzt können Sie 5 Iron-Produkte zum Preis von 2 erhalten. Die folgenden Tools sind in der Iron Suite enthalten:

  • IronBarcode
  • IronXL
  • IronOCR
  • IronPDF
  • IronWebscraper

Besuchen Sie diesen Link, um mehr zu entdecken.

Sie können IronOCR von hier herunterladen.

Hinweis:Google Cloud Vision OCR ist ein eingetragenes Warenzeichen seines jeweiligen Eigentümers. Diese Seite ist nicht mit, befürwortet oder gesponsert von Google Cloud Vision OCR. Alle Produktnamen, Logos und Marken sind Eigentum ihrer jeweiligen Eigentümer. Vergleiche dienen nur zu Informationszwecken und spiegeln öffentlich zugängliche Informationen zum Zeitpunkt des Schreibens wider.

Häufig gestellte Fragen

Wie kann ich Bilder in Text umwandeln mit C#?

Sie können IronOCR verwenden, das die Tesseract 5-Engine nutzt, um Bilder in maschinenlesbaren Text zu konvertieren. Es unterstützt über 125 Sprachen und ist mit mehreren Plattformen kompatibel, was es zu einer hervorragenden Wahl für die Textextraktion in C#-Anwendungen macht.

Was sind die Vorteile der Verwendung von IronOCR für Barcode- und QR-Code-Scans?

IronOCR konvertiert nicht nur Bilder und PDFs in Text, sondern ist auch hervorragend im Barcode- und QR-Code-Scanning. Es bietet schnelle und genaue Datenextraktion und ist ein vielseitiges Werkzeug für Anwendungen, die umfassende OCR-Funktionen benötigen.

Wie geht IronOCR mit verschiedenen Sprachen um?

IronOCR unterstützt über 125 Sprachen und bietet benutzerdefinierte Sprachunterstützung. Diese umfassende Sprachkompatibilität ermöglicht es, sich hervorragend für internationale Anwendungen zu eignen, und gewährleistet Texterkennung in verschiedenen Sprachen.

Was sind die Installationsanforderungen für IronOCR in einem C#-Projekt?

Um IronOCR in einem C#-Projekt zu installieren, können Sie den NuGet-Paketmanager in Visual Studio verwenden. Suchen Sie einfach nach IronOCR im NuGet-Paket-Manager und installieren Sie es, um die OCR-Funktionen nahtlos in Ihre Anwendung zu integrieren.

Wie vergleicht sich das Lizenzmodell von IronOCR mit cloudbasierten OCR-Diensten?

IronOCR bietet ein Einmalkaufmodell mit unbefristeten Lizenzen, das langfristigen Wert ohne wiederkehrende Kosten bietet. Im Gegensatz dazu verwenden cloudbasierte OCR-Dienste wie Google Cloud Vision normalerweise ein Nutzungsbasiertes Preismodell, das bei hoher Nutzung teuer werden kann.

Welche Plattformen werden von IronOCR unterstützt?

IronOCR kann auf verschiedenen Plattformen bereitgestellt werden, einschließlich Windows, Linux, Mac, Azure, AWS und Lambda. Es unterstützt .NET Framework, .NET Standard und .NET Core-Projekte, was Vielseitigkeit für verschiedene Entwicklungsumgebungen bietet.

Kann IronOCR offline funktionieren?

Ja, IronOCR kann offline funktionieren, was einen erheblichen Vorteil gegenüber cloudbasierten Lösungen darstellt. Diese Fähigkeit stellt sicher, dass Ihre OCR-Verarbeitung nicht auf eine Internetverbindung angewiesen ist, und bietet größere Kontrolle und Sicherheit.

Wie stellt IronOCR Genauigkeit und Geschwindigkeit in der OCR-Verarbeitung sicher?

IronOCR nutzt fortschrittliche Algorithmen und die Tesseract 5-Engine, um eine schnelle und genaue OCR-Verarbeitung zu bieten. Seine Bildkorrekturfilter verbessern weiter die Texterkennungsgenauigkeit, was es zu einer zuverlässigen Wahl für hochwertige OCR-Aufgaben macht.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen