VERGLEICH MIT ANDEREN KOMPONENTEN

Paddle OCR vs. Tesseract: Detaillierter OCR-Vergleich

Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

Kannapat Udonpant

29. April 2024

Teilen Sie:

Die Wahl des richtigen Tools für die optische Zeichenerkennung (OCR) ist entscheidend für alle, die Bilder von Texten in bearbeitbare und durchsuchbare Daten umwandeln möchten. Zwei beliebte Optionen auf diesem Gebiet sind Paddle OCR und Tesseract. Beide nutzen unterschiedliche OCR-Technologien und sind auf unterschiedliche Bedürfnisse zugeschnitten. Dieser Vergleich konzentriert sich auf die Bewertung verschiedener OCR-Engines, um Sie bei der Suche nach der für Ihre Bedürfnisse am besten geeigneten Option zu unterstützen.

Ganz gleich, ob Sie an einer einfachen Aufgabe arbeiten oder mit komplexen Dokumenten zu tun haben, ein Verständnis der Möglichkeiten von Paddle OCR und Tesseract könnte Ihr erster Schritt zu einer effizienteren Datenverarbeitung sein. Wir werden auch eine Bibliothek aus einer Vielzahl von OCR-Bibliotheken, IronOCR, in die Mischung einführen, um einen breiteren Vergleich zu bieten, der Ihnen hilft zu verstehen, welches Tool am besten zu Ihren Bedürfnissen passt.

Paddel OCR

Paddle OCR erweist sich als bemerkenswerte Lösung mit fortschrittlichen Texterkennungsmodellen, die für die mehrsprachige Texterkennung entwickelt wurden und die Möglichkeiten des PaddlePaddle Frameworks für tiefes Lernen nutzen. Das von PaddlePaddle entwickelte OCR-System ist auf hohe Leistung und umfassende Sprachunterstützung zugeschnitten. Dieses System zeichnet sich durch die Unterstützung von mehr als 50 Sprachen aus und bietet eine Reihe von Tools für die Datenannotation, Synthese und Modellbereitstellung auf verschiedenen Plattformen wie Servern, mobilen Geräten, eingebetteten Systemen und IoT-Geräten.

Wesentliche Merkmale

Paddle OCR bietet zahlreiche OCR-Funktionen mit einer benutzerfreundlichen API für verschiedene Anwendungen. Hier sind seine herausragenden Merkmale:

Mehrsprachige Unterstützung: Paddle OCR kann Text in mehreren Sprachen verarbeiten und bietet Unterstützung für über 50 Sprachen.
Fortgeschrittene Algorithmen: Es integriert fortschrittliche OCR-Methoden und -Algorithmen zur Texterkennung, -identifizierung und -klassifikation. Dazu gehören die neuesten Erkenntnisse der Deep-Learning-Forschung, wie der Connectionist Temporal Classification (CTC)-Verlust, der eine entscheidende Rolle bei der genauen Vorhersage und Ausrichtung von Textsequenzen spielt.
Effizienz und Geschwindigkeit: Paddle OCR ist sowohl für Geschwindigkeit als auch für Genauigkeit optimiert und kann große Mengen an Bildern schnell verarbeiten, was es für Anwendungen mit hohem Durchsatz geeignet macht.

Lizenz

Paddle OCR wird unter der Apache License 2.0 veröffentlicht, so dass es frei verwendet, verändert und weitergegeben werden kann. Die Installation ist einfach und erfolgt in der Regel mit Paketmanagern wie pip für Python. Benutzer können Paddle OCR und seine Abhängigkeiten mit wenigen Befehlen schnell installieren, was eine einfache Projektintegration ermöglicht.

PaddleSharp installieren

Die Integration von PaddleOCR in ein C#-Projekt in Visual Studio kann durch die Verwendung von PaddleSharp, einem .NET-Wrapper für die Paddle Inference C# API, vereinfacht werden. Dies ermöglicht die direkte Nutzung der Deep-Learning-Funktionen von PaddlePaddle in einer .NET-Umgebung. Hier finden Sie eine Schritt-für-Schritt-Anleitung zum Einrichten von PaddleSharp in Ihrem Projekt:

Voraussetzungen:

Stellen Sie sicher, dass Visual Studio auf Ihrem System installiert ist und je nach Projektanforderungen .NET Framework oder .NET Core unterstützt.
C#-Kenntnisse und Vertrautheit mit der NuGet-Paketverwaltung in Visual Studio sind ebenfalls unerlässlich.
Installieren Sie das PaddleSharp-Paket:
Öffnen Sie Ihr Projekt in Visual Studio.
Navigieren Sie zu der Option "NuGet-Pakete verwalten", indem Sie mit der rechten Maustaste auf Ihr Projekt im Projektmappen-Explorer klicken.
- Suchen Sie nach Sdcb.PaddleInference und installieren Sie das Paket. Dies ist die Kernbindung, die es .NET-Anwendungen ermöglicht, die Paddle Inference Engine zu nutzen.
- Installieren Sie dann die folgenden Pakete:
  - Scdb.PaddleOCR
  - OpenCvSharp4
  - Scdb.PaddleOCR.Models.Online
- OpenCvSharp4.runtime.win
Fügen Sie native und Infrastrukturpakete hinzu:
Je nach Ihrer Zielplattform (Windows/Linux) und Anforderungen (CPU/GPU) können zusätzliche Pakete erforderlich sein. Für Windows benötigen Sie möglicherweise Pakete wie Sdcb.PaddleInference.runtime.win64.mkl für MKL-Unterstützung oder **Sdcb.PaddleInference.runtime.win64.cuda*** für GPU-Unterstützung.
Installieren Sie diese ebenfalls über den NuGet-Paketmanager, um die Kompatibilität mit Ihrer Entwicklungs- und Zielausführungsumgebung sicherzustellen.

Code-Beispiel

using System;
FullOcrModel model = await OnlineFullModels.EnglishV3.DownloadAsync();
using (PaddleOcrAll all = new(model)
{
    AllowRotateDetection = true,
    Enable180Classification = false,
})
using (Mat imgSrc = Cv2.ImRead(@"read.jpg"))
{
    Stopwatch stopWatch = Stopwatch.StartNew();
    PaddleOcrResult result = all.Run(imgSrc);
    Console.WriteLine($"lapsed={sw.ElapsedMilliseconds} ms");
    Console.WriteLine(result.Text);
}

using System;
FullOcrModel model = await OnlineFullModels.EnglishV3.DownloadAsync();
using (PaddleOcrAll all = new(model)
{
    AllowRotateDetection = true,
    Enable180Classification = false,
})
using (Mat imgSrc = Cv2.ImRead(@"read.jpg"))
{
    Stopwatch stopWatch = Stopwatch.StartNew();
    PaddleOcrResult result = all.Run(imgSrc);
    Console.WriteLine($"lapsed={sw.ElapsedMilliseconds} ms");
    Console.WriteLine(result.Text);
}

Imports System
Private model As FullOcrModel = await OnlineFullModels.EnglishV3.DownloadAsync()
Using all As New PaddleOcrAll(model) With {
	.AllowRotateDetection = True,
	.Enable180Classification = False
}
Using imgSrc As Mat = Cv2.ImRead("read.jpg")
	Dim stopWatch As Stopwatch = Stopwatch.StartNew()
	Dim result As PaddleOcrResult = all.Run(imgSrc)
	Console.WriteLine($"lapsed={sw.ElapsedMilliseconds} ms")
	Console.WriteLine(result.Text)
End Using
End Using

$vbLabelText $csharpLabel

Paddle OCR vs Tesseract (Vergleich der OCR-Funktionen): Abbildung 2 - Konsolenausgabe aus dem vorherigen Code.

Tesseract OCR

Tesseract ist eine weithin anerkannte Open-Source-OCR-Engine und unter der Apache 2.0-Lizenz lizenziert. Die Entwicklung begann in den Hewlett-Packard Laboratories und wurde unter der Leitung von Google bis 2018 fortgesetzt, danach wurde es als Open Source veröffentlicht. Jetzt wird sie von einer Gemeinschaft von Mitwirkenden gepflegt. Die Engine ist bekannt für ihre Fähigkeit, über 100 Sprachen zu lesen und verschiedene Bildformate wie PNG, JPEG und TIFF zu unterstützen. Es wird in mehreren Formaten ausgegeben, wie Klartext, hOCR (HTML), PDF und mehr.

Wesentliche Merkmale

Hier finden Sie einen Überblick über die wichtigsten Funktionen:

Umfangreiche Sprachunterstützung: Mit der Fähigkeit, über 100 Sprachen zu erkennen, bedient Tesseract ein globales Publikum. Die Engine unterstützt Unicode (UTF-8), wodurch die Verarbeitung von mehrsprachigen Dokumenten ermöglicht wird.
Neuronales Netzwerk-basiertes Erkennen: Ab Version 4 hat Tesseract eine OCR-Engine basierend auf einem neuronalen Netzwerk (LSTM) eingeführt, wodurch die Genauigkeit bei der Texterkennung über Zeilen im Vergleich zu den herkömmlichen Methoden der Zeichenerkennung verbessert wurde.
Vielseitige Ausgabeformate: Tesseract unterstützt verschiedene Ausgabeformate wie Klartext, hOCR (HTML), PDF und TSV, was es anpassungsfähig für verschiedene Anwendungsfälle macht.

Lizenz

Tesseract OCR wird unter der Apache License 2.0 veröffentlicht. Diese Lizenz ist eine der freizügigsten und offensten Lizenzen und erlaubt die praktisch uneingeschränkte Freiheit, die Software zu verwenden, zu verändern und zu verbreiten, sogar in proprietären Softwareprojekten.

Tesseract installieren

Um Tesseract OCR in einem Visual Studio Projekt mit NuGet zu installieren, gehen Sie folgendermaßen vor:

Visual Studio öffnen: Starten Sie Visual Studio und öffnen Sie Ihr Projekt oder erstellen Sie ein neues.
Klicken Sie mit der rechten Maustaste auf Ihr Projekt im Projektmappen-Explorer und wählen Sie NuGet-Pakete verwalten.... 3. Wechseln Sie im NuGet-Paket-Manager zur Registerkarte Durchsuchen und suchen Sie nach Tesseract.
1. Installieren Sie den Tesseract NuGet-Paketmanager.
Laden Sie Tessdata von diesem Link herunter. Es ist wichtig, Tesseract OCR zu verwenden.

Code-Beispiel

using Tesseract;
using (var engine = new TesseractEngine(@".\tessdata-main", "eng", EngineMode.Default))
{
    using (var img = Pix.LoadFromFile(@"read.jpg"))
    {
        using (var page = engine.Process(img))
        {
            var text = page.GetText();
            Console.WriteLine(text);
        }
    }
}

using Tesseract;
using (var engine = new TesseractEngine(@".\tessdata-main", "eng", EngineMode.Default))
{
    using (var img = Pix.LoadFromFile(@"read.jpg"))
    {
        using (var page = engine.Process(img))
        {
            var text = page.GetText();
            Console.WriteLine(text);
        }
    }
}

Imports Tesseract
Using engine = New TesseractEngine(".\tessdata-main", "eng", EngineMode.Default)
	Using img = Pix.LoadFromFile("read.jpg")
		Using page = engine.Process(img)
			Dim text = page.GetText()
			Console.WriteLine(text)
		End Using
	End Using
End Using

$vbLabelText $csharpLabel

Paddle OCR vs Tesseract (Vergleich der OCR-Funktionen): Abbildung 4 - Konsolenausgabe aus dem vorherigen Codebeispiel

IronOCR

IronOCR ist eine fortschrittliche OCR (Optical Character Recognition) Bibliothek, die die Fähigkeiten von .NET-Entwicklern erheblich verbessert, Text aus Bildern und PDFs zu extrahieren. Aufbauend auf der Grundlage der Tesseract OCR-Engine bietet IronOCR eine native C#-Erfahrung, die eine höhere Stabilität und Genauigkeit als die grundlegende Tesseract-Bibliothek liefert. Es ist so konzipiert, dass es sich nahtlos in .NET-Anwendungen und Websites integrieren lässt. Es ermöglicht die Extraktion von Text in reine Text- oder strukturierte Datenformate und ist in der Lage, eine breite Palette von Fremdsprachen zu verstehen. Durch den Einsatz von Deep-Learning-Algorithmen erreicht der IronOCR eine unvergleichliche Genauigkeit bei der Texterkennung.

Diese Bibliothek eignet sich nicht nur für einfache OCR-Aufgaben, sondern erweitert ihre Funktionalität auf ein breites Spektrum von Anwendungen. Es unterstützt eine Vielzahl von Plattformen, darunter die .NET-Versionen 5 bis 8, .NET Core 2x & 3x sowie das .NET-Framework 4.6.2 und höher.

Wesentliche Merkmale

Hier sind einige der wichtigsten Eigenschaften und Funktionen, die IronOCR auszeichnen:

Erweiterte OCR-Engine: Durch die Nutzung von Tesseract 5 bietet IronOCR eine fortschrittliche OCR-Engine, die über 125 Sprachen unterstützt. Diese Fähigkeit ist entscheidend für globale Anwendungen, die mehrsprachige Unterstützung erfordern. Die Bibliothek bietet Optionen für hohe, mittlere und schnelle Qualität für die meisten Sprachen, einschließlich benutzerdefinierter Sprachen und Schriftartentraining, was Flexibilität und hohe Genauigkeit bei der Texterkennung gewährleistet.

Umfassende Dokumentenverwaltung: IronOCR kann eine Vielzahl von Dokumenttypen und -formaten verarbeiten, einschließlich Bildern (JPG, PNG, GIF, TIFF, BMP), System.Drawing-Objekten, Streams und PDFs.

Robuste Bildverarbeitung: Die Bibliothek enthält eine leistungsstarke Sammlung von Filtern und Bildverarbeitungswerkzeugen, wie z.B. Schärfen, Auflösungsverbesserung, Rauschunterdrückung und Farbkorrektur (Binarisieren, Graustufen, Invertieren).

Strukturierte und einfache Datenausgabe: IronOCR bietet sowohl strukturierte Datenausgabe (Seiten, Blöcke, Absätze, Zeilen, Wörter, Zeichen) als auch einfache Datenausgabe (.NET-Textzeichenfolgen, Barcode- und QR-Daten, Bilder).

Gleichzeitige Verarbeitung und Computer Vision: Die Bibliothek unterstützt Einzel- und Multithreading, asynchrone Operationen und bietet Computer-Vision-Funktionen, um Textbereiche innerhalb von Bildern zu identifizieren. Dies verbessert die Genauigkeit und Effizienz der Texterkennung in komplexen oder verrauschten Bildern.

Um IronOCR in Ihrem .NET-Projekt zu installieren, können Sie je nach Ihrer Entwicklungsumgebung und Ihren Präferenzen verschiedene Methoden anwenden. Hier ist ein kurzer Leitfaden, der Ihnen den Einstieg erleichtert:

Lizenz

IronOCR bietet verschiedene Lizenzierungsoptionen, die auf die unterschiedlichen Projekt- und Entwicklerbedürfnisse zugeschnitten sind und den Benutzern Flexibilität und Skalierbarkeit garantieren. Die Lizenzbedingungen sind unbefristet, d. h., wenn Sie eine Lizenz erworben haben, fallen keine weiteren Gebühren an. Darüber hinaus beinhaltet jede Lizenz eine 30-tägige Geld-zurück-Garantie, ein Jahr Produktsupport und Updates und ist für Entwicklungs-, Staging- und Produktionsumgebungen gültig. Der Lizenzpreis beginnt bei $749. Sie können eine kostenlose Testversion erhalten, bevor Sie die Lizenz kaufen.

IronOCR installieren

Gehen Sie zu Tools -> NuGet-Paket-Manager -> Paket-Manager-Konsole.
1. Geben Sie den Befehl Install-Package IronOcr ein und führen Sie ihn aus. Mit diesem Befehl wird IronOCR in Ihr Projekt geholt und installiert, so dass es sofort einsatzbereit ist.

Code-Beispiel

Hier ein Codebeispiel, wie Sie mit IronOCR Text aus einem Bild extrahieren können:

using IronOcr;
IronOcr.License.LicenseKey = "License-Key";
var ocrMode = new IronTesseract();
var resultText = ocrMode.Read("read.jpg");
Console.WriteLine(resultText.Text);

using IronOcr;
IronOcr.License.LicenseKey = "License-Key";
var ocrMode = new IronTesseract();
var resultText = ocrMode.Read("read.jpg");
Console.WriteLine(resultText.Text);

Imports IronOcr
IronOcr.License.LicenseKey = "License-Key"
Dim ocrMode = New IronTesseract()
Dim resultText = ocrMode.Read("read.jpg")
Console.WriteLine(resultText.Text)

$vbLabelText $csharpLabel

Paddle OCR vs Tesseract (Vergleich der OCR-Funktionen): Abbildung 6 - Konsolenausgabe aus dem vorherigen Codebeispiel

Vergleich

Beim Evaluieren von IronOCR, PaddleOCR und Tesseract in Bezug auf verschiedene Faktoren, die für Anwendungen zur optischen Zeichenerkennung (OCR) wichtig sind, ist es entscheidend, die Stärken jedes Tools im Kontext von Genauigkeit, Geschwindigkeit, Sprachunterstützung, Anpassungsoptionen und Community-Support zu berücksichtigen.

Genauigkeit

Sowohl PaddleOCR als auch Tesseract haben in Benchmarks eine hohe Genauigkeit gezeigt, aber IronOCRs Fähigkeit zur Feinabstimmung und Anpassung von Vorverarbeitungsschritten verschafft ihm einen Vorteil bei der Erzielung hervorragender Ergebnisse bei verschiedenen Dokumenttypen.

Geschwindigkeit

IronOCR for .NET zeichnet sich durch eine effiziente Verarbeitung von Dokumenten in der .NET-Umgebung aus und bietet eine optimierte Leistung für eine schnelle Texterkennung. PaddleOCR und Tesseract sind ebenfalls für ihre Echtzeitverarbeitungsfähigkeiten bekannt.

Sprachliche Unterstützung

Tesseract unterstützt über 100 Sprachen und ist damit eines der vielseitigsten OCR-Tools, was die Sprachabdeckung angeht. PaddleOCR bietet auch eine beeindruckende Sprachunterstützung, insbesondere für asiatische Sprachen. IronOCR, das die Tesseract-Engine nutzt, übernimmt diese umfangreiche Sprachunterstützung und kombiniert sie mit zusätzlichen Erweiterungen und Optimierungen. Diese Kombination erweitert nicht nur das Spektrum der effektiv bearbeiteten Sprachen, sondern verbessert auch die Genauigkeit und Geschwindigkeit für Sprachen, die von IronOCRs Erweiterungen direkt unterstützt werden.

Anpassungsoptionen

IronOCR zeichnet sich bei dieser Anpassung durch eine breite Palette von Optionen aus, die es Entwicklern ermöglichen, den OCR-Prozess feinabzustimmen, einschließlich Bildvorverarbeitung, Textfilterung und benutzerdefinierte Wörterbücher. Dieser Grad der Anpassung ist besonders wertvoll in komplexen OCR-Szenarien, in denen die Standardeinstellungen möglicherweise nicht ausreichen. Während PaddleOCR und Tesseract einige Anpassungsmöglichkeiten bieten, gewährleistet IronOCRs Fokus auf die Bedürfnisse der Entwickler innerhalb des .NET-Ökosystems ein höheres Maß an Flexibilität.

Unterstützung der Gemeinschaft

Während sich Tesseract aufgrund seiner langen Geschichte und seines Open-Source-Charakters einer großen und etablierten Community erfreut und die Community von PaddleOCR schnell wächst, profitiert IronOCR von einer konzentrierten Community von .NET-Entwicklern.

Schlussfolgerung

Zusammenfassend lässt sich sagen, dass Tesseract mit seinen umfangreichen Anpassungsmöglichkeiten und der breiten Unterstützung durch die Community eine solide Grundlage für OCR-Projekte bietet und PaddleOCR mit seiner hochmodernen Deep-Learning-Technologie für hohe Genauigkeit und Geschwindigkeit sorgt, während IronOCR für .NET-Entwickler und Unternehmen eine überzeugende Option darstellt. Durch die Konzentration auf die Bereitstellung vor Ort, die umfassende Sprachunterstützung und das kostengünstige Lizenzierungsmodell ist IronOCR eine attraktive Wahl für alle, die Wert auf Datensicherheit, finanzielle Vorhersehbarkeit und die Integration in .NET-Anwendungen legen.

IronOCR ist besonders attraktiv für Unternehmen aufgrund seiner flexiblen Lizenzoptionen, die eine kostenlose Testversion für die anfängliche Evaluierung und Lizenzen ab $749 beinhalten, die sich an Organisationen jeder Größe richten, die ein Gleichgewicht zwischen Leistung und Kosten suchen.

Kannapat Udonpant

Jetzt mit dem Ingenieurteam chatten

Software-Ingenieur

Bevor er Software-Ingenieur wurde, promovierte Kannapat an der Universität Hokkaido in Japan im Bereich Umweltressourcen. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Abteilung für Bioproduktionstechnik ist. Im Jahr 2022 wechselte er mit seinen C#-Kenntnissen zum Engineering-Team von Iron Software, wo er sich auf IronPDF konzentriert. Kannapat schätzt an seiner Arbeit, dass er direkt von dem Entwickler lernt, der den Großteil des in IronPDF verwendeten Codes schreibt. Neben dem kollegialen Lernen genießt Kannapat auch den sozialen Aspekt der Arbeit bei Iron Software. Wenn er nicht gerade Code oder Dokumentationen schreibt, kann man Kannapat normalerweise beim Spielen auf seiner PS5 oder beim Wiedersehen mit The Last of Us antreffen.

< PREVIOUS
iOS OCR-Bibliothek (Kostenloser und kostenpflichtiger Tool-Vergleich)

NÄCHSTES >
ABBYY FineReader vs. Tesseract: OCR-Vergleich