OCR-WERKZEUGE

Quittungs-OCR-Bibliothek (Liste für Entwickler)

Kannaopat Udonpant
Kannapat Udonpant
6. Juni 2024
Teilen Sie:

In der .NET-Entwicklungsumgebung ist die Rationalisierung manueller Dateneingabeprozesse, insbesondere bei Belegen und Rechnungen, seit langem ein Ziel für Unternehmen, die Effizienz und Genauigkeit anstreben. Mit dem Aufkommen von Receipt Scanning OCR (Optical Character Recognition)-Bibliotheken, die speziell für .NET-Umgebungen maßgeschneidert sind, ist dieses Ziel erreichbarer denn je geworden. Diese OCR-API-Bibliotheken für Quittungen ermöglichen es Entwicklern, leistungsstarke Quittungsfunktionen nahtlos in ihre .NET-Anwendungen zu integrieren und so die Arbeitsabläufe im Datenmanagement zu revolutionieren.

Die Extraktion von Belegdaten kann mit den Document Intelligence-Diensten von Microsoft Azure effizient durchgeführt werden. Für weitere Informationen lesen Sie Receipt Data Extraction - Microsoft Azure Document Intelligence.

Verstehen von Quittungen und OCR-API-Bibliothek in .NET

Eine Quittung ist ein Dokument, das Schlüsseldaten einer Transaktion enthält, oft in einem unstrukturierten Datenformat, das mit Algorithmen des maschinellen Lernens verarbeitet werden kann, um strukturierte Daten für die Analyse zu extrahieren. Bilder von Quittungen enthalten den gesamten Text des Dokuments, was die Umwandlung von unstrukturierten Informationen in strukturierte Daten erleichtert, aber auch Bedenken hinsichtlich des Datenschutzes aufkommen lässt.

Die für das .NET-Framework entwickelten OCR-API-Bibliotheken für Quittungen bieten eine umfassende Reihe von Tools und Funktionen zur Extraktion von Daten oder relevanten Informationen aus gescannten oder fotografierten Quittungen. Diese Bibliotheken nutzen fortschrittliche Algorithmen für maschinelles Lernen und Computer-Vision-Techniken und können Text, Zahlen und wichtige Datenpunkte wie Datum, Händlername, Gesamtbetrag und mehr genau identifizieren.

Hauptmerkmale und Vorteile

  1. Genauigkeit und Geschwindigkeit: Einer der Hauptvorteile von Belegscanner-OCR-Bibliotheken in .NET ist ihre Fähigkeit, Daten mit hoher Präzision und Geschwindigkeit genau aus Belegen zu extrahieren. Durch die Automatisierung der Dateneingabe machen diese Bibliotheken die manuelle Dateneingabe oder Transkription überflüssig, wodurch Fehler vermieden und wertvolle Zeit gespart wird.

  2. Integrationsflexibilität: Receipt-OCR-Bibliotheken in .NET sind so konzipiert, dass sie nahtlos in bestehende .NET-Anwendungen integriert werden können. Dadurch wird es Entwicklern erleichtert, die OCR-Technologiefunktionalität in ihre Softwarelösungen zu integrieren. Unabhängig davon, ob es sich um eine Buchhaltungsanwendung, ein Kostenmanagementsystem oder eine benutzerdefinierte Unternehmenssoftware handelt, können diese Bibliotheken nahtlos integriert werden, um die Datenverwaltungsfunktionen zu verbessern.

  3. Unterstützung von Sprache und Währung: Moderne Receipt OCR-Bibliotheken in .NET sind in der Lage, Empfangsfelder in mehreren Sprachen und Währungen zu verarbeiten. Dies gewährleistet Vielseitigkeit und Anpassungsfähigkeit für Unternehmen, die in verschiedenen Regionen tätig sind oder mit internationalen Kunden und Lieferanten zu tun haben.

  4. Anpassung und Erweiterbarkeit: Entwickler, die mit Beleg- oder Rechnungs-OCR-API-Bibliotheken in .NET arbeiten, haben die Flexibilität, die Funktionalität an ihre spezifischen Anforderungen anzupassen und zu erweitern. Ob es um die Unterstützung neuer Datenformate oder die Verbesserung der Erkennungsgenauigkeit für bestimmte Felder geht, diese Bibliotheken bieten zahlreiche Möglichkeiten zur Anpassung.

  5. Sicherheit und Compliance: Führende OCR-Empfangsbibliotheken in .NET priorisieren Datensicherheit und die Einhaltung von Branchenvorschriften wie GDPR und HIPAA. Robuste Verschlüsselungsprotokolle und strenge Datenschutzmaßnahmen stellen sicher, dass die aus den Belegen extrahierten sensiblen Informationen sicher und in Übereinstimmung mit den gesetzlichen Anforderungen behandelt werden.

Quittungs-OCR-Bibliotheken - Open-Source

1. Tesserakt

Tesseract gilt als eine der bekanntesten Open-Source-OCR-Engines, die für ihre Beliebtheit und aktive Wartung bekannt ist. Seine Attraktivität liegt in seiner Flexibilität, die eine Anpassung durch Training auf benutzerdefinierten Datensätzen ermöglicht. Für OCR-Aufgaben bei Quittungen kann Tesseract eine sinnvolle Option sein, insbesondere wenn Sie über eine große Menge an Trainingsdaten für Quittungen verfügen. Es ist jedoch anzumerken, dass der Trainingsprozess kompliziert und zeitaufwändig sein kann und Fachkenntnisse in der Datenkommentierung und Modelloptimierung erfordert. Nichtsdestotrotz fördert der Open-Source-Charakter von Tesseract eine lebendige Gemeinschaft und bietet umfangreiche Dokumentations- und Support-Ressourcen, die Entwicklern helfen, sich in der Komplexität des Systems zurechtzufinden.

2. EasyOCR

Als benutzerfreundliche Hülle um Tesseract präsentiert sich EasyOCR als eine zugänglichere Option für Entwickler, die Einfachheit bei der Integration von OCR-Funktionen in ihre Projekte suchen. Mit vortrainierten Modellen, die für verschiedene Sprachen, einschließlich Englisch, verfügbar sind, vereinfacht EasyOCR den Implementierungsprozess und eignet sich daher besonders für einfache OCR-Anforderungen für Belege. EasyOCR abstrahiert die Feinheiten der zugrunde liegenden Tesseract-Funktionalität und vereinfacht so den Integrationsprozess, so dass sich die Entwickler auf ihre Anwendungslogik konzentrieren können, ohne sich mit den Feinheiten der OCR-Engine-Konfiguration zu beschäftigen.

Quittung OCR API - Kommerzielle Bibliotheken

1. Google Cloud Vision API

Positioniert als ein nutzungsabhängiger Cloud-basierter OCR-Dienst bietet die Google Cloud Vision API eine robuste Lösung für Unternehmen, die hohe Genauigkeit und Skalierbarkeit in ihren Beleg-OCR-Arbeitsabläufen suchen. Mit vortrainierten Modellen, die speziell für Daten aus Quittungen optimiert sind, bietet diese API eine beeindruckende Leistung bei der Extraktion von Text aus Bildern. Die Nutzung der Cloud-Infrastruktur erfordert jedoch eine Internetverbindung, und je nach Umfang der OCR-Anfragen können Nutzungskosten anfallen. Nichtsdestotrotz macht die Bequemlichkeit eines verwalteten Dienstes in Verbindung mit dem Fachwissen von Google im Bereich des maschinellen Lernens die Google Cloud Vision API zu einer attraktiven Wahl für Unternehmen mit unterschiedlichen OCR-Anforderungen, wie z. B. im Lieferkettenmanagement.

2. Microsoft Azure Computer Vision API

Ähnlich wie die Google Cloud Vision API bietet die Microsoft Azure Computer Vision API einen cloudbasierten OCR-Service mit vortrainierten Modellen, die speziell für die Erkennung von Kassenbons angepasst sind. Mit einem Pay-as-you-go-Preismodell bietet diese API Unternehmen Flexibilität bei der Verwaltung von OCR-Kosten auf der Grundlage der Nutzung. Die Azure Computer Vision API nutzt die umfangreichen KI-Fähigkeiten von Microsoft und liefert zuverlässige Leistung bei der Extraktion relevanter Informationen aus Belegfotos. Darüber hinaus erleichtert die nahtlose Integration mit anderen Azure-Diensten die Entwicklung von End-to-End-Lösungen für die Dokumentenverarbeitung und verbessert die Effizienz und Skalierbarkeit von Arbeitsabläufen.

3. ABBYY FineReader Engine

Als kommerzielle OCR-Engine positioniert, ist ABBYY FineReader Engine bekannt für seine außergewöhnliche Genauigkeit und umfassende Funktionen, die speziell für Dokumentenverarbeitungsaufgaben, einschließlich Kassenbon-OCR, zugeschnitten sind. ABBYY FineReader Engine ist zwar mit einer kommerziellen Lizenz verbunden, bietet aber eine unvergleichliche Leistung und Zuverlässigkeit, was es zu einer bevorzugten Wahl für Unternehmen mit strengen OCR-Anforderungen macht. Die mit der ABBYY FineReader Engine verbundenen Kosten können jedoch ein Hindernis für kleinere Projekte darstellen, so dass eine sorgfältige Abwägung der Budgeteinschränkungen erforderlich ist.

4. AnyOCR

AnyOCR erscheint als vielseitige OCR-Bibliothek, die eine robuste Genauigkeit für verschiedene Dokumenttypen, einschließlich Belege, bietet. Mit Optionen für sowohl lokale als auch Cloud-basierte Bereitstellung bietet AnyOCR Unternehmen Flexibilität bei der Wahl des Bereitstellungsmodells, das am besten zu ihren Anforderungen passt. Auch wenn eine kommerzielle Lizenz erforderlich ist, bietet AnyOCR eine konsistente Leistung und Zuverlässigkeit für verschiedene Anwendungsfälle. Die Unterstützung von Quittungen, gepaart mit der Anpassungsfähigkeit an verschiedene Dokumentenformate, macht AnyOCR zu einer umfassenden OCR-Lösung für Unternehmen, die Genauigkeit und Vielseitigkeit in ihren Dokumentenverarbeitungs-Workflows suchen.

Umsetzung und Integration

Die Implementierung einer OCR-Bibliothek in einer .NET-Umgebung beinhaltet in der Regel die Integration der APIs oder SDKs der Bibliothek in die bestehende Anwendungsarchitektur. Entwickler können die umfassende Dokumentation, Beispielcodeausschnitte und den Entwicklersupport nutzen, um den Integrationsprozess zu rationalisieren und die OCR-Funktionalität innerhalb ihrer Anwendungen zu optimieren, um genaue Daten zu extrahieren.

Ein Beispiel für eine OCR-Bibliothek für Quittungen in .NET ist die Tesseract-Bibliothek, eine Open-Source-OCR-Engine, die von Google gepflegt wird. Tesseract bietet robuste OCR-Funktionen und unterstützt mehrere Sprachen. Hier ein einfaches Beispiel, wie Sie Tesseract OCR in einer .NET-Anwendung einsetzen können:

Zunächst müssen Sie das Tesseract.NET-Wrapper-Paket über den NuGet Package Manager installieren:

Install-Package Tesseract
Install-Package Tesseract
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package Tesseract
$vbLabelText   $csharpLabel

Beleg OCR Bibliothek (Liste für Entwickler): Abbildung 1 - Tesseract installieren

Wir müssen auch die sprachspezifischen trainierten Daten aus dem folgenden Repository abrufen: https://github.com/tesseract-ocr/tessdata/. Legen Sie diesen tessdata-Ordner in ein beliebiges Verzeichnis und achten Sie darauf, dass Sie ihn korrekt referenzieren.

Das folgende Bild wird zu Demonstrationszwecken verwendet:

Beleg OCR-Bibliothek (Liste für Entwickler): Abbildung 2 - Belegeingabe

Dann können Sie den folgenden Codeausschnitt verwenden, um OCR auf einem Quittungsbild durchzuführen:

using System;
using System.Drawing;
using Tesseract;
namespace ReceiptOCR
{
    class Program
    {
        static void Main(string[] args)
        {
            // Path to the image file
            string imagePath = "path/to/your/receipt/image.jpg";
            // Initialize Tesseract engine
            using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default))
            {
                using (var img = Pix.LoadFromFile(imagePath))
                {
                    // Set the image for OCR
                    using (var page = engine.Process(img))
                    {
                        // Get the text recognized by Tesseract
                        string recognizedText = page.GetText();
                        // Output the recognized text
                        Console.WriteLine("Recognized Text:");
                        Console.WriteLine(recognizedText);
                    }
                }
            }
        }
    }
}
using System;
using System.Drawing;
using Tesseract;
namespace ReceiptOCR
{
    class Program
    {
        static void Main(string[] args)
        {
            // Path to the image file
            string imagePath = "path/to/your/receipt/image.jpg";
            // Initialize Tesseract engine
            using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default))
            {
                using (var img = Pix.LoadFromFile(imagePath))
                {
                    // Set the image for OCR
                    using (var page = engine.Process(img))
                    {
                        // Get the text recognized by Tesseract
                        string recognizedText = page.GetText();
                        // Output the recognized text
                        Console.WriteLine("Recognized Text:");
                        Console.WriteLine(recognizedText);
                    }
                }
            }
        }
    }
}
Imports System
Imports System.Drawing
Imports Tesseract
Namespace ReceiptOCR
	Friend Class Program
		Shared Sub Main(ByVal args() As String)
			' Path to the image file
			Dim imagePath As String = "path/to/your/receipt/image.jpg"
			' Initialize Tesseract engine
			Using engine = New TesseractEngine("./tessdata", "eng", EngineMode.Default)
				Using img = Pix.LoadFromFile(imagePath)
					' Set the image for OCR
					Using page = engine.Process(img)
						' Get the text recognized by Tesseract
						Dim recognizedText As String = page.GetText()
						' Output the recognized text
						Console.WriteLine("Recognized Text:")
						Console.WriteLine(recognizedText)
					End Using
				End Using
			End Using
		End Sub
	End Class
End Namespace
$vbLabelText   $csharpLabel

In diesem Code:

  • Ersetzen Sie "path/to/your/receipt/image.jpg" durch den tatsächlichen Pfad zu Ihrer Quittungsbilddatei.
  • TesseractEngine wird mit der Sprache (in diesem Fall "eng" für Englisch) und dem Pfad zum tessdata-Verzeichnis, in dem Sie die Sprachdatendateien von Tesseract heruntergeladen haben, initialisiert.
  • Pix.LoadFromFile(imagePath) lädt das Bild vom angegebenen Dateipfad.
  • engine.Process(img) führt OCR auf dem Bild durch.
  • page.GetText() ruft den erkannten Text aus dem OCR-Ergebnis ab.

    Hier ist die Ausgabe des obigen Codes:

    Beleg-OCR-Bibliothek (Liste für Entwickler): Abbildung 3 - OCR-Ausgabe

    Dieses Beispiel zeigt eine grundlegende Verwendung von Tesseract OCR in einer .NET-Anwendung zur Extraktion des gesamten Dokumententextes aus einem Belegbild. Je nach Ihren Anforderungen müssen Sie den erkannten Text eventuell weiterverarbeiten, um bestimmte Belegfelder wie Datum, Händlername und Gesamtbetrag aus dem Beleg zu extrahieren.

Die ultimative Beleg-OCR-Bibliothek: IronOCR - Die C#-OCR-Bibliothek

IronOCR: Ein kurzer Überblick

IronOCR ist eine umfassende OCR-Bibliothek, die speziell für .NET-Entwickler entwickelt wurde und erweiterte Funktionen zum Extrahieren von Text und Daten aus Bildern und PDF-Dokumenten bietet. Diese von Iron Software entwickelte Bibliothek nutzt die neuesten Algorithmen des maschinellen Lernens und Computer-Vision-Techniken, um eine unvergleichliche Genauigkeit und Leistung bei OCR-Aufgaben zu erzielen.

Beleg-OCR-Bibliothek (Liste für Entwickler): Abbildung 4 - IronOCR

Hauptmerkmale und Vorteile

IronOCR enthält alle wichtigen Funktionen, die eine Receipt OCR API haben muss. Hier sind die wichtigsten Merkmale und Vorteile von IronOCR:

  1. Genauigkeit und Zuverlässigkeit: IronOCR verwendet modernste OCR-Algorithmen, die eine hohe Genauigkeit bei der Texterkennung von Quittungen und Rechnungen gewährleisten. Unabhängig davon, ob es sich um gedruckten Text, verzerrte Bilder oder verschiedene Schriftarten und Sprachen handelt, liefert IronOCR konstant verlässliche Ergebnisse und minimiert Fehler bei der Datenerfassung.

  2. Vielseitigkeit und Anpassungsfähigkeit: IronOCR unterstützt eine breite Palette von Bildformaten, darunter JPEG, PNG, TIFF und PDF, was es vielseitig für die Verarbeitung von Belegen in verschiedenen Dateitypen macht. Darüber hinaus bietet es Mehrsprachunterstützung, die es Unternehmen ermöglicht, nahtlos Belege aus verschiedenen Regionen und in verschiedenen Sprachen zu verarbeiten.

  3. Einfache Integration mit .NET: Als native .NET-Bibliothek integriert sich IronOCR nahtlos in bestehende .NET-Anwendungen, was die Implementierung für Entwickler einfach gestaltet. Ob Webanwendungen, Desktop-Software oder Cloud-basierte Lösungen - Entwickler können die APIs und SDKs von IronOCR mühelos in ihre .NET-Projekte einbinden.

  4. Erweiterte Datenerfassung: IronOCR geht über die einfache Texterkennung hinaus, indem es fortschrittliche Datenerfassungsmöglichkeiten bietet. Entwickler können benutzerdefinierte Bereiche auf Quittungen definieren, um bestimmte Felder wie Datum, Händlername, Gesamtbetrag und Einzelposten zu extrahieren. Diese granulare Kontrolle gewährleistet eine präzise, auf die Geschäftsanforderungen zugeschnittene Datenextraktion.

  5. Skalierbarkeit und Leistung: IronOCR ist für eine skalierbare Lösung konzipiert, die große Mengen an Belegen und Rechnungen effizient verarbeiten kann. Ob die Verarbeitung von Dokumentenstapeln in Echtzeit oder asynchron erfolgt, IronOCR bietet eine optimale Leistung ohne Beeinträchtigung der Genauigkeit und eignet sich daher für Anwendungen auf Unternehmensebene.

Installationsprozess

Hier sind die Schritte zur Installation von IronOCR mit dem NuGet Package Manager für Ihre Lösungen:

  1. Öffnen Sie Visual Studio und öffnen Sie Ihre Lösung.

  2. Im Projektmappen-Explorer klicken Sie mit der rechten Maustaste auf Ihre Projektmappe (den obersten Knoten) und wählen Sie "NuGet-Pakete für Projektmappe verwalten...".

  3. Vergewissern Sie sich im Fenster "NuGet Package Manager for Solution", dass die Registerkarte "Durchsuchen" auf der linken Seite ausgewählt ist.

    1. Geben Sie in das Suchfeld oben rechts "IronOCR" ein und drücken Sie die Eingabetaste.

    Beleg OCR-Bibliothek (Liste für Entwickler): Abbildung 5 - IronOCR installieren

  4. Klicken Sie auf die Schaltfläche "Installieren", um den Installationsvorgang zu starten.

  5. Sobald die Installation abgeschlossen ist, sollten Sie eine Meldung sehen, die besagt, dass die Installation erfolgreich war.

Implementierungsbeispiel mit IronOCR - Scannen von Belegen

Hier ist ein einfaches Beispiel, das den vollständigen Extraktionsprozess des IronOCR-Eingangs veranschaulicht und die Eingangsdaten effizient anzeigt.

using IronOcr;
namespace ReceiptOCR
{
    class Program
    {
        static void Main(string[] args)
        {
            string text = new IronTesseract().Read(@"assets\receipt.jpg").Text;
            // Output the recognized text
            Console.WriteLine("Recognized Text:");
            Console.WriteLine(text);
        }
    }
}
using IronOcr;
namespace ReceiptOCR
{
    class Program
    {
        static void Main(string[] args)
        {
            string text = new IronTesseract().Read(@"assets\receipt.jpg").Text;
            // Output the recognized text
            Console.WriteLine("Recognized Text:");
            Console.WriteLine(text);
        }
    }
}
Imports IronOcr
Namespace ReceiptOCR
	Friend Class Program
		Shared Sub Main(ByVal args() As String)
			Dim text As String = (New IronTesseract()).Read("assets\receipt.jpg").Text
			' Output the recognized text
			Console.WriteLine("Recognized Text:")
			Console.WriteLine(text)
		End Sub
	End Class
End Namespace
$vbLabelText   $csharpLabel

Für eine detaillierte Anleitung zur OCR-Quittungsdatenextraktion mit IronOCR besuchen Sie: Using IronOCR for Receipt Data Extraction. Hier ist die Ausgabe des obigen Beispielcodes:

Beleg-OCR-Bibliothek (Liste für Entwickler): Abbildung 6 - Beleg-OCR-Ausgabe

Für detailliertere Informationen und weitere OCR-Funktionen besuchen Sie bitte die Dokumentation und die Seite mit Codebeispielen.

Schlussfolgerung

Auf .NET zugeschnittene OCR-Bibliotheken für Quittungen bieten eine leistungsstarke Lösung für Unternehmen, die ihre Datenverwaltungsfunktionen verbessern und ihre Verwaltungsabläufe rationalisieren möchten. Diese Bibliotheken automatisieren die Extraktion von Informationen aus Quittungen und Rechnungen und ermöglichen es Entwicklern, robuste und effiziente Anwendungen zu erstellen, die eine hohe Genauigkeit und Produktivität bieten. Mit der Flexibilität, sich nahtlos in bestehende .NET-Umgebungen zu integrieren, und der Fähigkeit, mehrere Sprachen und Währungen zu unterstützen, sind die Receipt OCR-Bibliotheken in .NET in der Lage, die Dateneingabeprozesse zu revolutionieren und die betriebliche Qualität in Unternehmen jeder Größe zu verbessern.

IronOCR ist die erste Wahl für Unternehmen, die eine zuverlässige und effiziente OCR-Bibliothek für Belege in .NET-Umgebungen suchen. Mit seiner unvergleichlichen Genauigkeit, Vielseitigkeit und nahtlosen Integration in .NET-Anwendungen ist IronOCR die einzige Technologie, die es Entwicklern ermöglicht, Dateneingabeprozesse zu rationalisieren, die Produktivität zu steigern und die betriebliche Leistung zu verbessern. Ob es um die Automatisierung der Belegverarbeitung in Buchhaltungssystemen, Spesenmanagement-Plattformen oder individuellen Geschäftsanwendungen geht, IronOCR erweist sich als wertvoller Aktivposten bei der Optimierung von Datenmanagement-Workflows und der Erzielung größerer Effizienz in modernen Unternehmen.

Durch die Entscheidung für IronOCR können Unternehmen das volle Potenzial der OCR-Technologie ausschöpfen und ihre digitale Transformation zum Erfolg führen. Zu diesem Zweck bietet IronOCR eine kostenlose Testversion an, um die vollständige Funktionalität zu testen. Seine Lite-Lizenz beginnt ab $749 ohne wiederkehrende Gebühren. Laden Sie die Bibliothek von der Download-Seite herunter und probieren Sie es aus.

Kannaopat Udonpant
Software-Ingenieur
Bevor er Software-Ingenieur wurde, promovierte Kannapat an der Universität Hokkaido in Japan im Bereich Umweltressourcen. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Abteilung für Bioproduktionstechnik ist. Im Jahr 2022 wechselte er mit seinen C#-Kenntnissen zum Engineering-Team von Iron Software, wo er sich auf IronPDF konzentriert. Kannapat schätzt an seiner Arbeit, dass er direkt von dem Entwickler lernt, der den Großteil des in IronPDF verwendeten Codes schreibt. Neben dem kollegialen Lernen genießt Kannapat auch den sozialen Aspekt der Arbeit bei Iron Software. Wenn er nicht gerade Code oder Dokumentationen schreibt, kann man Kannapat normalerweise beim Spielen auf seiner PS5 oder beim Wiedersehen mit The Last of Us antreffen.
< PREVIOUS
Wie man Bilder in Text umwandelt
NÄCHSTES >
Android OCR Bibliotheksliste: Finden Sie das richtige Tool