Zum Fußzeileninhalt springen
OCR-WERKZEUGE

Beleg-OCR Bibliothek (Liste für Entwickler)

In der .NET-Entwicklungsumgebung ist die Rationalisierung manueller Dateneingabeprozesse, insbesondere bei Quittungen und Rechnungen, seit langem ein Ziel für Unternehmen, die Effizienz und Genauigkeit anstreben. Mit dem Aufkommen von OCR-Bibliotheken (Optical Character Recognition) zum Scannen von Quittungen, die auf .NET-Umgebungen zugeschnitten sind, ist dieses Ziel leichter zu erreichen als je zuvor. Diese Empfänger-OCR-API-Bibliotheken ermöglichen es Entwicklern, leistungsstarke Empfänger-Funktionen nahtlos in ihre .NET-Anwendungen zu integrieren und die Datenverwaltung zu revolutionieren.

Die Extraktion von Belegdaten kann mithilfe der Document Intelligence-Dienste von Microsoft Azure effizient durchgeführt werden. Weitere Informationen finden Sie unter Receipt Data Extraction - Microsoft Azure Document Intelligence.

Beleg- und OCR-API-Bibliothek in .NET verstehen

Eine Quittung ist ein Dokument, das die wichtigsten Daten einer Transaktion enthält, oft in einem unstrukturierten Datenformat, das mit Algorithmen des maschinellen Lernens verarbeitet werden kann, um strukturierte Daten für die Analyse zu extrahieren. Die Bilder der Quittung enthalten den gesamten Text des Dokuments, was die Umwandlung von unstrukturierten Informationen in strukturierte Daten erleichtert, aber auch Bedenken hinsichtlich des Datenschutzes aufkommen lässt.

Die OCR-API-Bibliotheken für Quittungen, die für das .NET Framework entwickelt wurden, bieten eine umfassende Reihe von Tools und Funktionen, um Daten oder relevante Informationen aus gescannten oder fotografierten Quittungen zu extrahieren. Diese Bibliotheken nutzen fortschrittliche Algorithmen des maschinellen Lernens und Computer-Vision-Techniken, um Text, Zahlen und wichtige Datenpunkte wie Datum, Händlername, Gesamtbetrag und vieles mehr genau zu identifizieren.

Hauptmerkmale und Vorteile

  1. Genauigkeit und Geschwindigkeit: Einer der Hauptvorteile der OCR-Bibliotheken für das Scannen von Quittungen in .NET ist ihre Fähigkeit, Daten aus Quittungen mit hoher Präzision und Geschwindigkeit zu extrahieren. Durch die Automatisierung der Dateneingabe machen diese Bibliotheken die manuelle Dateneingabe oder Transkription überflüssig, wodurch Fehler reduziert und wertvolle Zeit gespart wird.
  2. Integrationsflexibilität: Die OCR-Bibliotheken für Quittungen in .NET sind so konzipiert, dass sie sich nahtlos in bestehende .NET-Anwendungen integrieren lassen, so dass es für Entwickler einfach ist, OCR-Technologiefunktionen in ihre Softwarelösungen zu integrieren. Ganz gleich, ob es sich um eine Buchhaltungsanwendung, ein Kostenmanagementsystem oder eine benutzerdefinierte Unternehmenssoftware handelt, diese Bibliotheken können nahtlos integriert werden, um die Datenverwaltungsfunktionen zu verbessern.
  3. Sprach- und Währungsunterstützung: Moderne OCR-Bibliotheken für Quittungen in .NET sind in der Lage, Quittungsfelder in mehreren Sprachen und Währungen zu verarbeiten. Dies gewährleistet Vielseitigkeit und Anpassungsfähigkeit für Unternehmen, die in verschiedenen Regionen tätig sind oder mit internationalen Kunden und Lieferanten zu tun haben.
  4. Anpassung und Erweiterbarkeit: Entwickler, die mit Receipt- oder Invoice-OCR-API-Bibliotheken in .NET arbeiten, haben die Flexibilität, die Funktionalität entsprechend ihren spezifischen Anforderungen anzupassen und zu erweitern. Ob es um die Unterstützung neuer Datenformate oder die Verbesserung der Erkennungsgenauigkeit für bestimmte Felder geht, diese Bibliotheken bieten zahlreiche Möglichkeiten zur Anpassung.
  5. Sicherheit und Compliance: Führende OCR-Empfangsbibliotheken in .NET legen großen Wert auf Datensicherheit und die Einhaltung von Branchenvorschriften wie GDPR und HIPAA. Robuste Verschlüsselungsprotokolle und strenge Datenschutzmaßnahmen stellen sicher, dass die aus den Belegen extrahierten sensiblen Informationen sicher und in Übereinstimmung mit den gesetzlichen Bestimmungen behandelt werden.

Belege OCR-Bibliotheken - Open-Source

1. Tesserakt

Tesseract ist eine der bekanntesten Open-Source-OCR-Engines, die sich großer Beliebtheit erfreut und aktiv gepflegt wird. Der Reiz liegt in der Flexibilität, die eine Anpassung durch Training an benutzerdefinierten Datensätzen ermöglicht. Für OCR-Aufgaben für Belege kann Tesseract eine brauchbare Option sein, insbesondere wenn Sie über eine große Menge an Trainingsdaten für Belege verfügen. Es ist jedoch anzumerken, dass der Trainingsprozess kompliziert und zeitaufwändig sein kann und Fachkenntnisse in der Datenkommentierung und Modelloptimierung erfordert. Der Open-Source-Charakter von Tesseract fördert jedoch eine lebendige Gemeinschaft, die umfangreiche Dokumentations- und Support-Ressourcen anbietet, um Entwicklern bei der Navigation durch die Komplexität des Programms zu helfen.

2. easyOCR

Als benutzerfreundlicher Wrapper um Tesseract präsentiert sich EasyOCR als eine leichter zugängliche Option für Entwickler, die OCR-Funktionen einfach in ihre Projekte integrieren möchten. Da für verschiedene Sprachen, einschließlich Englisch, bereits trainierte Modelle zur Verfügung stehen, vereinfacht EasyOCR den Implementierungsprozess und eignet sich daher besonders für einfache OCR-Anforderungen für Belege. Durch die Abstraktion von den Feinheiten der Tesseract zugrunde liegenden Funktionalität vereinfacht EasyOCR den Integrationsprozess und ermöglicht es Entwicklern, sich auf ihre Anwendungslogik zu konzentrieren, ohne sich mit den Feinheiten der OCR-Engine-Konfiguration zu befassen.

Receipt OCR API - Kommerzielle Bibliotheken

1. Google Cloud Vision API

Die Google Cloud Vision API ist ein kostenpflichtiger, cloudbasierter OCR-Dienst und bietet eine robuste Lösung für Unternehmen, die eine hohe Genauigkeit und Skalierbarkeit ihrer OCR-Workflows für Belege wünschen. Mit vortrainierten Modellen, die speziell für Daten aus Quittungen optimiert sind, bietet diese API eine beeindruckende Leistung bei der Extraktion von Text aus Bildern. Die Abhängigkeit von der Cloud-Infrastruktur erfordert jedoch eine Internetverbindung, und je nach Umfang der OCR-Anfragen können Nutzungskosten anfallen. Nichtsdestotrotz macht die Bequemlichkeit eines verwalteten Dienstes in Verbindung mit dem Fachwissen von Google im Bereich des maschinellen Lernens die Google Cloud Vision API zu einer attraktiven Wahl für Unternehmen mit unterschiedlichen OCR-Anforderungen, z. B. im Bereich des Lieferkettenmanagements.

2. Microsoft Azure Computer Vision API

Ähnlich wie Google Cloud Vision API bietet Microsoft Azure Computer Vision API einen cloudbasierten OCR-Dienst mit vortrainierten Modellen, die auf die Erkennung von Belegen zugeschnitten sind. Mit einem Pay-as-you-go-Preismodell bietet diese API Unternehmen Flexibilität bei der Verwaltung der OCR-Kosten je nach Nutzung. Die Azure Computer Vision API nutzt die umfangreichen KI-Fähigkeiten von Microsoft und liefert eine zuverlässige Leistung bei der Extraktion relevanter Informationen aus Belegfotos. Darüber hinaus erleichtert die nahtlose Integration mit anderen Azure-Diensten die Entwicklung von End-to-End-Lösungen für die Dokumentenverarbeitung und verbessert die Effizienz und Skalierbarkeit von Arbeitsabläufen.

3. ABBYY FineReader-Engine

Die ABBYY FineReader Engine ist als kommerzielle OCR-Engine bekannt für ihre außergewöhnliche Genauigkeit und ihre umfassenden Funktionen, die speziell auf Aufgaben der Dokumentenverarbeitung, einschließlich der OCR von Belegen, zugeschnitten sind. ABBYY FineReader Engine ist zwar mit einer kommerziellen Lizenz verbunden, bietet aber eine unvergleichliche Leistung und Zuverlässigkeit, was es zu einer bevorzugten Wahl für Unternehmen mit strengen OCR-Anforderungen macht. Die mit der ABBYY FineReader Engine verbundenen Kosten können jedoch ein Hindernis für kleinere Projekte darstellen und erfordern eine sorgfältige Abwägung der Budgetrestriktionen.

4. AnyOCR

AnyOCR entpuppt sich als vielseitige OCR-Bibliothek, die robuste Genauigkeit für verschiedene Dokumenttypen, einschließlich Quittungen, bietet. Mit Optionen für den Einsatz vor Ort und in der Cloud bietet AnyOCR Unternehmen Flexibilität bei der Wahl des Einsatzmodells, das am besten zu ihren Anforderungen passt. Auch wenn eine kommerzielle Lizenz erforderlich ist, bietet AnyOCR eine konsistente Leistung und Zuverlässigkeit für verschiedene Anwendungsfälle. Die Unterstützung von Quittungen in Verbindung mit der Anpassungsfähigkeit an verschiedene Dokumentenformate macht AnyOCR zu einer umfassenden OCR-Lösung für Unternehmen, die Genauigkeit und Vielseitigkeit in ihren Dokumentenverarbeitungs-Workflows suchen.

Implementierung und Integration

Die Implementierung einer OCR-Bibliothek in einer .NET-Umgebung beinhaltet in der Regel die Integration der APIs oder SDKs der Bibliothek in die bestehende Anwendungsarchitektur. Entwickler können die umfassende Dokumentation, Beispielcodeausschnitte und den Entwicklersupport nutzen, um den Integrationsprozess zu rationalisieren und die OCR-Funktionalität in ihren Anwendungen zu optimieren, um genaue Daten zu extrahieren.

Ein Beispiel für eine OCR-Bibliothek für Quittungen in .NET ist die Tesseract-Bibliothek, eine Open-Source-OCR-Engine, die von Google gepflegt wird. Tesseract bietet robuste OCR-Funktionen und unterstützt mehrere Sprachen. Hier ein einfaches Beispiel, wie Sie Tesseract OCR in einer .NET-Anwendung einsetzen können:

Zunächst müssen Sie das Tesseract.NET-Wrapper-Paket über den NuGet Package Manager installieren:

Install-Package Tesseract

Receipt OCR Library (List For Developers): Abbildung 1 - Tesseract installieren

Außerdem müssen wir die sprachspezifischen trainierten Daten aus dem folgenden Repository abrufen: https://github.com/tesseract-ocr/tessdata/. Legen Sie diesen tessdata-Ordner in ein beliebiges Verzeichnis und vergewissern Sie sich, dass Sie ihn korrekt referenzieren.

Das folgende Bild wird zu Demonstrationszwecken verwendet:

Receipt OCR Library (List For Developers): Abbildung 2 - Quittungseingabe

Mit dem folgenden Codeschnipsel können Sie eine OCR-Erkennung für ein Belegbild durchführen:

using System;
using Tesseract;

namespace ReceiptOCR
{
    class Program
    {
        static void Main(string[] args)
        {
            // Path to the image file
            string imagePath = "path/to/your/receipt/image.jpg";

            // Initialize Tesseract engine
            using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default))
            {
                using (var img = Pix.LoadFromFile(imagePath))
                {
                    // Set the image for OCR
                    using (var page = engine.Process(img))
                    {
                        // Get the text recognized by Tesseract
                        string recognizedText = page.GetText();

                        // Output the recognized text
                        Console.WriteLine("Recognized Text:");
                        Console.WriteLine(recognizedText);
                    }
                }
            }
        }
    }
}
using System;
using Tesseract;

namespace ReceiptOCR
{
    class Program
    {
        static void Main(string[] args)
        {
            // Path to the image file
            string imagePath = "path/to/your/receipt/image.jpg";

            // Initialize Tesseract engine
            using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default))
            {
                using (var img = Pix.LoadFromFile(imagePath))
                {
                    // Set the image for OCR
                    using (var page = engine.Process(img))
                    {
                        // Get the text recognized by Tesseract
                        string recognizedText = page.GetText();

                        // Output the recognized text
                        Console.WriteLine("Recognized Text:");
                        Console.WriteLine(recognizedText);
                    }
                }
            }
        }
    }
}
Imports System
Imports Tesseract

Namespace ReceiptOCR
	Friend Class Program
		Shared Sub Main(ByVal args() As String)
			' Path to the image file
			Dim imagePath As String = "path/to/your/receipt/image.jpg"

			' Initialize Tesseract engine
			Using engine = New TesseractEngine("./tessdata", "eng", EngineMode.Default)
				Using img = Pix.LoadFromFile(imagePath)
					' Set the image for OCR
					Using page = engine.Process(img)
						' Get the text recognized by Tesseract
						Dim recognizedText As String = page.GetText()

						' Output the recognized text
						Console.WriteLine("Recognized Text:")
						Console.WriteLine(recognizedText)
					End Using
				End Using
			End Using
		End Sub
	End Class
End Namespace
$vbLabelText   $csharpLabel

In diesem Code:

  • Ersetzen Sie "path/to/your/receipt/image.jpg" durch den tatsächlichen Pfad zu Ihrer Belegbilddatei.
  • TesseractEngine wird mit der Sprache ("eng" für Englisch in diesem Fall) und dem Pfad zum tessdata-Verzeichnis, in das Sie die Sprachdateien von Tesseract heruntergeladen haben, initialisiert.
  • Pix.LoadFromFile(imagePath) lädt das Bild aus dem angegebenen Dateipfad.
  • engine.Process(img) führt OCR für das Bild durch.
  • page.GetText() ruft den erkannten Text aus dem OCR-Ergebnis ab.

Hier ist die Ausgabe des obigen Codes:

Receipt OCR Library (List For Developers): Abbildung 3 - OCR-Ausgabe

Dieses Beispiel demonstriert die grundlegende Verwendung von Tesseract OCR in einer .NET-Anwendung zur Extraktion des gesamten Dokumententextes aus einem Belegbild. Je nach Ihren Anforderungen müssen Sie den erkannten Text eventuell weiterverarbeiten, um bestimmte Belegfelder wie Datum, Händlername und Gesamtbetrag aus dem Beleg zu extrahieren.

Die ultimative OCR-Bibliothek für Quittungen: IronOCR - Die C# OCR-Bibliothek

IronOCR: Ein kurzer Überblick

IronOCR ist eine umfassende OCR-Bibliothek, die speziell für .NET-Entwickler entwickelt wurde und erweiterte Funktionen für die Extraktion von Text und Daten aus Bildern und PDF-Dokumenten bietet. Diese von Iron Software entwickelte Bibliothek nutzt die neuesten Algorithmen des maschinellen Lernens und Computer-Vision-Techniken, um eine beispiellose Genauigkeit und Leistung bei OCR-Aufgaben zu erzielen.

Receipt OCR Library (List For Developers): Abbildung 4 - IronOCR

Hauptmerkmale und Vorteile

IronOCR enthält alle wichtigen Funktionen, die eine Receipt OCR API haben muss. Hier sind die wichtigsten Funktionen und Vorteile von IronOCR:

  1. Genauigkeit und Zuverlässigkeit: IronOCR setzt hochmoderne OCR-Algorithmen ein, die eine hohe Genauigkeit bei der Erkennung von Text aus Quittungen und Rechnungen gewährleisten. Egal, ob es sich um gedruckten Text, verzerrte Bilder oder verschiedene Schriftarten und Sprachen handelt, IronOCR liefert stets zuverlässige Ergebnisse und minimiert Fehler bei der Datenextraktion.
  2. Vielseitigkeit und Anpassungsfähigkeit: IronOCR unterstützt eine breite Palette von Bildformaten, darunter JPEG, PNG, TIFF und PDF, und ist damit vielseitig für die Verarbeitung von Belegen in verschiedenen Dateitypen einsetzbar. Darüber hinaus bietet es Unterstützung für mehrere Sprachen, so dass Unternehmen Belege aus verschiedenen Regionen und Sprachen nahtlos verarbeiten können.
  3. Einfache Integration mit .NET: Als native .NET-Bibliothek lässt sich IronOCR nahtlos in bestehende .NET-Anwendungen integrieren, was die Implementierung für Entwickler sehr einfach macht. Unabhängig davon, ob sie Webanwendungen, Desktop-Software oder Cloud-basierte Lösungen erstellen, können Entwickler die APIs und SDKs von IronOCR mühelos in ihre .NET-Projekte einbinden.
  4. Erweiterte Datenextraktion: IronOCR geht über die einfache Texterkennung hinaus und bietet erweiterte Datenextraktionsfunktionen. Entwickler können benutzerdefinierte Bereiche auf Quittungen definieren, um bestimmte Felder wie Datum, Händlername, Gesamtbetrag und Einzelposten zu extrahieren. Diese granulare Kontrolle gewährleistet eine präzise, auf die Geschäftsanforderungen zugeschnittene Datenextraktion.
  5. Skalierbarkeit und Leistung: IronOCR ist für eine skalierbare Lösung konzipiert, die in der Lage ist, große Mengen an Belegen und Rechnungen effizient zu verarbeiten. Ob die Verarbeitung von Dokumentenstapeln in Echtzeit oder asynchron erfolgt, IronOCR bietet optimale Leistung ohne Abstriche bei der Genauigkeit und eignet sich daher für Anwendungen auf Unternehmensebene.

Installationsprozess

Im Folgenden finden Sie die Schritte zur Installation von IronOCR mit dem NuGet Package Manager für Ihre Lösungen:

  1. Öffnen Sie Visual Studio und öffnen Sie Ihre Lösung.
  2. Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Ihre Projektmappe (den obersten Knoten) und wählen Sie "NuGet-Pakete für Projektmappe verwalten...".
  3. Stellen Sie im Fenster "NuGet Package Manager for Solution" sicher, dass die Registerkarte "Durchsuchen" auf der linken Seite ausgewählt ist.
  4. Geben Sie in das Suchfeld oben rechts "IronOCR" ein und drücken Sie die Eingabetaste.

Receipt OCR Library (Liste für Entwickler): Abbildung 5 - IronOCR installieren

  1. Klicken Sie auf die Schaltfläche "Installieren", um den Installationsprozess zu starten.
  2. Sobald die Installation abgeschlossen ist, sollten Sie eine Meldung sehen, die angibt, dass die Installation erfolgreich war.

Implementierungsbeispiel mit IronOCR - Scannen von Belegen

Hier ist ein einfaches Beispiel, das den vollständigen Extraktionsprozess des IronOCR-Belegs veranschaulicht und die Belegdaten effizient anzeigt.

using IronOcr;

namespace ReceiptOCR
{
    class Program
    {
        static void Main(string[] args)
        {
            // Perform OCR on the receipt image
            string text = new IronTesseract().Read(@"assets\receipt.jpg").Text;

            // Output the recognized text
            Console.WriteLine("Recognized Text:");
            Console.WriteLine(text);
        }
    }
}
using IronOcr;

namespace ReceiptOCR
{
    class Program
    {
        static void Main(string[] args)
        {
            // Perform OCR on the receipt image
            string text = new IronTesseract().Read(@"assets\receipt.jpg").Text;

            // Output the recognized text
            Console.WriteLine("Recognized Text:");
            Console.WriteLine(text);
        }
    }
}
Imports IronOcr

Namespace ReceiptOCR
	Friend Class Program
		Shared Sub Main(ByVal args() As String)
			' Perform OCR on the receipt image
			Dim text As String = (New IronTesseract()).Read("assets\receipt.jpg").Text

			' Output the recognized text
			Console.WriteLine("Recognized Text:")
			Console.WriteLine(text)
		End Sub
	End Class
End Namespace
$vbLabelText   $csharpLabel

Eine ausführliche Anleitung zur OCR-Empfangsdatenextraktion mit IronOCR finden Sie unter: Using IronOCR for Receipt Data Extraction. Hier ist die Ausgabe des obigen Beispielcodes:

Receipt OCR Library (Liste für Entwickler): Abbildung 6 - Quittungen OCR-Ausgabe

Für detailliertere Informationen und weitere OCR-Funktionen besuchen Sie bitte die Dokumentation und die Seite Beispiele.

Abschluss

Auf .NET zugeschnittene OCR-Bibliotheken für Quittungen bieten eine leistungsstarke Lösung für Unternehmen, die ihre Datenverwaltungsfunktionen verbessern und ihre administrativen Arbeitsabläufe rationalisieren möchten. Durch die Automatisierung der Extraktion von Informationen aus Quittungen und Rechnungen ermöglichen diese Bibliotheken Entwicklern die Erstellung robuster, effizienter Anwendungen, die sich durch hohe Genauigkeit und Produktivität auszeichnen. Mit der Flexibilität, sich nahtlos in bestehende .NET-Umgebungen zu integrieren, und der Fähigkeit, mehrere Sprachen und Währungen zu unterstützen, sind die Receipt OCR-Bibliotheken in .NET in der Lage, Dateneingabeprozesse zu revolutionieren und die betriebliche Qualität in Unternehmen jeder Größe zu verbessern.

IronOCR ist die erste Wahl für Unternehmen, die eine zuverlässige und effiziente OCR-Bibliothek für Belege in .NET-Umgebungen suchen. Mit seiner beispiellosen Genauigkeit, Vielseitigkeit und nahtlosen Integration in .NET-Anwendungen versetzt IronOCR Entwickler in die Lage, Dateneingabeprozesse zu rationalisieren, die Produktivität zu steigern und die betriebliche Leistung zu verbessern. Ob bei der Automatisierung der Belegverarbeitung in Buchhaltungssystemen, Spesenverwaltungsplattformen oder benutzerdefinierten Geschäftsanwendungen, IronOCR erweist sich als wertvoller Aktivposten bei der Optimierung von Datenverwaltungsabläufen und der Erzielung größerer Effizienz in modernen Unternehmen.

Mit IronOCR können Unternehmen das volle Potenzial der OCR-Technologie ausschöpfen und ihre digitale Transformation erfolgreich vorantreiben. Zu diesem Zweck bietet IronOCR eine kostenlose Testversion an, mit der Sie die vollständige Funktionalität testen können. Seine Lite Lizenz beginnt bei $799 ohne wiederkehrende Gebühren. Laden Sie die Bibliothek von der Download-Seite herunter und probieren Sie sie aus.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen