IRONOCR VERWENDEN

Wie man eine OCR-Lösung für Rechnungen erstellt

Veröffentlicht 18. Februar 2024
Teilen Sie:

Einführung

Optical Character Recognition, oderOCRist eine Technik, mit der Computer Text aus Bildern oder gescannten Dokumenten identifizieren und extrahieren können. Die Umwandlung von texthaltigen Fotos in maschinenlesbare Textdaten ist das Hauptziel von OCR-Software. Zahlreiche Branchen können von den vielfältigen Einsatzmöglichkeiten dieser Technologie profitieren, die die Dateneingabe, die Digitalisierung von Dokumenten und die Automatisierung von Prozessen wie der Kreditorenbuchhaltung vereinfacht. In diesem Artikel geht es um den Einsatz von OCR-Lösungen für die Rechnungsverarbeitung und wie sie die manuelle Rechnungsverarbeitung überflüssig machen.

So verwenden Sie die OCR-Lösung für Rechnungen

  1. Installieren Sie dieIronOCR C#-Bibliothek.

  2. Erstellen Sie ein neues C#-Projekt in Visual Studio

  3. Untersuchen Sie eine funktionsreiche C#-Bibliothek für die OCR beim Empfang.

  4. Mit Tesseract Daten aus Quittungen extrahieren

  5. Suchen Sie nach bestimmten Daten in dem extrahierten Textergebnis.

  6. Prüfen Sie die Barcodewerte auf dem mitgelieferten Belegbild.

Was ist Rechnungsbearbeitung?

Unternehmen können bildbasierte oder gescannte Rechnungen in maschinenlesbaren Text umwandeln, indem sie die OCR-Rechnungsverarbeitung nutzen, die die Extraktion von Text und Daten aus Rechnungen automatisiert. Die Effizienz der Finanzverfahren wird insgesamt gesteigert, die manuelle Dateneingabe wird verringert und die Bearbeitung von Rechnungen wird dank dieser Automatisierung rationalisiert.

IronOCR

Optische Zeichenerkennung(OCR) wird für Entwickler, die die Programmiersprache C# verwenden, ermöglicht durchIronOCR**eine .NET-Bibliothek. IronOCR, entwickelt von Iron Software, ist ein nützliches Tool für Anwendungen, die eine automatische Texterkennung benötigen, da es die Extraktion von Text aus Fotos, gescannten Dokumenten und PDF-Dateien ermöglicht. Um Text und Daten aus Rechnungen zu extrahieren, müssen Sie die IronOCR-Bibliothek in Ihre .NET-Anwendung integrieren, um Rechnungen mit IronOCR automatisch zu verarbeiten.

IronOCR hilft durch den Einsatz von KI-Algorithmen, Betrug zu vermeiden. So lassen sich Fehler, Betrug und doppelte Rechnungen schnell erkennen. Verringern Sie Fehler mit der überlegenen OCR-Rechnungsdatenextraktion, so dass Sie durch menschliche Dateneingabe verursachte Fehler vermeiden können. Erfahren Sie mehr über den IronOCR-Check*hier.

Die wichtigsten Merkmale von IronOCR sind:

  • Extraktion von Text: Aus Bildern, gescannten Dokumenten und PDF-Dateien können mit IronOCR Textinhalte extrahiert werden. Es verwendet hochentwickelte OCR-Algorithmen, um Wörter, Zeichen und Layouts in den gelieferten Dokumenten zu identifizieren.
  • Um Textinformationen aus Rechnungsfotos zu extrahieren, verwenden Sie IronOCR. Dabei werden Informationen über den Lieferanten, die Einzelposten, die Rechnungsnummer, das Datum und andere relevante Daten abgerufen.
  • Barcode-Lesen: IronOCR kann zusätzlich zur OCR auch Barcodes von Bildern lesen, was seine Anpassungsfähigkeit für Anwendungen erhöht, die sowohl Text- als auch Barcode-Daten verarbeiten müssen.
  • Bildvorverarbeitung: Entzerrung, Rauschunterdrückung und Kontrastkorrektur gehören zu den von IronOCR unterstützten Bildvorverarbeitungsmethoden. Durch die Verbesserung der Eingabebilder tragen diese Vorverarbeitungsprozesse zur Erhöhung der OCR-Genauigkeit bei.
  • Zonenbasierte OCR-Technologie: Durch die Definition von OCR-Zonen können Entwickler bestimmte Bereiche eines Bildes angeben, auf die sich die Textextraktion konzentrieren soll. Bei der Verwaltung von Papieren mit organisierten Layouts ist diese Funktion sehr nützlich.
  • OCR-Software scannt und extrahiert Text aus gescannten oder fotografierten Informationen durch Verarbeitung der erfassten Bilder oder Dokumente. Das Layout, die Wörter und die Zeichen des Dokuments werden von der OCR-Engine interpretiert.

    Es ist wichtig zu bedenken, dass die Genauigkeit der OCR-Einstellungen, die Komplexität der Rechnungen und die Qualität der eingegebenen Fotos den Erfolg der Lösung beeinflussen. Darüber hinaus können die Verwendung der APIs von IronOCR und das Verständnis der besonderen Fähigkeiten der Bibliothek notwendige Schritte im Integrationsprozess sein. Die aktuellsten Informationen und Empfehlungen finden Sie immer in der offiziellen IronOCR-Literatur.

Erstellen eines neuen Projekts in Visual Studio

Navigieren Sie nach dem Start von Visual Studio zum "Dateimenü". Gehen Sie zu "Neues Projekt" und wählen Sie "Konsolenanwendung". In diesem Beitrag werden wir PDF-Dokumente mithilfe eines Konsolenprogramms erstellen.

Wie man eine OCR-Lösung für Rechnungen erstellt: Abbildung 1 - Erstellen eines neuen Projekts mit Visual Studio

Geben Sie in das entsprechende Textfeld den Projektnamen ein und wählen Sie den Speicherort der Datei. Als Nächstes klicken Sie, wie in der Abbildung unten zu sehen, auf die Schaltfläche Erstellen und wählen das erforderliche .NET-Framework aus.

Wie man eine OCR-Lösung für Rechnungen erstellt: Abbildung 2 - Konfigurieren der Projektinformationen

Nachdem Sie die Anwendung ausgewählt haben, wird das Visual Studio-Projekt seine Struktur erstellen. Wenn Sie die Konsolen-, Windows- oder Web-Version gewählt haben, wird die Datei program.cs geöffnet, so dass Sie Code hinzufügen und die Anwendung erstellen/ausführen können.

Um den Code zu testen, können wir die Bibliothek danach hinzufügen.

IronOCR installieren

Die Installation von Paketen direkt in Ihre Lösung ist mit dem NuGet-Paketverwaltungstool von Visual Studio möglich. Der unten stehende Schnappschuss kann verwendet werden, um den NuGet Package Manager anzuzeigen.

Wie man eine OCR-Lösung für Rechnungen erstellt: Abbildung 3 - Wie man über Visual Studio zum NuGet-Paketmanager gelangt

Er verfügt über ein Suchfeld, das die Liste der Pakete von der NuGet-Website anzeigt. Wie im Screenshot unten zu sehen ist, müssen wir im Paketmanager nach dem Begriff IronOCR suchen:

Wie man eine OCR-Lösung für Rechnungen erstellt: Abbildung 4 - Installation von IronOCR über den NuGet-Paketmanager

Die obige Grafik könnte uns eine Liste einschlägiger Suchbegriffe liefern. Wir müssen die erforderliche Auswahl treffen, um das Lösungspaket zu installieren.

IronOCR zum Extrahieren von Daten aus Rechnungen

IronOCR ist eine leistungsstarke OCR-Bibliothek, die zum Extrahieren von Daten und zum Lesen von Rechnungsdaten verwendet werden kann. Mit IronOCR können Sie eine Quittung abfotografieren und in einen leicht zu verarbeitenden und zu analysierenden maschinenlesbaren Text umwandeln, ohne den Datenschutz zu gefährden. Die OCR von Rechnungen ermöglicht es uns, Rechnungsdaten in ein digitales Format zu übertragen.

Dies ist ein Beispiel dafür, wie IronOCR bei der Verarbeitung von Lieferantenrechnungen arbeitet und Text aus Papierrechnungen extrahiert.

using System;
using System.Collections.Generic;
using IronOcr;
var Ocr = new IronTesseract(); // nothing to configure            
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"invoice.png"); // adding the example invoice to read
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
using System;
using System.Collections.Generic;
using IronOcr;
var Ocr = new IronTesseract(); // nothing to configure            
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"invoice.png"); // adding the example invoice to read
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
Imports System
Imports System.Collections.Generic
Imports IronOcr
Private Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("invoice.png") ' adding the example invoice to read
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Console.ReadKey()
End Using
VB   C#

Das Ergebnis des oben genannten Codes lautet wie folgt:

Wie man eine OCR-Lösung für Rechnungen erstellt: Abbildung 5 - Ausgegebener Text aus dem vorherigen Code

Das obige Beispiel zeigt, dass IronOCR uns bei der OCR und der Anzeige der extrahierten Daten in der Konsole geholfen hat.

Barcodes auf Rechnungen lesen

Zusätzlich zum Text können mit IronOCR auch Barcodes auf Quittungen gescannt werden. Um IronOCR zum Scannen von Barcodes auf Belegen zu verwenden, müssen Sie die Funktion ReadBarCodes zusammen mit der Klasse BarcodeReader verwenden.

Dies ist eine Illustration der Verwendung von IronOCR zur Dekodierung des Bildes einer Quittung zum Lesen von Barcodes.

var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput("invoice.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    foreach (var barcode in ocrResult.Barcodes)
    {
        Console.WriteLine(barcode.Value);
    }
}
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput("invoice.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    foreach (var barcode in ocrResult.Barcodes)
    {
        Console.WriteLine(barcode.Value);
    }
}
Dim ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Using ocrInput As New OcrInput("invoice.png")
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	For Each barcode In ocrResult.Barcodes
		Console.WriteLine(barcode.Value)
	Next barcode
End Using
VB   C#

Wie man eine OCR-Lösung für Rechnungen erstellt: Abbildung 6 - Eingegebener Barcode

IronOCR bietet zwar leistungsstarke OCR-Funktionen, doch darf man nicht vergessen, dass der gesamte Workflow der Rechnungsverarbeitung auch andere Elemente wie Datenvalidierung, Geschäftslogik und die Anbindung an Finanzsysteme erfordert. Je nach Anwendungsfall müssen Sie IronOCR möglicherweise mit weiteren Tools oder Komponenten kombinieren, um eine vollständige Lösung für die Rechnungsbearbeitung zu erhalten.

Ergebnis:

Wie man eine OCR-Lösung für Rechnungen erstellt: Abbildung 7 - Das Ergebnis des Lesens des Beispiel-Barcodes unter Verwendung des obigen Codes

Weitere Informationen über die IronOCR Online-Demo finden Sie unter*hier.

Schlussfolgerung

Als starke und anpassungsfähige Optical Character Recognition(OCR) bibliothek für C#-Entwickler,IronOCR hebt sich abschließend hervor. Die Textextraktion aus Fotos, gescannten Dokumenten und PDF-Dateien wird durch diese umfassende Sammlung von Funktionen der Iron Software .NET-Bibliothek ermöglicht und vereinfacht.

Und schließlich ist IronOCR eine bemerkenswerte OCR-Lösung, die sich durch hervorragende Integration, Flexibilität und Genauigkeit auszeichnet. Aufgrund seiner unvergleichlichen Genauigkeit, seiner fortschrittlichen Algorithmen und seiner Fähigkeit, eine Vielzahl von Dokumentenformaten, einschließlich handgeschriebener Dokumente, zu erkennen, ist IronOCR die beste OCR-Lösung, die derzeit auf dem Markt ist, und bietet bessere Dokumente mit Codebeispielen, die es Anfängern ermöglichen, schnell und einfach zu lernen.

Die kostengünstige Entwicklungsversion von IronOCR ist zugänglich, und der Kauf des IronOCR-Pakets gewährt eine lebenslange Lizenz. Da die IronOCR-Paketangebote bei $749 beginnen, d.h. ein einziger Preis für zahlreiche Systeme, bietet es einen außergewöhnlichen Wert. Es bietet 24/7 Online-Support für lizenzierte IronOCR-Benutzer. Bitte beachten Sie die IronOCRwebsite für weitere Informationen zu den Gebühren.

< PREVIOUS
Erstellen eines OCR-Bon-Scanners in C#
NÄCHSTES >
OCR-Automatisierungsleitfaden für Entwickler

Sind Sie bereit, loszulegen? Version: 2024.11 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 2,791,504 Lizenzen anzeigen >