Invoice OCR API nutzt maschinelles Lernen und Computer Vision, um Rechnungsdaten in ein Format umzuwandeln, das für die automatische Verarbeitung geeignet ist. Diese Technologie behebt Probleme der manuellen Dateneingabe wie Verzögerungen, Kosten und Fehler, indem sie Details wie Lieferanteninformationen, Rechnungsnummern und Preise sowohl aus digitalen als auch aus gescannten Rechnungen genau extrahiert.
Dieser Artikel wird eine erstklassige Rechnungs-OCR-API namens IronOCR verwenden.
Erstellen Sie ein neues C#-Projekt in Visual Studio oder öffnen Sie ein bestehendes Projekt.
Laden Sie eine vorhandene Bilddatei mit der OcrInput-Methode
Extrahieren Sie den Text aus dem Bild mit der Methode Ocr.Read.
Drucken Sie den extrahierten Text in der Konsole mit Console.WriteLine
1. IronOCR
IronOCR, entwickelt von Iron Software, ist eine OCR-Bibliothek mit einer Reihe von Tools für Entwickler. Es nutzt maschinelles Lernen und Computer Vision, um Text aus gescannten Dokumenten, Bildern und PDFs zu extrahieren, was eine automatische Verarbeitung ermöglicht. Seine APIs lassen sich in verschiedene Sprachen und Plattformen integrieren, wodurch Fehler bei der manuellen Dateneingabe reduziert und die Effizienz gesteigert werden. Die extrahierten Daten können analysiert und in bestehende Systeme integriert werden, was die Entscheidungsfindung und Produktivität fördert. Funktionen wie Bildvorverarbeitung, Barcode-Erkennung und Dateiparsing erhöhen seine Vielseitigkeit. IronOCR ermöglicht es Entwicklern, Texterkennung in ihre Anwendungen zu integrieren.
2. Voraussetzungen
Bevor Sie mit IronOCR arbeiten können, müssen einige Voraussetzungen erfüllt sein. Zu diesen Voraussetzungen gehören:
Stellen Sie sicher, dass Sie eine geeignete Entwicklungsumgebung auf Ihrem Computer eingerichtet haben. Dies erfordert in der Regel die Installation einer integrierten Entwicklungsumgebung (IDE) wie Visual Studio.
Es ist wichtig, dass Sie ein Grundverständnis der Programmiersprache C# haben. Auf diese Weise können Sie die in diesem Artikel enthaltenen Code-Beispiele besser verstehen und ändern.
Sie müssen die IronOCR-Bibliothek in Ihrem Projekt installiert haben. Dies kann über den NuGet Package Manager in Visual Studio oder über die Befehlszeilenschnittstelle erfolgen.
Wenn Sie sich vergewissern, dass diese Voraussetzungen erfüllt sind, sind Sie bereit, mit IronOCR zu arbeiten.
3. Erstellen eines neuen Visual Studio-Projekts
Um mit IronOCR zu beginnen, müssen Sie zunächst ein neues Visual Studio-Projekt erstellen.
Öffnen Sie Visual Studio und gehen Sie zu Dateien, klicken Sie auf Neu und dann auf Projekt.
Neues Projekt
Wählen Sie in dem neuen Fenster die Option Konsolenanwendung und klicken Sie auf Weiter.
Konsolenanwendung
Es erscheint ein neues Fenster. Geben Sie den Namen Ihres neuen Projekts und den Speicherort ein und klicken Sie auf Weiter.
Projektkonfiguration
Geben Sie schließlich den Zielrahmen an und klicken Sie auf Erstellen.
Ziel-Framework
Jetzt ist Ihr neues Visual Studio-Projekt erstellt. Installieren wir IronOCR.
4. Installation von IronOCR
Es gibt mehrere Möglichkeiten, die IronOCR-Bibliothek herunterzuladen und zu installieren. Aber hier sind die beiden einfachsten Ansätze.
Verwendung des Visual Studio NuGet-Paketmanagers
Verwendung der Visual Studio-Befehlszeile
4.1. Verwendung des Visual Studio NuGet-Paketmanagers
IronOCR kann mit dem Visual Studio NuGet Package Manager in ein C#-Projekt eingebunden werden.
Navigieren Sie zur grafischen Benutzeroberfläche des NuGet-Paket-Managers, indem Sie Tools > NuGet Package Manager > Manage NuGet Packages for Solution auswählen
NuGet-Paket-Manager
Daraufhin wird ein neues Fenster angezeigt. Suchen Sie nach IronOCR und installieren Sie das Paket in Ihrem Projekt.
Wählen Sie das IronOCR-Paket im NuGet-Paket-Manager-UI aus
Zusätzliche Sprachpakete für IronOCR können ebenfalls mit der oben beschriebenen Methode installiert werden.
4.2. Verwendung der Visual Studio-Befehlszeile
In Visual Studio, gehen Sie zu Tools > NuGet-Paket-Manager > Paket-Manager-Konsole
Geben Sie auf der Registerkarte Paketmanager-Konsole die folgende Zeile ein:
:ProductInstall
Verwaltungskonsole für Pakete
Das Paket wird nun in das aktuelle Projekt heruntergeladen/installiert und steht zur Verwendung bereit.
5. Extrahieren von Daten aus Rechnungen mit IronOCR
Mit IronOCR können Sie mit nur wenigen Zeilen Code Daten aus Rechnungen extrahieren und diese Datenextraktion für weitere Prozesse wie die Dateneingabe verwenden. Dies wird die manuelle Dateneingabe und vieles mehr ersetzen.
Hier ist eine Beispielrechnung, aus der Sie Text extrahieren können.
Die Musterrechnung
Lassen Sie uns nun den Code schreiben, um alle Daten aus dieser Rechnung zu extrahieren.
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
Imports System
Private ocr = New IronTesseract()
Using input = New OcrInput("r2.png")
Dim result = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
$vbLabelText $csharpLabel
Der obige Code erhält eine Eingabe in Form eines Bildes und extrahiert dann Daten aus diesem Bild mithilfe einer Read-Methode aus der IronTesseract-Klasse.
Rechnungsparser
5.1. Rechnungsbearbeitung zur Extraktion bestimmter Daten aus Rechnungen
Sie können auch bestimmte Daten aus Rechnungen extrahieren, z. B. die Rechnungsnummern von Kunden. Nachfolgend finden Sie den Code zum Extrahieren der Kundenrechnungsnummer aus der Rechnung.
using IronOcr;
using System;
using System.Text.RegularExpressions;
var orc = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = orc.Read(input);
var linePattern = @"INV\/\d{4}\/\d{5}";
var lineMatch = Regex.Match(result.Text, linePattern);
if (lineMatch.Success)
{
var lineValue = lineMatch.Value;
Console.WriteLine("Customer Invoice number: " + lineValue);
}
}
using IronOcr;
using System;
using System.Text.RegularExpressions;
var orc = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = orc.Read(input);
var linePattern = @"INV\/\d{4}\/\d{5}";
var lineMatch = Regex.Match(result.Text, linePattern);
if (lineMatch.Success)
{
var lineValue = lineMatch.Value;
Console.WriteLine("Customer Invoice number: " + lineValue);
}
}
Imports IronOcr
Imports System
Imports System.Text.RegularExpressions
Private orc = New IronTesseract()
Using input = New OcrInput("r2.png")
Dim result = orc.Read(input)
Dim linePattern = "INV\/\d{4}\/\d{5}"
Dim lineMatch = Regex.Match(result.Text, linePattern)
If lineMatch.Success Then
Dim lineValue = lineMatch.Value
Console.WriteLine("Customer Invoice number: " & lineValue)
End If
End Using
$vbLabelText $csharpLabel
Rechnungs-Scannen
6. Schlussfolgerung
IronOCRs Invoice OCR API revolutioniert die Datenextraktion aus Rechnungen durch maschinelles Lernen und Computer Vision. Diese Technologie wandelt Rechnungstext und -nummern in ein maschinenlesbares Format um und vereinfacht so die Datenextraktion für Analyse, Integration und Prozessverbesserung. Sie bietet eine robuste Lösung für die Automatisierung der Rechnungsbearbeitung, die Verbesserung der Genauigkeit und die Optimierung von Arbeitsabläufen wie der Kreditorenbuchhaltung. Auch die automatisierte Dateneingabe aus gescannten Rechnungen ist mit dieser Technologie möglich.
Bitte besuchen Sie die Homepage-Website für weitere Informationen zu IronOCR. Weitere Tutorials zur Rechnungs-OCR finden Sie im folgenden detaillierten Rechnungs-OCR-Tutorial. Um mehr darüber zu erfahren, wie Sie Computer Vision verwenden können, um Text wie Rechnungsfelder zu finden, besuchen Sie dieses Computer Vision How-To.
Bevor er Software-Ingenieur wurde, promovierte Kannapat an der Universität Hokkaido in Japan im Bereich Umweltressourcen. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Abteilung für Bioproduktionstechnik ist. Im Jahr 2022 wechselte er mit seinen C#-Kenntnissen zum Engineering-Team von Iron Software, wo er sich auf IronPDF konzentriert. Kannapat schätzt an seiner Arbeit, dass er direkt von dem Entwickler lernt, der den Großteil des in IronPDF verwendeten Codes schreibt. Neben dem kollegialen Lernen genießt Kannapat auch den sozialen Aspekt der Arbeit bei Iron Software. Wenn er nicht gerade Code oder Dokumentationen schreibt, kann man Kannapat normalerweise beim Spielen auf seiner PS5 oder beim Wiedersehen mit The Last of Us antreffen.
< PREVIOUS Beste OCR für die Rechnungsverarbeitung (Aktualisierte Liste)
NÄCHSTES > Wie man in Blazor Text aus einem Bild liest