IRONOCR VERWENDEN

OCR-API für Rechnungen (Tutorial für Entwickler)

Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

Kannapat Udonpant

22. Juli 2023

Teilen Sie:

Invoice OCR API nutzt maschinelles Lernen und Computer Vision, um Rechnungsdaten in ein Format umzuwandeln, das für die automatische Verarbeitung geeignet ist. Diese Technologie behebt Probleme der manuellen Dateneingabe wie Verzögerungen, Kosten und Fehler, indem sie Details wie Lieferanteninformationen, Rechnungsnummern und Preise sowohl aus digitalen als auch aus gescannten Rechnungen genau extrahiert.

Dieser Artikel wird eine erstklassige Rechnungs-OCR-API namens IronOCR verwenden.

Wie erstellt man eine OCR-API für Rechnungen?

Laden Sie die Invoice-OCR-API herunter und installieren Sie sie
Erstellen Sie ein neues C#-Projekt in Visual Studio oder öffnen Sie ein bestehendes Projekt.
Laden Sie eine vorhandene Bilddatei mit der OcrInput-Methode
Extrahieren Sie den Text aus dem Bild mit der Methode Ocr.Read.
Drucken Sie den extrahierten Text in der Konsole mit Console.WriteLine

1. IronOCR

IronOCR, entwickelt von Iron Software, ist eine OCR-Bibliothek mit einer Reihe von Tools für Entwickler. Es nutzt maschinelles Lernen und Computer Vision, um Text aus gescannten Dokumenten, Bildern und PDFs zu extrahieren, was eine automatische Verarbeitung ermöglicht. Seine APIs lassen sich in verschiedene Sprachen und Plattformen integrieren, wodurch Fehler bei der manuellen Dateneingabe reduziert und die Effizienz gesteigert werden. Die extrahierten Daten können analysiert und in bestehende Systeme integriert werden, was die Entscheidungsfindung und Produktivität fördert. Funktionen wie Bildvorverarbeitung, Barcode-Erkennung und Dateiparsing erhöhen seine Vielseitigkeit. IronOCR ermöglicht es Entwicklern, Texterkennung in ihre Anwendungen zu integrieren.

2. Voraussetzungen

Bevor Sie mit IronOCR arbeiten können, müssen einige Voraussetzungen erfüllt sein. Zu diesen Voraussetzungen gehören:

Stellen Sie sicher, dass Sie eine geeignete Entwicklungsumgebung auf Ihrem Computer eingerichtet haben. Dies erfordert in der Regel die Installation einer integrierten Entwicklungsumgebung (IDE) wie Visual Studio.
Es ist wichtig, dass Sie ein Grundverständnis der Programmiersprache C# haben. Auf diese Weise können Sie die in diesem Artikel enthaltenen Code-Beispiele besser verstehen und ändern.
Sie müssen die IronOCR-Bibliothek in Ihrem Projekt installiert haben. Dies kann über den NuGet Package Manager in Visual Studio oder über die Befehlszeilenschnittstelle erfolgen.
Wenn Sie sich vergewissern, dass diese Voraussetzungen erfüllt sind, sind Sie bereit, mit IronOCR zu arbeiten.

3. Erstellen eines neuen Visual Studio-Projekts

Um mit IronOCR zu beginnen, müssen Sie zunächst ein neues Visual Studio-Projekt erstellen.

Öffnen Sie Visual Studio und gehen Sie zu Dateien, klicken Sie auf Neu und dann auf Projekt.

Rechnung OCR API (Entwickler-Tutorial): Abbildung 1 - Neues Projekt

Neues Projekt

Wählen Sie in dem neuen Fenster die Option Konsolenanwendung und klicken Sie auf Weiter.

Rechnungserkennungs-API (Entwickler-Tutorial): Abbildung 2 - Konsolenanwendung

Konsolenanwendung

Es erscheint ein neues Fenster. Geben Sie den Namen Ihres neuen Projekts und den Speicherort ein und klicken Sie auf Weiter.

Invoice OCR API (Entwickler-Tutorial): Abbildung 3 - Projektkonfiguration

Projektkonfiguration

Geben Sie schließlich den Zielrahmen an und klicken Sie auf Erstellen.

Rechnungs-OCR-API (Entwickler-Tutorial): Abbildung 4 - Ziel-Framework

Ziel-Framework

Jetzt ist Ihr neues Visual Studio-Projekt erstellt. Installieren wir IronOCR.

4. Installation von IronOCR

Es gibt mehrere Möglichkeiten, die IronOCR-Bibliothek herunterzuladen und zu installieren. Aber hier sind die beiden einfachsten Ansätze.

Verwendung des Visual Studio NuGet-Paketmanagers
Verwendung der Visual Studio-Befehlszeile

4.1. Verwendung des Visual Studio NuGet-Paketmanagers

IronOCR kann mit dem Visual Studio NuGet Package Manager in ein C#-Projekt eingebunden werden.

Navigieren Sie zur grafischen Benutzeroberfläche des NuGet-Paket-Managers, indem Sie Tools > NuGet Package Manager > Manage NuGet Packages for Solution auswählen

Rechnung OCR-API (Entwickler-Tutorial): Abbildung 5 - NuGet-Paket-Manager

NuGet-Paket-Manager

Daraufhin wird ein neues Fenster angezeigt. Suchen Sie nach IronOCR und installieren Sie das Paket in Ihrem Projekt.

Rechnungs-OCR-API (Entwickler-Tutorial): Abbildung 6 - Wählen Sie das IronOCR-Paket in der NuGet-Paket-Manager-Benutzeroberfläche aus

Wählen Sie das IronOCR-Paket im NuGet-Paket-Manager-UI aus

Zusätzliche Sprachpakete für IronOCR können ebenfalls mit der oben beschriebenen Methode installiert werden.

4.2. Verwendung der Visual Studio-Befehlszeile

In Visual Studio, gehen Sie zu Tools > NuGet-Paket-Manager > Paket-Manager-Konsole
Geben Sie auf der Registerkarte Paketmanager-Konsole die folgende Zeile ein:

    :ProductInstall

    :ProductInstall

SHELL

Rechnungs-OCR-API (Entwickler-Tutorial): Abbildung 7 - Paket-Manager-Konsole

Verwaltungskonsole für Pakete

Das Paket wird nun in das aktuelle Projekt heruntergeladen/installiert und steht zur Verwendung bereit.

5. Extrahieren von Daten aus Rechnungen mit IronOCR

Mit IronOCR können Sie mit nur wenigen Zeilen Code Daten aus Rechnungen extrahieren und diese Datenextraktion für weitere Prozesse wie die Dateneingabe verwenden. Dies wird die manuelle Dateneingabe und vieles mehr ersetzen.

Hier ist eine Beispielrechnung, aus der Sie Text extrahieren können.

Rechnungs-OCR-API (Entwickler-Tutorial): Abbildung 8 - Die Beispielrechnung

Die Musterrechnung

Lassen Sie uns nun den Code schreiben, um alle Daten aus dieser Rechnung zu extrahieren.

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
    var result = ocr.Read(input);
    Console.WriteLine(result.Text);
}

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
    var result = ocr.Read(input);
    Console.WriteLine(result.Text);
}

Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using input = New OcrInput("r2.png")
	Dim result = ocr.Read(input)
	Console.WriteLine(result.Text)
End Using

$vbLabelText $csharpLabel

Der obige Code erhält eine Eingabe in Form eines Bildes und extrahiert dann Daten aus diesem Bild mithilfe einer Read-Methode aus der IronTesseract-Klasse.

Rechnungs-OCR-API (Entwickler-Tutorial): Abbildung 9 - Rechnungsparser

Rechnungsparser

5.1. Rechnungsbearbeitung zur Extraktion bestimmter Daten aus Rechnungen

Sie können auch bestimmte Daten aus Rechnungen extrahieren, z. B. die Rechnungsnummern von Kunden. Nachfolgend finden Sie den Code zum Extrahieren der Kundenrechnungsnummer aus der Rechnung.

using IronOcr;
using System;
using System.Text.RegularExpressions;

var orc = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
    var result = orc.Read(input);
    var linePattern = @"INV\/\d{4}\/\d{5}";
    var lineMatch = Regex.Match(result.Text, linePattern);
    if (lineMatch.Success)
    {
        var lineValue = lineMatch.Value;
        Console.WriteLine("Customer Invoice number: " + lineValue);
    }

}

using IronOcr;
using System;
using System.Text.RegularExpressions;

var orc = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
    var result = orc.Read(input);
    var linePattern = @"INV\/\d{4}\/\d{5}";
    var lineMatch = Regex.Match(result.Text, linePattern);
    if (lineMatch.Success)
    {
        var lineValue = lineMatch.Value;
        Console.WriteLine("Customer Invoice number: " + lineValue);
    }

}

Imports IronOcr
Imports System
Imports System.Text.RegularExpressions

Private orc = New IronTesseract()
Using input = New OcrInput("r2.png")
	Dim result = orc.Read(input)
	Dim linePattern = "INV\/\d{4}\/\d{5}"
	Dim lineMatch = Regex.Match(result.Text, linePattern)
	If lineMatch.Success Then
		Dim lineValue = lineMatch.Value
		Console.WriteLine("Customer Invoice number: " & lineValue)
	End If

End Using

$vbLabelText $csharpLabel

Rechnungs-OCR-API (Entwickler-Tutorial): Abbildung 10 - Rechnungsscan

Rechnungs-Scannen

6. Schlussfolgerung

IronOCRs Invoice OCR API revolutioniert die Datenextraktion aus Rechnungen durch maschinelles Lernen und Computer Vision. Diese Technologie wandelt Rechnungstext und -nummern in ein maschinenlesbares Format um und vereinfacht so die Datenextraktion für Analyse, Integration und Prozessverbesserung. Sie bietet eine robuste Lösung für die Automatisierung der Rechnungsbearbeitung, die Verbesserung der Genauigkeit und die Optimierung von Arbeitsabläufen wie der Kreditorenbuchhaltung. Auch die automatisierte Dateneingabe aus gescannten Rechnungen ist mit dieser Technologie möglich.

IronOCR bietet eine hohe Genauigkeit unter Verwendung der besten Ergebnisse von Tesseract, ohne zusätzliche Einstellungen. Es unterstützt mehrseitige TIFF-Rahmen, PDF-Dateien und alle gängigen Bildformate. Es ist auch möglich, Barcode-Werte aus Bildern zu lesen.

Bitte besuchen Sie die Homepage-Website für weitere Informationen zu IronOCR. Weitere Tutorials zur Rechnungs-OCR finden Sie im folgenden detaillierten Rechnungs-OCR-Tutorial. Um mehr darüber zu erfahren, wie Sie Computer Vision verwenden können, um Text wie Rechnungsfelder zu finden, besuchen Sie dieses Computer Vision How-To.

Kannapat Udonpant

Jetzt mit dem Ingenieurteam chatten

Software-Ingenieur

Bevor er Software-Ingenieur wurde, promovierte Kannapat an der Universität Hokkaido in Japan im Bereich Umweltressourcen. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Abteilung für Bioproduktionstechnik ist. Im Jahr 2022 wechselte er mit seinen C#-Kenntnissen zum Engineering-Team von Iron Software, wo er sich auf IronPDF konzentriert. Kannapat schätzt an seiner Arbeit, dass er direkt von dem Entwickler lernt, der den Großteil des in IronPDF verwendeten Codes schreibt. Neben dem kollegialen Lernen genießt Kannapat auch den sozialen Aspekt der Arbeit bei Iron Software. Wenn er nicht gerade Code oder Dokumentationen schreibt, kann man Kannapat normalerweise beim Spielen auf seiner PS5 oder beim Wiedersehen mit The Last of Us antreffen.

< PREVIOUS
Beste OCR für die Rechnungsverarbeitung (Aktualisierte Liste)

NÄCHSTES >
Wie man in Blazor Text aus einem Bild liest