IRONOCR VERWENDEN

OCR-API für Rechnungen (Tutorial für Entwickler)

Veröffentlicht 22. Juli 2023
Teilen Sie:

Invoice OCR API nutzt maschinelles Lernen und Computer Vision, um Rechnungsdaten in ein Format umzuwandeln, das für die automatische Verarbeitung geeignet ist. Diese Technologie behebt Probleme der manuellen Dateneingabe wie Verzögerungen, Kosten und Fehler, indem sie Details wie Lieferanteninformationen, Rechnungsnummern und Preise sowohl aus digitalen als auch aus gescannten Rechnungen genau extrahiert.

In diesem Artikel wird eine erstklassige OCR-API für Rechnungen namens IronOCR.

1. IronOCR

IronOCR, entwickelt von Iron Software, ist eine OCR-Bibliothek mit einer Reihe von Tools für Entwickler. Es nutzt maschinelles Lernen und Computer Vision, um Text aus gescannten Dokumenten, Bildern und PDFs zu extrahieren, was eine automatische Verarbeitung ermöglicht. Seine APIs lassen sich in verschiedene Sprachen und Plattformen integrieren, wodurch Fehler bei der manuellen Dateneingabe reduziert und die Effizienz gesteigert werden. Die extrahierten Daten können analysiert und in bestehende Systeme integriert werden, was die Entscheidungsfindung und Produktivität fördert. Merkmale wie bildvorverarbeitung, barcode-Erkennungund Dateiparsing erhöhen seine Vielseitigkeit. IronOCR ermöglicht es Entwicklern, Texterkennung in ihre Anwendungen zu integrieren.

2. Voraussetzungen

Bevor Sie mit IronOCR arbeiten können, müssen einige Voraussetzungen erfüllt sein. Zu diesen Voraussetzungen gehören:

  1. Stellen Sie sicher, dass Sie eine geeignete Entwicklungsumgebung auf Ihrem Computer eingerichtet haben. Dazu gehört in der Regel eine integrierte Entwicklungsumgebung (IDE) wie z.B. Visual Studio installiert.

  2. Es ist wichtig, dass Sie ein Grundverständnis der Programmiersprache C# haben. Auf diese Weise können Sie die in diesem Artikel enthaltenen Code-Beispiele besser verstehen und ändern.

  3. Sie müssen die IronOCR-Bibliothek in Ihrem Projekt installiert haben. Dies kann über den NuGet Package Manager in Visual Studio oder über die Befehlszeilenschnittstelle erfolgen.

    Wenn Sie sich vergewissern, dass diese Voraussetzungen erfüllt sind, sind Sie bereit, mit IronOCR zu arbeiten.

3. Erstellen eines neuen Visual Studio-Projekts

Um mit IronOCR zu beginnen, müssen Sie zunächst ein neues Visual Studio-Projekt erstellen.

Öffnen Sie Visual Studio und gehen Sie zu Dateien, klicken Sie auf Neu und dann auf Projekt.

OCR-API für Rechnungen (Tutorial für Entwickler): Abbildung 1 - Neues Projekt

Neues Projekt

Wählen Sie in dem neuen Fenster die Option Konsolenanwendung und klicken Sie auf Weiter.

Rechnung OCR API (Tutorial für Entwickler): Abbildung 2 - Konsolenanwendung

Konsolenanwendung

Es erscheint ein neues Fenster. Geben Sie den Namen Ihres neuen Projekts und den Speicherort ein und klicken Sie auf Weiter.

OCR-API für Rechnungen (Tutorial für Entwickler): Abbildung 3 - Projektkonfiguration

Projektkonfiguration

Geben Sie schließlich den Zielrahmen an und klicken Sie auf Erstellen.

OCR-API für Rechnungen (Tutorial für Entwickler): Abbildung 4 - Zielrahmen

Zielrahmen

Jetzt ist Ihr neues Visual Studio-Projekt erstellt. Installieren wir IronOCR.

4. Installation von IronOCR

Es gibt mehrere Möglichkeiten, die IronOCR-Bibliothek herunterzuladen und zu installieren. Aber hier sind die beiden einfachsten Ansätze.

  1. Verwendung des Visual Studio NuGet-Paketmanagers

  2. Verwendung der Visual Studio-Befehlszeile

4.1. Verwendung des Visual Studio NuGet-Paketmanagers

IronOCR kann mit dem Visual Studio NuGet Package Manager in ein C#-Projekt eingebunden werden.

Navigieren Sie zur grafischen Benutzeroberfläche von NuGet Package Manager, indem Sie Tools > NuGet Package Manager > NuGet-Pakete für Lösung verwalten wählen

OCR-API für Rechnungen (Tutorial für Entwickler): Abbildung 5 - NuGet-Paketmanager

NuGet Package Manager

Daraufhin wird ein neues Fenster angezeigt. Suchen Sie nach IronOCR und installieren Sie das Paket in Ihrem Projekt.

OCR-API für Rechnungen (Tutorial für Entwickler): Abbildung 6 - Auswahl des IronOCR-Pakets in der NuGet Package Manager UI

Wählen Sie das IronOCR-Paket in der NuGet Package Manager UI

Zusätzliche Sprachpakete für IronOCR können ebenfalls mit der oben beschriebenen Methode installiert werden.

4.2. Verwendung der Visual Studio-Befehlszeile

  1. Gehen Sie in Visual Studio zu Tools > NuGet Package Manager > Package Manager Console

  2. Geben Sie auf der Registerkarte Paketmanager-Konsole die folgende Zeile ein:
    :ProductInstall

Rechnung OCR API (Tutorial für Entwickler): Abbildung 7 - Paketmanager-Konsole

Package Manager Konsole

Das Paket wird nun in das aktuelle Projekt heruntergeladen/installiert und steht zur Verwendung bereit.

5. Extrahieren von Daten aus Rechnungen mit IronOCR

Mit IronOCR können Sie mit nur wenigen Zeilen Code Daten aus Rechnungen extrahieren und diese Datenextraktion für weitere Prozesse wie die Dateneingabe verwenden. Dies wird die manuelle Dateneingabe und vieles mehr ersetzen.

Hier ist eine Beispielrechnung, aus der Sie Text extrahieren können.

OCR-API für Rechnungen (Tutorial für Entwickler): Abbildung 8 - Die Beispielrechnung

Die Musterrechnung

Lassen Sie uns nun den Code schreiben, um alle Daten aus dieser Rechnung zu extrahieren.

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
    var result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
using IronOcr;
using System;

var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
    var result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using input = New OcrInput("r2.png")
	Dim result = ocr.Read(input)
	Console.WriteLine(result.Text)
End Using
VB   C#

Der obige Code erhält eine Eingabe in Form eines Bildes und extrahiert dann Daten aus diesem Bild mit Hilfe einer lesen methode aus dem eisen-Tesserakt klasse.

OCR-API für Rechnungen (Tutorial für Entwickler): Abbildung 9 - Invoice Parser

Invoice Parser

5.1. Rechnungsbearbeitung zur Extraktion bestimmter Daten aus Rechnungen

Sie können auch bestimmte Daten aus Rechnungen extrahieren, z. B. die Rechnungsnummern von Kunden. Nachfolgend finden Sie den Code zum Extrahieren der Kundenrechnungsnummer aus der Rechnung.

using IronOcr;
using System;
using System.Text.RegularExpressions;

var orc = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
    var result = orc.Read(input);
    var linePattern = @"INV\/\d{4}\/\d{5}";
    var lineMatch = Regex.Match(result.Text, linePattern);
    if (lineMatch.Success)
    {
        var lineValue = lineMatch.Value;
        Console.WriteLine("Customer Invoice number: " + lineValue);
    }

}
using IronOcr;
using System;
using System.Text.RegularExpressions;

var orc = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
    var result = orc.Read(input);
    var linePattern = @"INV\/\d{4}\/\d{5}";
    var lineMatch = Regex.Match(result.Text, linePattern);
    if (lineMatch.Success)
    {
        var lineValue = lineMatch.Value;
        Console.WriteLine("Customer Invoice number: " + lineValue);
    }

}
Imports IronOcr
Imports System
Imports System.Text.RegularExpressions

Private orc = New IronTesseract()
Using input = New OcrInput("r2.png")
	Dim result = orc.Read(input)
	Dim linePattern = "INV\/\d{4}\/\d{5}"
	Dim lineMatch = Regex.Match(result.Text, linePattern)
	If lineMatch.Success Then
		Dim lineValue = lineMatch.Value
		Console.WriteLine("Customer Invoice number: " & lineValue)
	End If

End Using
VB   C#

OCR-API für Rechnungen (Tutorial für Entwickler): Abbildung 10 - Scannen von Rechnungen

Rechnungseingabe

6. Schlussfolgerung

IronOCRs Invoice OCR API revolutioniert die Datenextraktion aus Rechnungen durch maschinelles Lernen und Computer Vision. Diese Technologie wandelt Rechnungstext und -nummern in ein maschinenlesbares Format um und vereinfacht so die Datenextraktion für Analyse, Integration und Prozessverbesserung. Sie bietet eine robuste Lösung für die Automatisierung der Rechnungsbearbeitung, die Verbesserung der Genauigkeit und die Optimierung von Arbeitsabläufen wie der Kreditorenbuchhaltung. Auch die automatisierte Dateneingabe aus gescannten Rechnungen ist mit dieser Technologie möglich.

IronOCR bietet eine hohe Genauigkeit unter Verwendung der besten Ergebnisse von Tesseract, ohne zusätzliche Einstellungen. Sie unterstützt mehrseitenrahmen TIFF, PDF-Dateienund alle gängigen Bildformate. Es ist auch möglich lesen von Barcode-Werten aus Bildern.

Bitte besuchen Sie die homepage Website für weitere Informationen über IronOCR. Weitere Anleitungen zur OCR von Rechnungen finden Sie unter folgender Adresse details OCR-Anleitung für Rechnungen. Wenn Sie wissen möchten, wie Sie mit Hilfe von Computer Vision Text wie z. B. Rechnungsfelder finden können, besuchen Sie diese Seite computer Vision Anleitung.

< PREVIOUS
Beste OCR für die Rechnungsverarbeitung (Aktualisierte Liste)
NÄCHSTES >
Wie man in Blazor Text aus einem Bild liest

Sind Sie bereit, loszulegen? Version: 2024.10 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 2,561,036 Lizenzen anzeigen >