Invoice OCR API nutzt maschinelles Lernen und Computer Vision, um Rechnungsdaten in ein Format umzuwandeln, das für die automatische Verarbeitung geeignet ist. Diese Technologie behebt Probleme der manuellen Dateneingabe wie Verzögerungen, Kosten und Fehler, indem sie Details wie Lieferanteninformationen, Rechnungsnummern und Preise sowohl aus digitalen als auch aus gescannten Rechnungen genau extrahiert.
In diesem Artikel wird eine erstklassige OCR-API für Rechnungen namensIronOCR.
Erstellen Sie ein neues C#-Projekt in Visual Studio oder öffnen Sie ein bestehendes Projekt.
Laden Sie eine vorhandene Bilddatei mit OcrInput methode
Extrahieren des Textes aus dem Bild mit Ocr.Read methode.
Drucken Sie den extrahierten Text in der Konsole mit Console.WriteLine
1. IronOCR
IronOCR, entwickelt von Iron Software, ist eine OCR-Bibliothek mit einer Reihe von Tools für Entwickler. Es nutzt maschinelles Lernen und Computer Vision, um Text aus gescannten Dokumenten, Bildern und PDFs zu extrahieren, was eine automatische Verarbeitung ermöglicht. Seine APIs lassen sich in verschiedene Sprachen und Plattformen integrieren, wodurch Fehler bei der manuellen Dateneingabe reduziert und die Effizienz gesteigert werden. Die extrahierten Daten können analysiert und in bestehende Systeme integriert werden, was die Entscheidungsfindung und Produktivität fördert. Merkmale wiebildvorverarbeitung, barcode-Erkennungund Dateiparsing erhöhen seine Vielseitigkeit. IronOCR ermöglicht es Entwicklern, Texterkennung in ihre Anwendungen zu integrieren.
2. Voraussetzungen
Bevor Sie mit IronOCR arbeiten können, müssen einige Voraussetzungen erfüllt sein. Zu diesen Voraussetzungen gehören:
Stellen Sie sicher, dass Sie eine geeignete Entwicklungsumgebung auf Ihrem Computer eingerichtet haben. Dazu gehört in der Regel eine integrierte Entwicklungsumgebung(IDE) wie z.B. Visual Studio installiert.
Es ist wichtig, dass Sie ein Grundverständnis der Programmiersprache C# haben. Auf diese Weise können Sie die in diesem Artikel enthaltenen Code-Beispiele besser verstehen und ändern.
Sie müssen die IronOCR-Bibliothek in Ihrem Projekt installiert haben. Dies kann über den NuGet Package Manager in Visual Studio oder über die Befehlszeilenschnittstelle erfolgen.
Wenn Sie sich vergewissern, dass diese Voraussetzungen erfüllt sind, sind Sie bereit, mit IronOCR zu arbeiten.
3. Erstellen eines neuen Visual Studio-Projekts
Um mit IronOCR zu beginnen, müssen Sie zunächst ein neues Visual Studio-Projekt erstellen.
Öffnen Sie Visual Studio und gehen Sie zu Dateien, klicken Sie auf Neu und dann auf Projekt.
Neues Projekt
Wählen Sie in dem neuen Fenster die Option Konsolenanwendung und klicken Sie auf Weiter.
Konsolenanwendung
Es erscheint ein neues Fenster. Geben Sie den Namen Ihres neuen Projekts und den Speicherort ein und klicken Sie auf Weiter.
Projektkonfiguration
Geben Sie schließlich den Zielrahmen an und klicken Sie auf Erstellen.
Zielrahmen
Jetzt ist Ihr neues Visual Studio-Projekt erstellt. Installieren wir IronOCR.
4. Installation von IronOCR
Es gibt mehrere Möglichkeiten, die IronOCR-Bibliothek herunterzuladen und zu installieren. Aber hier sind die beiden einfachsten Ansätze.
Verwendung des Visual Studio NuGet-Paketmanagers
Verwendung der Visual Studio-Befehlszeile
4.1. Verwendung des Visual Studio NuGet-Paketmanagers
IronOCR kann mit dem Visual Studio NuGet Package Manager in ein C#-Projekt eingebunden werden.
Navigieren Sie zur grafischen Benutzeroberfläche von NuGet Package Manager, indem Sie Tools > NuGet Package Manager > NuGet-Pakete für Lösung verwalten wählen
NuGet Package Manager
Daraufhin wird ein neues Fenster angezeigt. Suchen Sie nach IronOCR und installieren Sie das Paket in Ihrem Projekt.
Wählen Sie das IronOCR-Paket in der NuGet Package Manager UI
Zusätzliche Sprachpakete für IronOCR können ebenfalls mit der oben beschriebenen Methode installiert werden.
4.2. Verwendung der Visual Studio-Befehlszeile
Gehen Sie in Visual Studio zu Tools > NuGet Package Manager > Package Manager Console
Geben Sie auf der Registerkarte Paketmanager-Konsole die folgende Zeile ein:
:ProductInstall
Package Manager Konsole
Das Paket wird nun in das aktuelle Projekt heruntergeladen/installiert und steht zur Verwendung bereit.
5. Extrahieren von Daten aus Rechnungen mit IronOCR
Mit IronOCR können Sie mit nur wenigen Zeilen Code Daten aus Rechnungen extrahieren und diese Datenextraktion für weitere Prozesse wie die Dateneingabe verwenden. Dies wird die manuelle Dateneingabe und vieles mehr ersetzen.
Hier ist eine Beispielrechnung, aus der Sie Text extrahieren können.
Die Musterrechnung
Lassen Sie uns nun den Code schreiben, um alle Daten aus dieser Rechnung zu extrahieren.
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
Imports System
Private ocr = New IronTesseract()
Using input = New OcrInput("r2.png")
Dim result = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
$vbLabelText $csharpLabel
Der obige Code erhält eine Eingabe in Form eines Bildes und extrahiert dann Daten aus diesem Bild mit Hilfe einerlesen methode aus demeisen-Tesserakt klasse.
Invoice Parser
5.1. Rechnungsbearbeitung zur Extraktion bestimmter Daten aus Rechnungen
Sie können auch bestimmte Daten aus Rechnungen extrahieren, z. B. die Rechnungsnummern von Kunden. Nachfolgend finden Sie den Code zum Extrahieren der Kundenrechnungsnummer aus der Rechnung.
using IronOcr;
using System;
using System.Text.RegularExpressions;
var orc = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = orc.Read(input);
var linePattern = @"INV\/\d{4}\/\d{5}";
var lineMatch = Regex.Match(result.Text, linePattern);
if (lineMatch.Success)
{
var lineValue = lineMatch.Value;
Console.WriteLine("Customer Invoice number: " + lineValue);
}
}
using IronOcr;
using System;
using System.Text.RegularExpressions;
var orc = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = orc.Read(input);
var linePattern = @"INV\/\d{4}\/\d{5}";
var lineMatch = Regex.Match(result.Text, linePattern);
if (lineMatch.Success)
{
var lineValue = lineMatch.Value;
Console.WriteLine("Customer Invoice number: " + lineValue);
}
}
Imports IronOcr
Imports System
Imports System.Text.RegularExpressions
Private orc = New IronTesseract()
Using input = New OcrInput("r2.png")
Dim result = orc.Read(input)
Dim linePattern = "INV\/\d{4}\/\d{5}"
Dim lineMatch = Regex.Match(result.Text, linePattern)
If lineMatch.Success Then
Dim lineValue = lineMatch.Value
Console.WriteLine("Customer Invoice number: " & lineValue)
End If
End Using
$vbLabelText $csharpLabel
Rechnungseingabe
6. Schlussfolgerung
IronOCRs Invoice OCR API revolutioniert die Datenextraktion aus Rechnungen durch maschinelles Lernen und Computer Vision. Diese Technologie wandelt Rechnungstext und -nummern in ein maschinenlesbares Format um und vereinfacht so die Datenextraktion für Analyse, Integration und Prozessverbesserung. Sie bietet eine robuste Lösung für die Automatisierung der Rechnungsbearbeitung, die Verbesserung der Genauigkeit und die Optimierung von Arbeitsabläufen wie der Kreditorenbuchhaltung. Auch die automatisierte Dateneingabe aus gescannten Rechnungen ist mit dieser Technologie möglich.
Bitte besuchen Sie diehomepage Website für weitere Informationen über IronOCR. Weitere Anleitungen zur OCR von Rechnungen finden Sie unter folgender Adressedetails OCR-Anleitung für Rechnungen. Wenn Sie wissen möchten, wie Sie mit Hilfe von Computer Vision Text wie z. B. Rechnungsfelder finden können, besuchen Sie diese Seitecomputer Vision Anleitung.
Jordi beherrscht vor allem Python, C# und C++. Wenn er seine Fähigkeiten bei Iron Software nicht einsetzt, programmiert er Spiele. Durch seine Mitverantwortung für Produkttests, Produktentwicklung und Forschung trägt Jordi wesentlich zur kontinuierlichen Produktverbesserung bei. Die vielseitigen Erfahrungen, die er sammelt, bieten ihm immer wieder neue Herausforderungen, und er sagt, dass dies einer seiner Lieblingsaspekte bei Iron Software ist. Jordi wuchs in Miami, Florida, auf und studierte Informatik und Statistik an der University of Florida.
< PREVIOUS Beste OCR für die Rechnungsverarbeitung (Aktualisierte Liste)
NÄCHSTES > Wie man in Blazor Text aus einem Bild liest