IRONOCR VERWENDEN

Bon-Scan-API (Entwickler-Tutorial)

Aktualisiert 11. Februar 2024
Teilen Sie:

Eine API zum Scannen von Quittungen extrahiert mithilfe fortschrittlicher OCR-Technologie wichtige Daten aus Quittungen. Es rationalisiert den Dateneingabeprozess, indem es manuelle Fehler vermeidet und die Produktivität erhöht. Die API ist vielseitig und präzise und unterstützt mehrere Sprachen, Währungen und Formate. Durch die Automatisierung der Bonanalyse können Unternehmen Einblicke in das Ausgabenverhalten gewinnen und datengestützte Entscheidungen treffen. In diesem Artikel wird gezeigt, wie die C# OCR-Bibliothek verwendet wird,IronOCR, um wichtige Informationen aus einem Beleg zu extrahieren.

IronOCR

IronOCR ist eine vielseitige OCR-Bibliothek und API, die von Iron Software entwickelt wurde und Entwicklern eine leistungsstarke Lösung für die Extraktion von Text aus verschiedenen Quellen wie gescannten Dokumenten, Bildern und PDFs bietet. Mit seinen fortschrittlichen OCR-Algorithmen, Computer Vision und maschinellen Lernmodellen gewährleistet IronOCR hohe Genauigkeit und Zuverlässigkeit, selbst in schwierigen Szenarien. Die Bibliothek unterstützt mehrere Sprachen und Schriftarten, so dass sie sich für globale Anwendungen eignet. Durch die Integration von IronOCR mit maschinellen Lernmodellen in ihre Anwendungen können Entwickler die Dateneingabe, Textanalyse und andere Aufgaben problemlos automatisieren und so die Produktivität und Effizienz steigern.

Mit IronOCR können Entwickler mühelos Text aus einer Vielzahl von Quellen abrufen, darunter Dokumente, Fotos, Screenshots und sogar Live-Kameraübertragungen als JSON-Antworten. Durch den Einsatz hochentwickelter Algorithmen und maschineller Lernmodelle kann IronOCRanalysiert die Bilddatenerkennt einzelne Zeichen und wandelt sie in maschinenlesbaren Text um. Dieser extrahierte Text kann dann für verschiedene Zwecke verwendet werden, z. B. für die Dateneingabe, das Abrufen von Informationen, die Textanalyse und die Automatisierung manueller Aufgaben.

Voraussetzungen

Bevor Sie mit IronOCR arbeiten können, müssen einige Voraussetzungen erfüllt sein. Zu diesen Voraussetzungen gehören:

  1. Stellen Sie sicher, dass Sie eine geeignete Entwicklungsumgebung auf Ihrem Computer eingerichtet haben. Dazu gehört in der Regel eine integrierte Entwicklungsumgebung(IDE) wie z.B. Visual Studio installiert.

  2. Es ist wichtig, dass Sie ein Grundverständnis der Programmiersprache C# haben. Auf diese Weise können Sie die in diesem Artikel enthaltenen Code-Beispiele besser verstehen und ändern.

  3. Sie müssen die IronOCR-Bibliothek in Ihrem Projekt installiert haben. Dies kann über den NuGet Package Manager in Visual Studio oder über die Befehlszeilenschnittstelle erfolgen.

    Wenn Sie sich vergewissern, dass diese Voraussetzungen erfüllt sind, sind Sie bereit, mit IronOCR zu arbeiten.

Erstellen eines neuen Visual Studio-Projekts

Um mit IronOCR zu beginnen, müssen Sie zunächst ein neues Visual Studio-Projekt erstellen.

Öffnen Sie Visual Studio und gehen Sie zu Dateien, klicken Sie auf Neu und dann auf Projekt.

Quittungs-Scanning-API(Entwickler-Tutorial), Abbildung 1: Neues Projektbild

Neues Projektbild

Wählen Sie in dem neuen Fenster die Option Konsolenanwendung und klicken Sie auf Weiter.

Beleglese-API (Tutorial für Entwickler), Abbildung 2: Konsolenanwendung

Konsolenanwendung

Es erscheint ein neues Fenster. Geben Sie den Namen Ihres neuen Projekts und den Speicherort ein und klicken Sie auf Weiter.

Bon-Scan-API (Entwickler-Tutorial), Abbildung 3: Projektkonfiguration

Projektkonfiguration

Geben Sie schließlich das Ziel-Framework an und klicken Sie auf Erstellen.

Belegabfrage-API (Entwickler-Tutorial), Abbildung 4: Target Framework

Zielrahmen

Jetzt ist Ihr neues Visual Studio Projekt erstellt, lassen Sie uns IronOCR installieren.

Installation von IronOCR

Es gibt mehrere Möglichkeiten, die IronOCR-Bibliothek herunterzuladen und zu installieren. Hier sind jedoch die beiden einfachsten Ansätze.

  1. Verwendung des Visual Studio NuGet-Paketmanagers

  2. Verwendung der Visual Studio-Befehlszeile

Verwendung des Visual Studio NuGet-Paketmanagers

IronOCR kann mit dem Visual Studio NuGet Package Manager in ein C#-Projekt eingebunden werden.

Navigieren Sie zur grafischen Benutzeroberfläche von NuGet Package Manager, indem Sie Tools > NuGet Package Manager > NuGet-Pakete für Lösung verwalten wählen

Quittungs-Scanning-API(Tutorial für Entwickler), Abbildung 5: NuGet Package Manager

NuGet Package Manager

Daraufhin wird ein neues Fenster angezeigt. Suchen Sie nach IronOCR und installieren Sie das Paket in Ihrem Projekt.

Belegabfrage-API (Tutorial für Entwickler), Abbildung 6: IronOCR

IronOCR

Zusätzliche Sprachpakete für IronOCR können ebenfalls mit der oben beschriebenen Methode installiert werden.

Verwendung der Visual Studio-Befehlszeile

  1. Gehen Sie in Visual Studio zu Tools > NuGet Package Manager > Package Manager Console

  2. Geben Sie auf der Registerkarte Paketmanager-Konsole die folgende Zeile ein:
    :ProductInstall

Quittungs-Scanning-API(Tutorial für Entwickler), Abbildung 7: Paketmanager-Konsole

**Package Manager Konsole**

Das Paket wird nun in das aktuelle Projekt heruntergeladen/installiert und steht zur Verwendung bereit.

Datenextraktion mithilfe der OCR-API für Quittungen

Das Extrahieren von Daten aus Quittungsbildern mit IronOCR und das Speichern in Form von strukturierten Daten ist für die meisten Entwickler ein Lebensretter. Mit IronOCR können Sie dies mit nur wenigen Zeilen Code erreichen. Damit können Sie Positionen, Preise, Steuerbeträge, Gesamtbeträge und vieles mehr mit verschiedenen Belegarten extrahieren.

using IronOcr;
using System;
using System.Collections.Generic;
using System.Text.RegularExpressions;

var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
    var result = ocr.Read(input);
    var descriptionPattern = @"\[([A-Z0-9_]+)]\s+(.*?)\s+(\d+\.\d+)\s+Units\s+(\d+\.\d+)\s+Tax15%\s+\$(\d+\.\d+)";
    var pricePattern = @"\$\d+(\.\d{2})?";
    var descriptions = new List<string>();
    var unitPrices = new List<decimal>();
    var taxes = new List<decimal>();
    var amounts = new List<decimal>();
    var lines = result.Text.Split('\n');
    var descriptionMatch = Regex.Match(lines, descriptionPattern);
    if (descriptionMatch.Success)
    {
        var DescriptionValue = descriptionMatch.Groups [2].Value.Trim();
        descriptions.Add(DescriptionValue);
    }
    Console.WriteLine("Description: " + descriptions [i]);
    Console.WriteLine("Quantity: 1.00 Units");
    Console.WriteLine("Unit Price: $" + unitPrices [i]);
    taxes.Add(cost [i] * 0.15m); // Calculate Taxes (15%)
    Console.WriteLine("Taxes: $" + taxes [i]);
    amounts.Add(unitPrices [i] + taxes [i]);
    Console.WriteLine("Amount: $" + amounts [i]);
    Console.WriteLine("-----------------------");
}
using IronOcr;
using System;
using System.Collections.Generic;
using System.Text.RegularExpressions;

var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
    var result = ocr.Read(input);
    var descriptionPattern = @"\[([A-Z0-9_]+)]\s+(.*?)\s+(\d+\.\d+)\s+Units\s+(\d+\.\d+)\s+Tax15%\s+\$(\d+\.\d+)";
    var pricePattern = @"\$\d+(\.\d{2})?";
    var descriptions = new List<string>();
    var unitPrices = new List<decimal>();
    var taxes = new List<decimal>();
    var amounts = new List<decimal>();
    var lines = result.Text.Split('\n');
    var descriptionMatch = Regex.Match(lines, descriptionPattern);
    if (descriptionMatch.Success)
    {
        var DescriptionValue = descriptionMatch.Groups [2].Value.Trim();
        descriptions.Add(DescriptionValue);
    }
    Console.WriteLine("Description: " + descriptions [i]);
    Console.WriteLine("Quantity: 1.00 Units");
    Console.WriteLine("Unit Price: $" + unitPrices [i]);
    taxes.Add(cost [i] * 0.15m); // Calculate Taxes (15%)
    Console.WriteLine("Taxes: $" + taxes [i]);
    amounts.Add(unitPrices [i] + taxes [i]);
    Console.WriteLine("Amount: $" + amounts [i]);
    Console.WriteLine("-----------------------");
}
Imports Microsoft.VisualBasic
Imports IronOcr
Imports System
Imports System.Collections.Generic
Imports System.Text.RegularExpressions

Private ocr = New IronTesseract()
Using input = New OcrInput("r2.png")
	Dim result = ocr.Read(input)
	Dim descriptionPattern = "\[([A-Z0-9_]+)]\s+(.*?)\s+(\d+\.\d+)\s+Units\s+(\d+\.\d+)\s+Tax15%\s+\$(\d+\.\d+)"
	Dim pricePattern = "\$\d+(\.\d{2})?"
	Dim descriptions = New List(Of String)()
	Dim unitPrices = New List(Of Decimal)()
	Dim taxes = New List(Of Decimal)()
	Dim amounts = New List(Of Decimal)()
	Dim lines = result.Text.Split(ControlChars.Lf)
	Dim descriptionMatch = Regex.Match(lines, descriptionPattern)
	If descriptionMatch.Success Then
		Dim DescriptionValue = descriptionMatch.Groups (2).Value.Trim()
		descriptions.Add(DescriptionValue)
	End If
	Console.WriteLine("Description: " & descriptions (i))
	Console.WriteLine("Quantity: 1.00 Units")
	Console.WriteLine("Unit Price: $" & unitPrices (i))
	taxes.Add(cost (i) * 0.15D) ' Calculate Taxes (15%)
	Console.WriteLine("Taxes: $" & taxes (i))
	amounts.Add(unitPrices (i) + taxes (i))
	Console.WriteLine("Amount: $" & amounts (i))
	Console.WriteLine("-----------------------")
End Using
VB   C#

Wie Sie unten sehen können, kann IronOCR den erforderlichen Text problemlos aus dem Beleg extrahieren.

Bon-Scan-API (Entwickler-Tutorial), Abbildung 8: Ausgabe

Output

Extrahieren Sie den gesamten Beleg

Wenn Sie den gesamten Beleg extrahieren möchten, können Sie dies mit ein paar Zeilen Code auf dem OCR-Beleg leicht tun.

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var input = new OcrInput(@"r3.png"))
{
    var result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
using IronOcr;
using System;

var ocr = new IronTesseract();
using (var input = new OcrInput(@"r3.png"))
{
    var result = ocr.Read(input);
    Console.WriteLine(result.Text);
}
Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using input = New OcrInput("r3.png")
	Dim result = ocr.Read(input)
	Console.WriteLine(result.Text)
End Using
VB   C#

Beleg-Scan-API (Entwickler-Tutorial), Abbildung 9: Beleg-Scan-API-Ausgabe

Scan-Empfangs-API-Ausgabe

Die API für das Scannen von Quittungsbildern, wie IronOCR, bietet eine leistungsstarke Softwarelösung für die automatische Extraktion von Daten aus Quittungen. Durch den Einsatz fortschrittlicher OCR-Technologie können Unternehmen problemlos wichtige Informationen aus Quittungsbildern oder -scans extrahieren, darunter Namen von Geschäftspartnern, Kaufdaten, Einzelpostenlisten, Preise, Steuern und Gesamtbeträge. Mit Unterstützung fürmehrere Sprachen, währungen, Belegformateundbarcode-Unterstützungkönnen Unternehmen ihre Belegverwaltungsprozesse rationalisieren, Zeit sparen, Einblicke in Ausgabenmuster gewinnen und datengestützte Entscheidungen treffen. IronOCR ist eine vielseitige OCR-Bibliothek und API, die Entwicklern die Werkzeuge an die Hand gibt, die sie benötigen, um Text aus verschiedenen Quellen genau und effizient zu extrahieren, was die Automatisierung von Aufgaben ermöglicht und die Gesamteffizienz verbessert. Durch die Erfüllung der notwendigen Voraussetzungen und die Integration von IronOCR in ihre Anwendungen können Entwickler die Vorteile der Belegdatenverarbeitung nutzen und ihre Arbeitsabläufe verbessern.

Weitere Informationen über IronOCR finden Sie hierlizenzierungsseite. Wenn Sie wissen möchten, wie man mit Hilfe von Computer Vision Text finden kann, besuchen Sie dieseanleitungsseite für Computer Vision. Weitere Tutorials zur OCR von Quittungen finden Sie unterOCR C#-Tutorial.

< PREVIOUS
OCR-Automatisierungsleitfaden für Entwickler
NÄCHSTES >
Beste OCR für die Rechnungsverarbeitung (Aktualisierte Liste)

Sind Sie bereit, loszulegen? Version: 2024.11 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 2,791,504 Lizenzen anzeigen >