Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
Eine API zum Scannen von Quittungen extrahiert mithilfe fortschrittlicher OCR-Technologie wichtige Daten aus Quittungen. Es rationalisiert den Dateneingabeprozess, indem es manuelle Fehler vermeidet und die Produktivität erhöht. Die API ist vielseitig und präzise und unterstützt mehrere Sprachen, Währungen und Formate. Durch die Automatisierung der Bonanalyse können Unternehmen Einblicke in das Ausgabenverhalten gewinnen und datengestützte Entscheidungen treffen. In diesem Artikel wird gezeigt, wie die C# OCR-Bibliothek verwendet wird, IronOCR, um wichtige Informationen aus einem Beleg zu extrahieren.
IronOCR ist eine vielseitige OCR-Bibliothek und API, die von Iron Software entwickelt wurde und Entwicklern eine leistungsstarke Lösung für die Extraktion von Text aus verschiedenen Quellen wie gescannten Dokumenten, Bildern und PDFs bietet. Mit seinen fortschrittlichen OCR-Algorithmen, Computer Vision und maschinellen Lernmodellen gewährleistet IronOCR hohe Genauigkeit und Zuverlässigkeit, selbst in schwierigen Szenarien. Die Bibliothek unterstützt mehrere Sprachen und Schriftarten, so dass sie sich für globale Anwendungen eignet. Durch die Integration von IronOCR mit maschinellen Lernmodellen in ihre Anwendungen können Entwickler die Dateneingabe, Textanalyse und andere Aufgaben problemlos automatisieren und so die Produktivität und Effizienz steigern.
Mit IronOCR können Entwickler mühelos Text aus einer Vielzahl von Quellen abrufen, darunter Dokumente, Fotos, Screenshots und sogar Live-Kameraübertragungen als JSON-Antworten. Durch den Einsatz hochentwickelter Algorithmen und maschineller Lernmodelle kann IronOCR analysiert die Bilddatenerkennt einzelne Zeichen und wandelt sie in maschinenlesbaren Text um. Dieser extrahierte Text kann dann für verschiedene Zwecke verwendet werden, z. B. für die Dateneingabe, das Abrufen von Informationen, die Textanalyse und die Automatisierung manueller Aufgaben.
Bevor Sie mit IronOCR arbeiten können, müssen einige Voraussetzungen erfüllt sein. Zu diesen Voraussetzungen gehören:
Stellen Sie sicher, dass Sie eine geeignete Entwicklungsumgebung auf Ihrem Computer eingerichtet haben. Dazu gehört in der Regel eine integrierte Entwicklungsumgebung (IDE) wie z.B. Visual Studio installiert.
Es ist wichtig, dass Sie ein Grundverständnis der Programmiersprache C# haben. Auf diese Weise können Sie die in diesem Artikel enthaltenen Code-Beispiele besser verstehen und ändern.
Sie müssen die IronOCR-Bibliothek in Ihrem Projekt installiert haben. Dies kann über den NuGet Package Manager in Visual Studio oder über die Befehlszeilenschnittstelle erfolgen.
Wenn Sie sich vergewissern, dass diese Voraussetzungen erfüllt sind, sind Sie bereit, mit IronOCR zu arbeiten.
Um mit IronOCR zu beginnen, müssen Sie zunächst ein neues Visual Studio-Projekt erstellen.
Öffnen Sie Visual Studio und gehen Sie zu Dateien, klicken Sie auf Neu und dann auf Projekt.
Neues Projektbild
Wählen Sie in dem neuen Fenster die Option Konsolenanwendung und klicken Sie auf Weiter.
Konsolenanwendung
Es erscheint ein neues Fenster. Geben Sie den Namen Ihres neuen Projekts und den Speicherort ein und klicken Sie auf Weiter.
Projektkonfiguration
Geben Sie schließlich das Ziel-Framework an und klicken Sie auf Erstellen.
Zielrahmen
Jetzt ist Ihr neues Visual Studio Projekt erstellt, lassen Sie uns IronOCR installieren.
Es gibt mehrere Möglichkeiten, die IronOCR-Bibliothek herunterzuladen und zu installieren. Hier sind jedoch die beiden einfachsten Ansätze.
Verwendung des Visual Studio NuGet-Paketmanagers
IronOCR kann mit dem Visual Studio NuGet Package Manager in ein C#-Projekt eingebunden werden.
Navigieren Sie zur grafischen Benutzeroberfläche von NuGet Package Manager, indem Sie Tools > NuGet Package Manager > NuGet-Pakete für Lösung verwalten wählen
NuGet Package Manager
Daraufhin wird ein neues Fenster angezeigt. Suchen Sie nach IronOCR und installieren Sie das Paket in Ihrem Projekt.
IronOCR
Zusätzliche Sprachpakete für IronOCR können ebenfalls mit der oben beschriebenen Methode installiert werden.
Gehen Sie in Visual Studio zu Tools > NuGet Package Manager > Package Manager Console
:ProductInstall
**Package Manager Konsole**
Das Paket wird nun in das aktuelle Projekt heruntergeladen/installiert und steht zur Verwendung bereit.
Das Extrahieren von Daten aus Quittungsbildern mit IronOCR und das Speichern in Form von strukturierten Daten ist für die meisten Entwickler ein Lebensretter. Mit IronOCR können Sie dies mit nur wenigen Zeilen Code erreichen. Damit können Sie Positionen, Preise, Steuerbeträge, Gesamtbeträge und vieles mehr mit verschiedenen Belegarten extrahieren.
using IronOcr;
using System;
using System.Collections.Generic;
using System.Text.RegularExpressions;
var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = ocr.Read(input);
var descriptionPattern = @"\[([A-Z0-9_]+)]\s+(.*?)\s+(\d+\.\d+)\s+Units\s+(\d+\.\d+)\s+Tax15%\s+\$(\d+\.\d+)";
var pricePattern = @"\$\d+(\.\d{2})?";
var descriptions = new List<string>();
var unitPrices = new List<decimal>();
var taxes = new List<decimal>();
var amounts = new List<decimal>();
var lines = result.Text.Split('\n');
var descriptionMatch = Regex.Match(lines, descriptionPattern);
if (descriptionMatch.Success)
{
var DescriptionValue = descriptionMatch.Groups [2].Value.Trim();
descriptions.Add(DescriptionValue);
}
Console.WriteLine("Description: " + descriptions [i]);
Console.WriteLine("Quantity: 1.00 Units");
Console.WriteLine("Unit Price: $" + unitPrices [i]);
taxes.Add(cost [i] * 0.15m); // Calculate Taxes (15%)
Console.WriteLine("Taxes: $" + taxes [i]);
amounts.Add(unitPrices [i] + taxes [i]);
Console.WriteLine("Amount: $" + amounts [i]);
Console.WriteLine("-----------------------");
}
using IronOcr;
using System;
using System.Collections.Generic;
using System.Text.RegularExpressions;
var ocr = new IronTesseract();
using (var input = new OcrInput(@"r2.png"))
{
var result = ocr.Read(input);
var descriptionPattern = @"\[([A-Z0-9_]+)]\s+(.*?)\s+(\d+\.\d+)\s+Units\s+(\d+\.\d+)\s+Tax15%\s+\$(\d+\.\d+)";
var pricePattern = @"\$\d+(\.\d{2})?";
var descriptions = new List<string>();
var unitPrices = new List<decimal>();
var taxes = new List<decimal>();
var amounts = new List<decimal>();
var lines = result.Text.Split('\n');
var descriptionMatch = Regex.Match(lines, descriptionPattern);
if (descriptionMatch.Success)
{
var DescriptionValue = descriptionMatch.Groups [2].Value.Trim();
descriptions.Add(DescriptionValue);
}
Console.WriteLine("Description: " + descriptions [i]);
Console.WriteLine("Quantity: 1.00 Units");
Console.WriteLine("Unit Price: $" + unitPrices [i]);
taxes.Add(cost [i] * 0.15m); // Calculate Taxes (15%)
Console.WriteLine("Taxes: $" + taxes [i]);
amounts.Add(unitPrices [i] + taxes [i]);
Console.WriteLine("Amount: $" + amounts [i]);
Console.WriteLine("-----------------------");
}
Imports Microsoft.VisualBasic
Imports IronOcr
Imports System
Imports System.Collections.Generic
Imports System.Text.RegularExpressions
Private ocr = New IronTesseract()
Using input = New OcrInput("r2.png")
Dim result = ocr.Read(input)
Dim descriptionPattern = "\[([A-Z0-9_]+)]\s+(.*?)\s+(\d+\.\d+)\s+Units\s+(\d+\.\d+)\s+Tax15%\s+\$(\d+\.\d+)"
Dim pricePattern = "\$\d+(\.\d{2})?"
Dim descriptions = New List(Of String)()
Dim unitPrices = New List(Of Decimal)()
Dim taxes = New List(Of Decimal)()
Dim amounts = New List(Of Decimal)()
Dim lines = result.Text.Split(ControlChars.Lf)
Dim descriptionMatch = Regex.Match(lines, descriptionPattern)
If descriptionMatch.Success Then
Dim DescriptionValue = descriptionMatch.Groups (2).Value.Trim()
descriptions.Add(DescriptionValue)
End If
Console.WriteLine("Description: " & descriptions (i))
Console.WriteLine("Quantity: 1.00 Units")
Console.WriteLine("Unit Price: $" & unitPrices (i))
taxes.Add(cost (i) * 0.15D) ' Calculate Taxes (15%)
Console.WriteLine("Taxes: $" & taxes (i))
amounts.Add(unitPrices (i) + taxes (i))
Console.WriteLine("Amount: $" & amounts (i))
Console.WriteLine("-----------------------")
End Using
Wie Sie unten sehen können, kann IronOCR den erforderlichen Text problemlos aus dem Beleg extrahieren.
Output
Wenn Sie den gesamten Beleg extrahieren möchten, können Sie dies mit ein paar Zeilen Code auf dem OCR-Beleg leicht tun.
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput(@"r3.png"))
{
var result = ocr.Read(input);
Console.WriteLine(result.Text);
}
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput(@"r3.png"))
{
var result = ocr.Read(input);
Console.WriteLine(result.Text);
}
Imports IronOcr
Imports System
Private ocr = New IronTesseract()
Using input = New OcrInput("r3.png")
Dim result = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Scan-Empfangs-API-Ausgabe
Die API für das Scannen von Quittungsbildern, wie IronOCR, bietet eine leistungsstarke Softwarelösung für die automatische Extraktion von Daten aus Quittungen. Durch den Einsatz fortschrittlicher OCR-Technologie können Unternehmen problemlos wichtige Informationen aus Quittungsbildern oder -scans extrahieren, darunter Namen von Geschäftspartnern, Kaufdaten, Einzelpostenlisten, Preise, Steuern und Gesamtbeträge. Mit Unterstützung für mehrere Sprachen, währungen, Belegformateund barcode-Unterstützungkönnen Unternehmen ihre Belegverwaltungsprozesse rationalisieren, Zeit sparen, Einblicke in Ausgabenmuster gewinnen und datengestützte Entscheidungen treffen. IronOCR ist eine vielseitige OCR-Bibliothek und API, die Entwicklern die Werkzeuge an die Hand gibt, die sie benötigen, um Text aus verschiedenen Quellen genau und effizient zu extrahieren, was die Automatisierung von Aufgaben ermöglicht und die Gesamteffizienz verbessert. Durch die Erfüllung der notwendigen Voraussetzungen und die Integration von IronOCR in ihre Anwendungen können Entwickler die Vorteile der Belegdatenverarbeitung nutzen und ihre Arbeitsabläufe verbessern.
Weitere Informationen über IronOCR finden Sie hier lizenzierungsseite. Wenn Sie wissen möchten, wie man mit Hilfe von Computer Vision Text finden kann, besuchen Sie diese anleitungsseite für Computer Vision. Weitere Tutorials zur OCR von Quittungen finden Sie unter OCR C#-Tutorial.
9 .NET API-Produkte für Ihre Bürodokumente