Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
Optical Character Recognition, oder OCRist eine Technik, mit der Computer Text aus Bildern oder gescannten Dokumenten identifizieren und extrahieren können. Die Umwandlung von texthaltigen Fotos in maschinenlesbare Textdaten ist das Hauptziel von OCR-Software. Zahlreiche Branchen können von den vielfältigen Einsatzmöglichkeiten dieser Technologie profitieren, die die Dateneingabe, die Digitalisierung von Dokumenten und die Automatisierung von Prozessen wie der Kreditorenbuchhaltung vereinfacht. In diesem Artikel geht es um den Einsatz von OCR-Lösungen für die Rechnungsverarbeitung und wie sie die manuelle Rechnungsverarbeitung überflüssig machen.
Installieren Sie die IronOCR C#-Bibliothek.
Erstellen Sie ein neues C#-Projekt in Visual Studio
Untersuchen Sie eine funktionsreiche C#-Bibliothek für die OCR beim Empfang.
Mit Tesseract Daten aus Quittungen extrahieren
Suchen Sie nach bestimmten Daten in dem extrahierten Textergebnis.
Unternehmen können bildbasierte oder gescannte Rechnungen in maschinenlesbaren Text umwandeln, indem sie die OCR-Rechnungsverarbeitung nutzen, die die Extraktion von Text und Daten aus Rechnungen automatisiert. Die Effizienz der Finanzverfahren wird insgesamt gesteigert, die manuelle Dateneingabe wird verringert und die Bearbeitung von Rechnungen wird dank dieser Automatisierung rationalisiert.
Optische Zeichenerkennung (OCR) wird für Entwickler, die die Programmiersprache C# verwenden, ermöglicht durch IronOCR**eine .NET-Bibliothek. IronOCR, entwickelt von Iron Software, ist ein nützliches Tool für Anwendungen, die eine automatische Texterkennung benötigen, da es die Extraktion von Text aus Fotos, gescannten Dokumenten und PDF-Dateien ermöglicht. Um Text und Daten aus Rechnungen zu extrahieren, müssen Sie die IronOCR-Bibliothek in Ihre .NET-Anwendung integrieren, um Rechnungen mit IronOCR automatisch zu verarbeiten.
IronOCR hilft durch den Einsatz von KI-Algorithmen, Betrug zu vermeiden. So lassen sich Fehler, Betrug und doppelte Rechnungen schnell erkennen. Verringern Sie Fehler mit der überlegenen OCR-Rechnungsdatenextraktion, so dass Sie durch menschliche Dateneingabe verursachte Fehler vermeiden können. Erfahren Sie mehr über den IronOCR-Check *hier.
Die wichtigsten Merkmale von IronOCR sind:
OCR-Software scannt und extrahiert Text aus gescannten oder fotografierten Informationen durch Verarbeitung der erfassten Bilder oder Dokumente. Das Layout, die Wörter und die Zeichen des Dokuments werden von der OCR-Engine interpretiert.
Es ist wichtig zu bedenken, dass die Genauigkeit der OCR-Einstellungen, die Komplexität der Rechnungen und die Qualität der eingegebenen Fotos den Erfolg der Lösung beeinflussen. Darüber hinaus können die Verwendung der APIs von IronOCR und das Verständnis der besonderen Fähigkeiten der Bibliothek notwendige Schritte im Integrationsprozess sein. Die aktuellsten Informationen und Empfehlungen finden Sie immer in der offiziellen IronOCR-Literatur.
Navigieren Sie nach dem Start von Visual Studio zum "Dateimenü". Gehen Sie zu "Neues Projekt" und wählen Sie "Konsolenanwendung". In diesem Beitrag werden wir PDF-Dokumente mithilfe eines Konsolenprogramms erstellen.
Geben Sie in das entsprechende Textfeld den Projektnamen ein und wählen Sie den Speicherort der Datei. Als Nächstes klicken Sie, wie in der Abbildung unten zu sehen, auf die Schaltfläche Erstellen und wählen das erforderliche .NET-Framework aus.
Nachdem Sie die Anwendung ausgewählt haben, wird das Visual Studio-Projekt seine Struktur erstellen. Wenn Sie die Konsolen-, Windows- oder Web-Version gewählt haben, wird die Datei program.cs geöffnet, so dass Sie Code hinzufügen und die Anwendung erstellen/ausführen können.
Um den Code zu testen, können wir die Bibliothek danach hinzufügen.
Die Installation von Paketen direkt in Ihre Lösung ist mit dem NuGet-Paketverwaltungstool von Visual Studio möglich. Der unten stehende Schnappschuss kann verwendet werden, um den NuGet Package Manager anzuzeigen.
Er verfügt über ein Suchfeld, das die Liste der Pakete von der NuGet-Website anzeigt. Wie im Screenshot unten zu sehen ist, müssen wir im Paketmanager nach dem Begriff IronOCR suchen:
Die obige Grafik könnte uns eine Liste einschlägiger Suchbegriffe liefern. Wir müssen die erforderliche Auswahl treffen, um das Lösungspaket zu installieren.
IronOCR ist eine leistungsstarke OCR-Bibliothek, die zum Extrahieren von Daten und zum Lesen von Rechnungsdaten verwendet werden kann. Mit IronOCR können Sie eine Quittung abfotografieren und in einen leicht zu verarbeitenden und zu analysierenden maschinenlesbaren Text umwandeln, ohne den Datenschutz zu gefährden. Die OCR von Rechnungen ermöglicht es uns, Rechnungsdaten in ein digitales Format zu übertragen.
Dies ist ein Beispiel dafür, wie IronOCR bei der Verarbeitung von Lieferantenrechnungen arbeitet und Text aus Papierrechnungen extrahiert.
using System;
using System.Collections.Generic;
using IronOcr;
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
Input.AddImage(@"invoice.png"); // adding the example invoice to read
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
Console.ReadKey();
}
using System;
using System.Collections.Generic;
using IronOcr;
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
Input.AddImage(@"invoice.png"); // adding the example invoice to read
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
Console.ReadKey();
}
Imports System
Imports System.Collections.Generic
Imports IronOcr
Private Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
Input.AddImage("invoice.png") ' adding the example invoice to read
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
Console.ReadKey()
End Using
Das Ergebnis des oben genannten Codes lautet wie folgt:
Das obige Beispiel zeigt, dass IronOCR uns bei der OCR und der Anzeige der extrahierten Daten in der Konsole geholfen hat.
Zusätzlich zum Text können mit IronOCR auch Barcodes auf Quittungen gescannt werden. Um IronOCR zum Scannen von Barcodes auf Belegen zu verwenden, müssen Sie die Funktion ReadBarCodes
zusammen mit der Klasse BarcodeReader
verwenden.
Dies ist eine Illustration der Verwendung von IronOCR zur Dekodierung des Bildes einer Quittung zum Lesen von Barcodes.
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput("invoice.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
}
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput("invoice.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
}
Dim ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Using ocrInput As New OcrInput("invoice.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
For Each barcode In ocrResult.Barcodes
Console.WriteLine(barcode.Value)
Next barcode
End Using
IronOCR bietet zwar leistungsstarke OCR-Funktionen, doch darf man nicht vergessen, dass der gesamte Workflow der Rechnungsverarbeitung auch andere Elemente wie Datenvalidierung, Geschäftslogik und die Anbindung an Finanzsysteme erfordert. Je nach Anwendungsfall müssen Sie IronOCR möglicherweise mit weiteren Tools oder Komponenten kombinieren, um eine vollständige Lösung für die Rechnungsbearbeitung zu erhalten.
Ergebnis:
Weitere Informationen über die IronOCR Online-Demo finden Sie unter *hier.
Als starke und anpassungsfähige Optical Character Recognition (OCR) bibliothek für C#-Entwickler, IronOCR hebt sich abschließend hervor. Die Textextraktion aus Fotos, gescannten Dokumenten und PDF-Dateien wird durch diese umfassende Sammlung von Funktionen der Iron Software .NET-Bibliothek ermöglicht und vereinfacht.
Und schließlich ist IronOCR eine bemerkenswerte OCR-Lösung, die sich durch hervorragende Integration, Flexibilität und Genauigkeit auszeichnet. Aufgrund seiner unvergleichlichen Genauigkeit, seiner fortschrittlichen Algorithmen und seiner Fähigkeit, eine Vielzahl von Dokumentenformaten, einschließlich handgeschriebener Dokumente, zu erkennen, ist IronOCR die beste OCR-Lösung, die derzeit auf dem Markt ist, und bietet bessere Dokumente mit Codebeispielen, die es Anfängern ermöglichen, schnell und einfach zu lernen.
Die kostengünstige Entwicklungsversion von IronOCR ist zugänglich, und der Kauf des IronOCR-Pakets gewährt eine lebenslange Lizenz. Da die IronOCR-Paketangebote bei $749 beginnen, d.h. ein einziger Preis für zahlreiche Systeme, bietet es einen außergewöhnlichen Wert. Es bietet 24/7 Online-Support für lizenzierte IronOCR-Benutzer. Bitte beachten Sie die IronOCR website für weitere Informationen zu den Gebühren.
9 .NET API-Produkte für Ihre Bürodokumente