Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
Quittungenwerden in der heutigen hektischen Welt erwartet. Egal, ob Sie Lebensmittel kaufen oder in einem Restaurant essen, ein Beleg hilft, den verwendeten Betrag zu informieren und kann entsprechend zur Budgetierung verwendet werden. In der Zwischenzeit, wenn Lebensmittelgeschäfte einen Belegscanner verwenden, um Quittungen zu scannen, können sie Einblicke darüber erhalten, wie sich ihr Produkt verkauft und es entsprechend einer Verkaufsprognose planen.
Allerdings sind Quittungen normalerweise schwer zu lesen, und manchmal sind sich Menschen unsicher, was die Gesamtsumme ergibt. Darüber hinaus, wenn jemand sein Budget berücksichtigen möchte, ist die manuelle Eingabe aller Daten von den Quittungen mühsam, angesichts der Menge an Artikeln, die jemand kaufen kann. Der Verlust eines Belegs könnte bedeuten, dass Sie plötzlich unsicher sind, warum das Monatsbudget überschritten wurde.
Bei diesem Problem haben sich Budgetierungs- und Finanz-Apps dahin gehend verändert, dass sie nutzenOCR(Optische Zeichenerkennung)um Kunden dabei zu helfen, alle Belege einfach zu verfolgen, indem sie gescannt und in digitale umgewandelt werden. Dies wiederum minimiert menschliche Fehler beim Eingeben von Quittungen, während es Kunden ermöglicht, die Dateneingabe zu automatisieren, Ausgaben zu verfolgen und Einblicke in das Kaufverhalten zu gewinnen.
Die OCR-Technologie extrahiert Daten aus Belegen und digitalen Bildern, indem sie maschinelle Lernalgorithmen verwendet, um Text- oder Zahlenbereiche zu identifizieren. Allerdings ist es nicht ohne Fehler. Wenn das Bild viel digitales Rauschen aufweist, wie zum Beispiel Unschärfe und Verwischungen, werden die zurückgegebenen Daten oft falsch oder durcheinander. Daher ist die Auswahl einer zuverlässigen Bibliothek, die es Entwicklern ermöglicht, Methoden zum Lesen von Belegen zu debuggen und zu optimieren, entscheidend.
IronOCRist eine solche Bibliothek. Es bietet spezialisierte Methoden zum Lesen von Quittungen und ermöglicht Entwicklern, das Bild anzupassen, bevor Daten extrahiert werden. Es ermöglicht Entwicklern sogar, zu debuggen und zu testen, ob die Daten korrekt sind.
Dieser Artikel wird wahrscheinlich über praktische Beispiele dafür sprechen, wie IronOCR Supermarktkassenbons verarbeitet und filtert, um die Daten Genauigkeit sicherzustellen.
IronOCRist eine C#-Bibliothek, die eine angepasste Version desTesseraktOCR-Engine unter der Haube. Die Bibliothek bietet benutzerfreundliche Methoden und flexible Funktionalität für alle OCR-bezogenen Anforderungen. Zusätzlich zu den Standardtechniken ermöglicht IronOCR Entwicklern, eine angepasste Version von Tesseract vollständig zu nutzen und anzupassen, um alle damit verbundenen Aufgaben zu erledigen. Einige der entscheidenden Aspekte, die bei Supermarktkassenbons helfen:
Plattformübergreifende Kompatibilität: IronOCR ist vollständig kompatibel mit einer breiten Palette von .NET-Plattformen, einschließlich .NET 8, 7, 6 und 5 sowie .NET Framework 4.6.2 und höher. Es unterstützt nahtlos alle Betriebssysteme, einschließlich Windows, macOS, Azure und Linux, sodass die plattformübergreifende Kompatibilität kein Problem darstellt.
Flexibilität und Skalierbarkeit: Die Flexibilität der Bibliothek zeigt sich in ihrer Fähigkeit, verschiedene OCR-Eingabeformate zu verarbeiten, einschließlich beliebter Bildformate wie jpg, png und gif. Es lässt sich auch nahtlos in die nativen "System.Drawings.Objects" aus C# integrieren, was die Integration in bestehende Codebasen zum Kinderspiel macht.
Benutzerfreundlichkeit und umfangreiche Unterstützung: IronOCR ist ausführlich dokumentiert, mit einer leistungsstarken API und Tutorials, die alle Funktionen abdecken. Zusätzlich können sich Entwickler auf 24/5-Support für jedwede Unterstützung verlassen.
Bitte beachten Sie, dass IronOCR einen Lizenzschlüssel für den Betrieb erfordert. Sie können einen Schlüssel als Teil einer kostenlosen Testversion erhalten, indem Sie diese Seite besuchenlink.
//Replace the license key variable with the trial key you obtained
IronOCr.License.LicenseKey = "REPLACE-WITH-YOUR-KEY";
//Replace the license key variable with the trial key you obtained
IronOCr.License.LicenseKey = "REPLACE-WITH-YOUR-KEY";
'Replace the license key variable with the trial key you obtained
IronOCr.License.LicenseKey = "REPLACE-WITH-YOUR-KEY"
Nachdem Sie einen Testschlüssel erhalten haben, setzen Sie diese Variable in Ihrem Projekt.
Angenommen, ein Szenario, in dem ein Entwickler mobile Apps entwickelt, die es Kunden ermöglichen, ihre Belege mit ihren Handys zu scannen, um zusätzliche Punkte basierend auf den Gesamtkäufen zu verdienen.
Der untenstehende Code zeigt, wie IronOCR einen Supermarkt-Kassenbon nimmt und mithilfe der OCR-API alle relevanten Daten extrahiert, wie den Produktnamen, Positionen, Preise und eventuelle Namen.
using IronOcr;
#region
IronOcr.License.LicenseKey = "YOUR-KEY";
#endregion
// Instantiate OCR engine
var ocr = new IronTesseract();
using var inputPhoto = new OcrInput();
inputPhoto.LoadImage("supermarketexample.jpg");
// Perform OCR
OcrResult result = ocr.Read(inputPhoto);
string text = result.Text;
Console.WriteLine(text);
using IronOcr;
#region
IronOcr.License.LicenseKey = "YOUR-KEY";
#endregion
// Instantiate OCR engine
var ocr = new IronTesseract();
using var inputPhoto = new OcrInput();
inputPhoto.LoadImage("supermarketexample.jpg");
// Perform OCR
OcrResult result = ocr.Read(inputPhoto);
string text = result.Text;
Console.WriteLine(text);
Imports IronOcr
#Region ""
IronOcr.License.LicenseKey = "YOUR-KEY"
'#End Region
' Instantiate OCR engine
Dim ocr = New IronTesseract()
Dim inputPhoto = New OcrInput()
inputPhoto.LoadImage("supermarketexample.jpg")
' Perform OCR
Dim result As OcrResult = ocr.Read(inputPhoto)
Dim text As String = result.Text
Console.WriteLine(text)
Zuerst importieren wir das Modul `IronOcr` in das Codebeispiel.
Wir instanziieren dann die OCR-Engine und erstellen eine neue `IronTesseract`-Variable.
Wir erstellen dann ein neues OcrInput
und laden das Bild hinein. In diesem Beispiel übergeben wir den Dateipfad
an die Variable. Obwohl das Quittungsformat in verschiedenen Formen vorliegt, kann die Methode alle gängigen Formate verarbeiten.
Wir lesen dann das Bild mit der Methode Read
.
Beachten Sie, dass die Konsolenausgabe oben das Produkt und die Positionen in einer einzigen Zeile ausgibt. Die Methode arbeitet im Seitensegmentierungsmodus und ignoriert die Linienblöcke, die als Trennzeichen im Beleg fungieren.
Der obige Beleg ist ein verfeinertes Bild und entspricht nicht dem typischen Fall, dass ein Kunde einfach ein Foto von seinem Beleg macht. Bei der Arbeit mit realen Beispielen müssen wir das Vertrauen in die extrahierten Daten überprüfen, um einen Schwellenwert sicherzustellen, bei dem die Daten als ungültig betrachtet werden, um die Konsistenz in Ihrer Anwendung zu gewährleisten.
IronOCR verfügt über eine eingebaute Eigenschaft namens confidence
, die es Entwicklern ermöglicht, die Genauigkeit der extrahierten Daten zu überprüfen.
OcrResult result = ocr.Read(inputPhoto);
string text = result.Text;
Console.WriteLine(text);
Console.WriteLine(result.Confidence);
OcrResult result = ocr.Read(inputPhoto);
string text = result.Text;
Console.WriteLine(text);
Console.WriteLine(result.Confidence);
Dim result As OcrResult = ocr.Read(inputPhoto)
Dim text As String = result.Text
Console.WriteLine(text)
Console.WriteLine(result.Confidence)
Dieser Code ist identisch mit dem oben genannten. Der Hauptunterschied besteht darin, dass es auch das Vertrauensniveau ausgibt.
Die Confidence
-Eigenschaft im OcrResult
ist eine entscheidende Fließkommazahl, die das statistische Vertrauensmaß der OCR-Genauigkeit darstellt. Dieser Wert wird als Durchschnitt aller Zeichen berechnet. Ein niedrigerer Wert weist auf potenzielle Probleme hin, wie z.B. ein unscharfes Passbild oder zusätzliche Informationen. Das höchste Vertrauensniveau wird durch 1 dargestellt, während das niedrigste durch 0 dargestellt wird. Je höher der Wert, desto sicherer können wir davon ausgehen, dass die extrahierten Daten genau und präzise sind.
Wie Sie sehen können, liegt das Vertrauensniveau selbst bei einem Stockfoto nur bei 75. In realen Szenarien könnte das Vertrauen aufgrund digitaler Störungen sogar noch niedriger sein.
Wie oben gezeigt, ermöglicht IronOCR Entwicklern nicht nur das Ablehnen von Daten mit geringem Vertrauen, sondern auch das Entfernen und Filtern von Störungen, bevor diese als Bild eingegeben werden, um eine hohe Genauigkeit bei der Datenauswertung sicherzustellen. Hier sind einige Konfigurationen, die wir vor der Verwendung der doppelten Supermarktkassenbons vornehmen können.
inputPhoto.DeNoise();
inputPhoto.ToGrayScale();
inputPhoto.DeNoise();
inputPhoto.ToGrayScale();
inputPhoto.DeNoise()
inputPhoto.ToGrayScale()
Die erste Methode, "DeNoise," setzt den Alphakanal auf Weiß, was die Genauigkeit des Fotos erhöhen könnte, da digitale Fotos häufig Rauschen aufweisen.
Die zweite Methode, "ToGrayScale", ist zwar nicht direkt eine Möglichkeit zur Verbesserung der Genauigkeit, trägt jedoch zur Effizienz der Stapelverarbeitung von Belegen bei, indem sie jeden Pixel in einen Graustufenwert umwandelt.
Zusammen mit diesen Methoden sollten Entwickler die verfügbaren Einstellungen von IronOCR testen und optimieren, um die gewünschten Kriterien für extrahierte Daten aus Supermarktkassenbons zu filtern.
Zusammen mit Automatisierung ist Receipt OCR eine leistungsstarke Technologie, die Unternehmen dabei helfen kann, wertvolle Einblicke aus Belegdaten zu gewinnen. Es ist auch ein leistungsstarkes Werkzeug für Einzelpersonen, um ihre Ausgaben zu budgetieren und persönliche Interessensbereiche zu identifizieren. Nicht nur das, sondern die OCR-Technologie kann auch dazu dienen, die Prävention von manipulierter oder geänderter Belege zu verbessern, indem die Transaktionsnummern auf dem Beleg überprüft werden.
Daher ist die Auswahl der richtigen OCR-Lösung für Quittungen entscheidend und virtuell für Genauigkeit, Geschwindigkeit und Skalierbarkeit. IronOCR integriert all das und lässt sich leicht in bestehende Plattformen integrieren, was Entwicklern einen Vorteil beim Scannen von Quittungen verschafft.
Sie können die IronOCR vontestlizenzwenn Entwickler interessiert sind.
9 .NET API-Produkte für Ihre Bürodokumente