Zum Fußzeileninhalt springen
VERWENDUNG VON IRONOCR

Wie man eine OCR-Lösung für Rechnungen erstellt

Optical Character Recognition, oder OCR, ist eine Technik, die es Computern ermöglicht, Text aus Bildern oder gescannten Dokumenten zu identifizieren und zu extrahieren. Das Hauptziel von OCR-Software besteht darin, texthaltige Fotos in maschinenlesbare Textdaten zu konvertieren. Diese Technologie kann zahlreichen Sektoren zugute kommen und die Dateneingabe, die Digitalisierung von Dokumenten und Automatisierungsverfahren, z. B. bei der Kreditorenbuchhaltung, rationalisieren. In diesem Artikel werden wir die Verwendung von OCR-Lösungen für die Verarbeitung von Rechnungen untersuchen und wie sie die manuelle Rechnungsverarbeitung überflüssig machen.

Wie man OCR-Lösungen für Rechnungen verwendet

  1. Installieren Sie die IronOCR C#-Bibliothek.
  2. Erstellen Sie ein neues C#-Projekt in Visual Studio.
  3. Entdecken Sie die funktionsreiche C#-Bibliothek zur Durchführung von OCR auf Quittungen.
  4. Verwenden Sie Tesseract, um Daten aus Quittungen zu extrahieren.
  5. Suche nach bestimmten Daten im extrahierten Textergebnis.
  6. Untersuchen Sie die Barcodewerte auf dem mitgelieferten Belegbild.

Was ist Rechnungsverarbeitung?

Unternehmen können bildbasierte oder gescannte Rechnungen in maschinenlesbaren Text umwandeln, indem sie die OCR-Rechnungsverarbeitung nutzen, die die Extraktion von Text und Daten aus Rechnungen automatisiert. Diese Automatisierung erhöht die Effizienz der Finanzverfahren, verringert die manuelle Dateneingabe und rationalisiert die Rechnungsbearbeitung.

IronOCR

Die optische Zeichenerkennung (OCR) wird für Entwickler, die die Programmiersprache C# verwenden, durch IronOCR, eine .NET-Bibliothek, ermöglicht. IronOCR wurde von Iron Software entwickelt und ist ein nützliches Tool für Anwendungen, die eine automatische Texterkennung benötigen. Es ermöglicht Benutzern die Extraktion von Text aus Bildern, gescannten Dokumenten und PDF-Dateien. Um Text und Daten aus Rechnungen zu extrahieren, müssen Sie die IronOCR-Bibliothek in Ihre .NET-Anwendung zur automatischen Rechnungsverarbeitung integrieren.

IronOCR hilft bei der Vermeidung von Betrug durch KI-Algorithmen, die Fehler, Betrug und doppelte Rechnungen schnell erkennen. Sie reduziert Fehler durch eine hervorragende OCR-Rechnungsdatenextraktion und vermeidet so Fehler, die durch menschliche Dateneingabe entstehen. Erfahren Sie mehr über IronOCR hier.

Die wichtigsten Merkmale von IronOCR sind:

  • Textextraktion: Extrahieren von Textinhalten aus Bildern, gescannten Dokumenten und PDFs. Sie verwendet hochentwickelte OCR-Algorithmen, um Wörter, Zeichen und Layouts in den bereitgestellten Dokumenten zu identifizieren.
  • Lieferanteninformationen: Extrahieren Sie Textinformationen, einschließlich Lieferantendetails, Einzelposten, Rechnungsnummer, Datum und andere relevante Daten aus Rechnungsbildern mit IronOCR.
  • Barcode-Lesen: IronOCR bietet neben OCR auch die Möglichkeit, Barcodes aus Bildern zu lesen, was seine Anpassungsfähigkeit für Anwendungen erhöht, die sowohl Text- als auch Barcode-Daten verarbeiten müssen.
  • Bildvorverarbeitung: Unterstützt Entzerrung, Rauschunterdrückung und Kontrastkorrektur. Diese Techniken verbessern die eingegebenen Bilder und helfen, die OCR-Genauigkeit zu erhöhen.
  • Zonenbasierte OCR-Technologie: Ermöglicht es Entwicklern, bestimmte Bildbereiche zu definieren, auf die sich die Textextraktion konzentrieren soll. Dies ist nützlich, wenn es sich um Dokumente mit strukturierten Layouts handelt.

Es ist wichtig zu beachten, dass der Erfolg der Lösung von der Genauigkeit der OCR-Einstellungen, der Komplexität der Rechnungen und der Qualität der Eingabebilder abhängt. Darüber hinaus können die Verwendung der APIs von IronOCR und das Verständnis der spezifischen Funktionen der Bibliothek wesentliche Schritte im Integrationsprozess sein. Konsultieren Sie immer die offizielle IronOCR-Dokumentation, um die aktuellsten Details und Empfehlungen zu erhalten.

Erstellen eines neuen Projekts in Visual Studio

Starten Sie Visual Studio und navigieren Sie zum Menü "Datei". Wählen Sie "Neues Projekt" und wählen Sie "Konsolenanwendung" Hier werden wir ein Konsolenprogramm für OCR-Arbeiten erstellen.

How to Create An OCR Solution for Invoice: Abbildung 1 - Erstellen eines neuen Projekts mit Visual Studio

Geben Sie den Projektnamen ein und geben Sie den Speicherort der Datei im Textfeld an. Klicken Sie auf die Schaltfläche Erstellen und wählen Sie das gewünschte .NET Framework aus.

How to Create An OCR Solution for Invoice: Abbildung 2 - Konfigurieren der Projektinformationen

Sobald die Anwendung ausgewählt ist, wird die Struktur des Visual Studio-Projekts erstellt. Wenn Sie die Konsolen-, Windows- oder Web-Version ausgewählt haben, wird die Datei Program.cs geöffnet, so dass Sie Code hinzufügen und die Anwendung erstellen/ausführen können.

Wir können die Bibliothek hinzufügen, um den Code anschließend zu testen.

IronOCR installieren

Mit dem NuGet-Paketmanager von Visual Studio können Sie Pakete direkt in Ihre Lösung installieren. Der NuGet Package Manager ist in der folgenden Abbildung zu sehen.

How to Create An OCR Solution for Invoice: Abbildung 3 - Wie man über Visual Studio zum NuGet-Paketmanager gelangt

Sie bietet ein Suchfeld, um Pakete von der NuGet-Website aufzulisten. Wie unten dargestellt, suchen Sie im Paketmanager nach "IronOCR":

How to Create An OCR Solution for Invoice: Abbildung 4 - Installation von IronOCR über den NuGet-Paketmanager

Die obige Grafik sollte relevante Suchbegriffe auflisten. Wir müssen die notwendige Auswahl treffen, um das Lösungspaket zu installieren.

IronOCR zum Extrahieren von Daten aus Rechnungen

IronOCR ist eine leistungsstarke OCR-Bibliothek, die zum Extrahieren und Lesen von Rechnungsdaten verwendet werden kann. Mit IronOCR können Sie ein Belegbild in einen leicht zu verarbeitenden und zu analysierenden, maschinenlesbaren Text umwandeln, ohne den Datenschutz zu gefährden. Mit Invoice OCR können wir Rechnungsdaten in ein digitales Format extrahieren.

Im Folgenden sehen Sie ein Beispiel dafür, wie IronOCR Lieferantenrechnungen verarbeitet und Text aus Papierrechnungen extrahiert.

using System;
using IronOcr;

class InvoiceProcessor
{
    static void Main()
    {
        // Create a new instance of IronTesseract
        var Ocr = new IronTesseract();

        // Set language and Tesseract version
        Ocr.Language = OcrLanguage.EnglishBest;
        Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

        // Using OcrInput to add images and read text
        using (var Input = new OcrInput())
        {
            // Add the invoice image
            Input.AddImage(@"invoice.png");

            // Read the text from the image
            var Result = Ocr.Read(Input);

            // Output the extracted text
            Console.WriteLine(Result.Text);
            Console.ReadKey();
        }
    }
}
using System;
using IronOcr;

class InvoiceProcessor
{
    static void Main()
    {
        // Create a new instance of IronTesseract
        var Ocr = new IronTesseract();

        // Set language and Tesseract version
        Ocr.Language = OcrLanguage.EnglishBest;
        Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

        // Using OcrInput to add images and read text
        using (var Input = new OcrInput())
        {
            // Add the invoice image
            Input.AddImage(@"invoice.png");

            // Read the text from the image
            var Result = Ocr.Read(Input);

            // Output the extracted text
            Console.WriteLine(Result.Text);
            Console.ReadKey();
        }
    }
}
Imports System
Imports IronOcr

Friend Class InvoiceProcessor
	Shared Sub Main()
		' Create a new instance of IronTesseract
		Dim Ocr = New IronTesseract()

		' Set language and Tesseract version
		Ocr.Language = OcrLanguage.EnglishBest
		Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5

		' Using OcrInput to add images and read text
		Using Input = New OcrInput()
			' Add the invoice image
			Input.AddImage("invoice.png")

			' Read the text from the image
			Dim Result = Ocr.Read(Input)

			' Output the extracted text
			Console.WriteLine(Result.Text)
			Console.ReadKey()
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Das Folgende ist das Ergebnis des oben erwähnten Codes:

How to Create An OCR Solution for Invoice: Abbildung 5 - Ausgegebener Text aus dem vorherigen Code

Dieses Beispiel zeigt, wie IronOCR Daten extrahiert und in der Konsole anzeigt.

Lesen von BarCodes auf Rechnungen

Neben Text können auch BarCodes auf Quittungen mit IronOCR gescannt werden. Um mit IronOCR Barcodes auf Belegen zu scannen, verwenden Sie die Funktion ReadBarCodes zusammen mit der Klasse BarcodeReader.

So dekodieren Sie mit IronOCR das Bild einer Quittung zum Lesen von Barcodes.

using System;
using IronOcr;

class BarcodeReaderExample
{
    static void Main()
    {
        // Initialize IronTesseract
        var ocrTesseract = new IronTesseract();

        // Enable barcode reading
        ocrTesseract.Configuration.ReadBarCodes = true;

        // Use OcrInput to add image and process barcodes
        using (var ocrInput = new OcrInput("invoice.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);

            // Iterate over and output each detected barcode
            foreach (var barcode in ocrResult.Barcodes)
            {
                Console.WriteLine(barcode.Value);
            }
        }
    }
}
using System;
using IronOcr;

class BarcodeReaderExample
{
    static void Main()
    {
        // Initialize IronTesseract
        var ocrTesseract = new IronTesseract();

        // Enable barcode reading
        ocrTesseract.Configuration.ReadBarCodes = true;

        // Use OcrInput to add image and process barcodes
        using (var ocrInput = new OcrInput("invoice.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);

            // Iterate over and output each detected barcode
            foreach (var barcode in ocrResult.Barcodes)
            {
                Console.WriteLine(barcode.Value);
            }
        }
    }
}
Imports System
Imports IronOcr

Friend Class BarcodeReaderExample
	Shared Sub Main()
		' Initialize IronTesseract
		Dim ocrTesseract = New IronTesseract()

		' Enable barcode reading
		ocrTesseract.Configuration.ReadBarCodes = True

		' Use OcrInput to add image and process barcodes
		Using ocrInput As New OcrInput("invoice.png")
			Dim ocrResult = ocrTesseract.Read(ocrInput)

			' Iterate over and output each detected barcode
			For Each barcode In ocrResult.Barcodes
				Console.WriteLine(barcode.Value)
			Next barcode
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

How to Create An OCR Solution for Invoice: Abbildung 6 - Eingegebener BarCode

IronOCR bietet zwar leistungsstarke OCR-Funktionen, aber es ist wichtig zu bedenken, dass der gesamte Workflow der Rechnungsverarbeitung zusätzliche Komponenten wie Datenvalidierung, Geschäftslogik und Finanzsystemanbindung umfassen kann. Je nach Anwendungsfall müssen Sie IronOCR möglicherweise mit anderen Tools kombinieren, um eine vollständige Lösung für die Rechnungsverarbeitung zu erhalten.

Ergebnis:

How to Create An OCR Solution for Invoice: Abbildung 7 - Das Ergebnis des Lesens des Beispiel-Barcodes unter Verwendung des obigen Codes

Um mehr über die IronOCR Online-Demo zu erfahren, besuchen Sie hier.

Abschluss

Zusammenfassend lässt sich sagen, dass IronOCR eine starke und anpassungsfähige OCR-Bibliothek (Optical Character Recognition) für C#-Entwickler ist. Dieses umfassende Angebot von Iron Software vereinfacht die Textextraktion aus Bildern, gescannten Dokumenten und PDF-Dateien.

Abschließend lässt sich sagen, dass IronOCR eine bemerkenswerte OCR-Lösung ist, die eine hervorragende Integration, Flexibilität und Genauigkeit bietet. IronOCR ist aufgrund seiner fortschrittlichen Algorithmen und der Fähigkeit, eine Vielzahl von Dokumentenformaten zu erkennen, eine der besten OCR-Lösungen auf dem Markt. Sie bietet gut dokumentierte Code-Beispiele, die es Anfängern ermöglichen, schnell und einfach zu lernen.

Die kostengünstige Entwicklungsversion von IronOCR ist zugänglich, und der Kauf des IronOCR-Pakets gewährt eine lebenslange Lizenz. Mit einem IronOCR-Paket, das bei $799 beginnt, bietet es einen außergewöhnlichen Wert als Einzelkosten für mehrere Systeme. Es bietet 24/7 Online-Support für lizenzierte Benutzer. Weitere Einzelheiten zu den Gebühren finden Sie auf der IronOCR Website.

Häufig gestellte Fragen

Wie kann ich die Rechnungsverarbeitung mit OCR-Technologie automatisieren?

Sie können die Rechnungsverarbeitung automatisieren, indem Sie mit IronOCR Text und Daten aus gescannten Rechnungen extrahieren. Diese Automatisierung reduziert die manuelle Dateneingabe und verbessert die Effizienz bei Finanzoperationen.

Welche Schritte sind erforderlich, um IronOCR für die Rechnungsverarbeitung einzurichten?

Um IronOCR für die Rechnungsverarbeitung einzurichten, müssen Sie ein C#-Projekt in Visual Studio erstellen, die IronOCR-Bibliothek mit dem NuGet-Paket-Manager installieren und die Tesseract-Engine zur Datenextraktion nutzen.

Wie verbessert IronOCR die OCR-Genauigkeit durch Bildvorverarbeitung?

IronOCR verbessert die OCR-Genauigkeit durch Bildvorverarbeitungsfunktionen wie Deschewung, Rauschunterdrückung und Kontrastkorrektur, die die Qualität der Eingabebilder verbessern.

Was ist zonenbasierte OCR-Technologie und wie profitiert die Rechnungsverarbeitung davon?

Die zonenbasierte OCR-Technologie in IronOCR ermöglicht es Entwicklern, spezifische Bereiche auf einem Bild für die gezielte Textextraktion zu definieren, was sie effektiv für die Verarbeitung strukturierter Dokumentenlayouts wie Rechnungen macht.

Kann ich mit IronOCR Lieferanteninformationen aus Rechnungen extrahieren?

Ja, IronOCR kann Lieferanteninformationen aus Rechnungen extrahieren, indem es seine fortschrittlichen Textextraktionsfunktionen und OCR-Einstellungen nutzt.

Warum ist die Bildqualität wichtig für die erfolgreiche OCR-Implementierung?

Die Bildqualität beeinflusst die OCR-Genauigkeit erheblich. Durch die Verwendung hochqualitativer Bilder mit IronOCR wird eine bessere Texterkennung erreicht und Fehler bei der Datenextraktion reduziert.

Was sind einige allgemeine Tipps zur Fehlerbehebung bei der Verwendung von IronOCR in der Rechnungsverarbeitung?

Allgemeine Tipps zur Fehlerbehebung umfassen die Überprüfung der OCR-Einstellungen, das Sicherstellen hochqualitativer Eingabebilder und das Konsultieren der Dokumentation von IronOCR für Best Practices in Konfiguration und Nutzung.

Wie kann das Barcode-Lesen die Rechnungsverarbeitung verbessern?

Das Barcode-Lesen mit IronOCR verbessert die Rechnungsverarbeitung, indem die Extraktion sowohl von Text- als auch von Barcode-Daten ermöglicht wird, was eine umfassende Datenverarbeitung von Rechnungen erleichtert.

Welche Programmierumgebung wird für die Verwendung von IronOCR empfohlen?

IronOCR wird für die Verwendung in einer .NET-Umgebung empfohlen, speziell mit C# als Programmiersprache, was eine robuste Plattform für die Implementierung von OCR-Funktionalitäten bietet.

Wie unterstützt IronOCR Entwickler bei der Integration von OCR in Anwendungen?

IronOCR unterstützt Entwickler mit detaillierter Dokumentation und Codebeispielen, was die Integration von OCR-Funktionen in Anwendungen erleichtert und einen reibungslosen Entwicklungsprozess sicherstellt.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen