Zum Fußzeileninhalt springen
VERWENDUNG VON IRONOCR

Wie man eine OCR-Software-Demo in C# erstellt

Optical Character Recognition (OCR) ist eine Technologie, die verschiedene Dokumentenformate, einschließlich gescannter Papierdokumente, PDFs, digitaler Dateien oder mit einer Digitalkamera aufgenommener Bilder von gedrucktem Text, in bearbeitbare und durchsuchbare maschinell kodierte Textdaten umwandelt.

IronOCR ist eine großartige OCR-Engine-Bibliothek, die Entwicklern leistungsstarke OCR-Funktionen bietet. In diesem Artikel wird anhand von Codebeispielen mit der OCR Software Demo gezeigt, wie man OCR mit IronOCR durchführt.

Was ist IronOCR?

IronOCR ist eine leistungsstarke .NET-Bibliothek, die die optische Zeichenerkennung (OCR) in C#- und VB.NET-Anwendungen erleichtert. IronOCR nutzt fortschrittliche Algorithmen und Techniken des maschinellen Lernens, um Text und Inhalte aus gescannten PDF-Dateien, Bildern und PDFs genau zu extrahieren und so die programmatische Verarbeitung, Suche und Analyse solcher Dateien zu erleichtern.

Dank der unkomplizierten API und der umfangreichen Funktionen können Entwickler OCR-Funktionen nahtlos in ihre Anwendungen integrieren, um die Datenextraktion, Dokumentenverarbeitung, Dateneingabe und Content-Management-Aufgaben zu automatisieren. Ganz gleich, ob Sie geschäftlich mit Rechnungen, Berichten, automatisierter Datenextraktion, einem durchsuchbaren PDF oder anderen textreichen Dokumenten arbeiten, IronOCR bietet eine zuverlässige Lösung, um OCR-Anforderungen effizient zu erfüllen.

Einstieg mit IronOCR

Bevor Sie sich mit den Codebeispielen beschäftigen, müssen Sie IronOCR über den NuGet Package Manager installieren. Sie können IronOCR installieren, indem Sie den folgenden Befehl in der Paketmanager-Konsole ausführen:

Install-Package IronOcr

OCR-Durchführung mit IronOCR

Basic Text Recognition

Um eine grundlegende Texterkennung mit IronOCR durchzuführen, können Sie den folgenden Codeschnipsel verwenden:

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using (var ocrInput = new OcrInput("ocr.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);
            string recognizedText = ocrResult.Text;
            Console.WriteLine(recognizedText);
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using (var ocrInput = new OcrInput("ocr.png"))
        {
            var ocrResult = ocrTesseract.Read(ocrInput);
            string recognizedText = ocrResult.Text;
            Console.WriteLine(recognizedText);
        }
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()
		Using ocrInput As New OcrInput("ocr.png")
			Dim ocrResult = ocrTesseract.Read(ocrInput)
			Dim recognizedText As String = ocrResult.Text
			Console.WriteLine(recognizedText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Dieser Code verwendet IronOCR, um eine optische Zeichenerkennung (OCR) für eine Bilddatei namens "ocr.png" durchzuführen. Es initialisiert ein IronTesseract Objekt und liest die Textebene der Bilddatei in ein OcrInput Objekt.

Das OCR-Ergebnis wird dann als recognizedText abgerufen und auf der Konsole ausgegeben.

Ausgabe
- LOGO SHOP
- LOREM IPSUM
- DOLOR SITAMET CONSECTETUR
- ADIPISCING ELIT
- 1 LOREM IPSUM $3.20
- 2 ORNARE MALESUADA $9.50
- 3 PORTA FERMENTUM $5.90
- 4 SODALES ARCU $6.00
- 5 ELEIFEND $9.00
- 6 SEMNISIMASSA $0.50
- 7 DUIS FAMES DIS $7.60
- 8 FACILISIRISUS $810
- TOTAL AMOUNT $49.80
- CASH $50.00

Erweiterte OCR-Optionen

IronOCR bietet verschiedene Optionen, mit denen Sie den OCR-Prozess entsprechend Ihren Bilddateien und Anforderungen anpassen können. Sie können zum Beispiel die OCR-Sprache angeben, die Einstellungen für die Bildvorverarbeitung anpassen oder die Textbereinigung aktivieren. Hier ist ein Beispiel, das einige dieser erweiterten Optionen zeigt:

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\image.png");

        // Set OCR language to English
        ocr.Language = OcrLanguage.English;

        // Enable text cleaning and enhance the resolution
        ocrInput.DeNoise();
        ocrInput.EnhanceResolution(225);

        var result = ocr.Read(ocrInput);
        if (!string.IsNullOrEmpty(result.Text))
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\image.png");

        // Set OCR language to English
        ocr.Language = OcrLanguage.English;

        // Enable text cleaning and enhance the resolution
        ocrInput.DeNoise();
        ocrInput.EnhanceResolution(225);

        var result = ocr.Read(ocrInput);
        if (!string.IsNullOrEmpty(result.Text))
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocr = New IronTesseract()
		Dim ocrInput As New OcrInput()
		ocrInput.LoadImage("images\image.png")

		' Set OCR language to English
		ocr.Language = OcrLanguage.English

		' Enable text cleaning and enhance the resolution
		ocrInput.DeNoise()
		ocrInput.EnhanceResolution(225)

		Dim result = ocr.Read(ocrInput)
		If Not String.IsNullOrEmpty(result.Text) Then
			Console.WriteLine($"Recognized Text: {result.Text}")
		End If
	End Sub
End Class
$vbLabelText   $csharpLabel

Der Code verwendet IronOCR, um OCR an einer Bilddatei "image.png" durchzuführen, die sich im Ordner "images" befindet. Sie setzt die OCR-Sprache auf Englisch, bereinigt das Bildrauschen und verbessert die Auflösung. Der erkannte Text wird aus dem Bild extrahiert und dann auf der Konsole ausgedruckt.

How to Create OCR Software Demo in C#: Abbildung 1

BarCode lesen

IronOCR unterstützt auch das Lesen von Barcodes und ermöglicht es Ihnen, Software zu erstellen, die Barcode-Informationen aus Bildern extrahiert. Hier ist ein Codebeispiel, das zeigt, wie ein Barcode mit IronOCR gelesen wird:

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        ocrTesseract.Configuration.ReadBarCodes = true;

        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\imageWithBarcode.png");

        var ocrResult = ocrTesseract.Read(ocrInput);
        foreach (var barcode in ocrResult.Barcodes)
        {
            Console.WriteLine(barcode.Value);
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        ocrTesseract.Configuration.ReadBarCodes = true;

        using var ocrInput = new OcrInput();
        ocrInput.LoadImage(@"images\imageWithBarcode.png");

        var ocrResult = ocrTesseract.Read(ocrInput);
        foreach (var barcode in ocrResult.Barcodes)
        {
            Console.WriteLine(barcode.Value);
        }
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()
		ocrTesseract.Configuration.ReadBarCodes = True

		Dim ocrInput As New OcrInput()
		ocrInput.LoadImage("images\imageWithBarcode.png")

		Dim ocrResult = ocrTesseract.Read(ocrInput)
		For Each barcode In ocrResult.Barcodes
			Console.WriteLine(barcode.Value)
		Next barcode
	End Sub
End Class
$vbLabelText   $csharpLabel

Der Code verwendet IronOCR zum Erkennen und Lesen von Barcodes aus einer Bilddatei "imageWithBarcode.png" im Ordner "images". IronOCR wird so konfiguriert, dass Barcodes gelesen werden können, indem ReadBarCodes auf true gesetzt wird. Die erkannten BarCode-Werte werden dann auf der Konsole ausgegeben.

How to Create OCR Software Demo in C#: Abbildung 2

PDF-Text-Extraktion

IronOCR kann auch Text aus PDFs und gescannten Dokumenten extrahieren. Hier ist ein Codebeispiel, das zeigt, wie man mit IronOCR Text aus einer PDF-Datei extrahiert:

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using var ocrInput = new OcrInput();

        // OCR entire document
        ocrInput.LoadPdf("Email_Report.pdf");

        // Alternatively OCR selected page numbers
        int[] pages = { 1, 2, 3, 4, 5 };
        ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");

        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();
        using var ocrInput = new OcrInput();

        // OCR entire document
        ocrInput.LoadPdf("Email_Report.pdf");

        // Alternatively OCR selected page numbers
        int[] pages = { 1, 2, 3, 4, 5 };
        ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");

        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()
		Dim ocrInput As New OcrInput()

		' OCR entire document
		ocrInput.LoadPdf("Email_Report.pdf")

		' Alternatively OCR selected page numbers
		Dim pages() As Integer = { 1, 2, 3, 4, 5 }
		ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")

		Dim ocrResult = ocrTesseract.Read(ocrInput)
		Console.WriteLine(ocrResult.Text)
	End Sub
End Class
$vbLabelText   $csharpLabel

Der Code verwendet IronOCR für die OCR-Verarbeitung eines PDF-Dokuments namens "Email_Report.pdf". Es kann das gesamte Dokument mit LoadPdf oder bestimmte Seiten aus "example.pdf" mit LoadPdfPages mit einem Passwort OCR. Der erkannte Text aus dem OCR-Vorgang wird auf der Konsole ausgedruckt.

How to Create OCR Software Demo in C#: Abbildung 3

Abschluss

IronOCR ist eine leistungsstarke .NET-Bibliothek, die fortschrittliche OCR-Softwarefunktionen bietet und es Entwicklern leicht macht, OCR-Aufgaben in ihren Anwendungen durchzuführen. In diesem Artikel haben wir untersucht, wie man eine grundlegende und fortgeschrittene OCR-Software-Demo mit IronOcr durchführt, mit Codebeispielen.

Wenn Sie an einem .NET-Projekt arbeiten und OCR-Funktionen integrieren müssen, ist IronOCR definitiv eine Überlegung wert, wenn Sie sich verschiedene OCR-Engines ansehen. Die Benutzerfreundlichkeit, die Geschwindigkeit, die Flexibilität und die umfangreiche Dokumentation machen es zu einer beliebten Wahl unter Entwicklern für OCR-Automatisierungsaufgaben.

Probieren Sie IronOCR doch einfach mal aus und sehen Sie, wie es Ihren eigenen OCR-Projektentwicklungsprozess vereinfachen kann Es könnte die beste OCR-Engine für Ihre Projekte sein.

IronOCR bietet eine kostenlose Testlizenz ab $799 USD an, die es Ihnen ermöglicht, IronOCR in Ihren Projekten weiterhin optimal zu nutzen.

Um mehr über IronOCR zu erfahren, besuchen Sie hier.

Häufig gestellte Fragen

Wie kann ich OCR in C# durchführen?

Sie können OCR in C# mit der IronOCR-Bibliothek durchführen. Installieren Sie es zuerst über den NuGet-Paket-Manager mit dem Befehl Install-Package IronOcr. Verwenden Sie dann das IronTesseract-Objekt, um Text aus Bildern oder PDFs zu lesen und in editierbaren Text umzuwandeln.

Welche Schritte sind erforderlich, um Text aus einem Bild mit C# zu extrahieren?

Um Text aus einem Bild in C# zu extrahieren, verwenden Sie IronOCR, indem Sie eine Instanz des IronTesseract-Objekts erstellen. Laden Sie Ihr Bild, wie z.B. 'ocr.png', und rufen Sie die Read()-Methode auf, um das Bild zu verarbeiten und den Text zu extrahieren.

Kann ich den OCR-Prozess mit IronOCR anpassen?

Ja, IronOCR ermöglicht es Ihnen, den OCR-Prozess anzupassen, indem Sie Optionen wie die OCR-Sprache einstellen, die Bildvorverarbeitung zur Rauschunterdrückung aktivieren und die Auflösung zur Verbesserung der Genauigkeit anpassen.

Ist es möglich, Barcodes mit IronOCR zu lesen?

Ja, IronOCR unterstützt das Lesen von Barcodes. Sie können es so konfigurieren, dass es Barcode-Informationen aus Bildern erkennt und extrahiert, indem Sie die Barcode-Lese-Funktion innerhalb Ihrer OCR-Einrichtung aktivieren.

Wie extrahiere ich Text aus einem PDF mit C#?

Mit IronOCR können Sie Text aus PDF-Dateien in C# extrahieren. Sie können wählen, ob Sie das gesamte Dokument oder spezifische Seiten OCR-en, indem Sie die PDF in IronTesseract laden und die Read()-Methode verwenden, um den Text zu extrahieren.

Was macht IronOCR zu einer empfohlenen Wahl für Entwickler?

IronOCR wird für Entwickler empfohlen, aufgrund seiner umfassenden OCR-Funktionen, Benutzerfreundlichkeit, schnellen Verarbeitung und Flexibilität. Es integriert sich nahtlos in .NET-Projekte und ermöglicht eine effiziente Automatisierung von OCR-Aufgaben.

Gibt es Lizenzierungsoptionen für IronOCR?

IronOCR bietet verschiedene Lizenzierungsoptionen, beginnend mit einer kostenlosen Testversion. Entwickler können aus verschiedenen Lizenzen wählen, um die vollen Fähigkeiten von IronOCR in ihren Anwendungen weiter zu nutzen.

Wo kann ich Codebeispiele zur Verwendung von IronOCR finden?

Sie können Codebeispiele zur Verwendung von IronOCR im Artikel 'OCR-Software-Demo in C# (Entwickler-Tutorial)' finden. Die Beispiele zeigen grundlegende Texterkennung, erweiterte OCR-Optionen und Barcode-Erkennung.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen