Zum Fußzeileninhalt springen
VERWENDUNG VON IRONOCR

OCR mit Computer Vision (Beispiel-Tutorial)

Optische Zeichenerkennung (OCR) mit IronOCR

Die optische Zeichenerkennung (OCR) ist eine Technologie, die es Maschinen ermöglicht, Text aus Bildern zu lesen und zu interpretieren, wodurch die Datenverarbeitung und Automatisierung schneller und effizienter wird. Dieser Artikel bietet Richtlinien zur Verwendung von OCR mit der IronOCR-Bibliothek und wie es die Texterkennung verbessern kann, indem es diesen Prozess automatisiert.

Warum ist OCR wichtig?

OCR zusammen mit Computer Vision ist eine fortschrittliche Form der optischen Zeichenerkennung (OCR), die die Leistung von künstlicher Intelligenz und maschinellen Lernalgorithmen nutzt, um Textzeichen aus Bildern genauer und effizienter zu erkennen.

Bildverarbeitungsalgorithmen der Computer Vision ermöglichen es OCR-Systemen, den Kontext und das Layout von Text in einem Bild zu verstehen und Zeichen anhand ihrer Form und Struktur zu erkennen. OCR zusammen mit Computer Vision kann Text aus komplexen Bildern mit mehreren Schriftarten, Stilen und Größen extrahieren, was es zu einem wertvollen Werkzeug bei der Dokumentendigitalisierung, Datenerfassung und Automatisierung macht.

IronOCR: C# OCR-Bibliothek

IronOCR ist eine beliebte OCR-Bibliothek, die Computer Vision-Techniken zur Textextraktion aus Bildern und Dokumenten nutzt. Es ist einfach zu verwenden und integriert sich in mehrere Programmiersprachen, einschließlich C# und VB.NET. IronOCR ist sowohl in On-Premise- als auch in Cloud-Versionen verfügbar und bietet eine Reihe von Funktionen zur Verarbeitung und Textextraktion aus Bildern.

Installation von IronOCR

Um IronOCR zu installieren, verwenden Sie den folgenden Befehl in der NuGet Package Manager-Konsole:

Install-Package IronOcr

OCR-System mit IronOCR

Das folgende Bild wird verwendet, um das OCR-System mit Computer Vision mithilfe von IronOCR zu testen.

OCR mit Computer Vision (Beispieltutorial), Abbildung 1: Bildbeispiel zur OCR-Erkennung Bildbeispiel zur OCR-Erkennung

Methode FindTextRegion

Die Methode FindTextRegion wird verwendet, um einen einzelnen Textbereich innerhalb eines Bildes zu identifizieren. Die Methode nimmt mehrere optionale Parameter auf, darunter Scale, DilationAmount, Binarize und Invert:

  • Scale passt die Größe des Bildes für eine bessere Texterkennung an.
  • DilationAmount erhöht die Dicke des Textes, um die Sichtbarkeit zu verbessern.
  • Binarize wandelt das Bild in Schwarz-Weiß um und verbessert den Kontrast.
  • Invert invertiert die Farben des Bildes, was für bestimmte Arten von Bildern nützlich sein kann.
using IronOcr;
using System;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var inputOCR = new OcrInput("test.jpg")) 
{
    // Identify a text region within the image
    inputOCR.FindTextRegion();

    // Perform OCR on the identified text region
    OcrResult result = ocr.Read(inputOCR);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;
using System;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var inputOCR = new OcrInput("test.jpg")) 
{
    // Identify a text region within the image
    inputOCR.FindTextRegion();

    // Perform OCR on the identified text region
    OcrResult result = ocr.Read(inputOCR);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr
Imports System

' Initialize the IronTesseract OCR engine
Private ocr = New IronTesseract()

' Create an OcrInput object for the image
Using inputOCR = New OcrInput("test.jpg")
	' Identify a text region within the image
	inputOCR.FindTextRegion()

	' Perform OCR on the identified text region
	Dim result As OcrResult = ocr.Read(inputOCR)

	' Extract and print the recognized text
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
$vbLabelText   $csharpLabel

Hinweis: Nach dem Ausführen des Codes sehen Sie, dass er Text aus dem Textbereich mit einem maschinellen Lernprozess extrahiert. Das Ausgaberesultat erscheint in der Konsole mit hoher Texterkennungsgenauigkeit.

OCR mit Computer Vision (Beispieltutorial), Abbildung 2: Die Konsolenergebnisse des Textextraktionsprozesses Die Konsolenergebnisse des Textextraktionsprozesses

Methode FindMultipleTextRegions

Die Methode FindMultipleTextRegions ähnelt FindTextRegion, wird jedoch verwendet, wenn es in einem Bild mehrere Textbereiche gibt. Sie gibt eine Liste von CropRectangle-Objekten zurück, die den Ort jedes Textbereichs definieren. Diese Methode ist nützlich, wenn Sie Text aus einem Bild extrahieren möchten, das mehrere Textabschnitte enthält.

using IronOcr;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var input = new OcrInput("test.jpg"))
{
    // Identify multiple text regions within the image
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);

    // Perform OCR on the pre-processed image
    OcrResult result = ocr.Read(input);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var input = new OcrInput("test.jpg"))
{
    // Identify multiple text regions within the image
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);

    // Perform OCR on the pre-processed image
    OcrResult result = ocr.Read(input);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr

' Initialize the IronTesseract OCR engine
Private ocr = New IronTesseract()

' Create an OcrInput object for the image
Using input = New OcrInput("test.jpg")
	' Identify multiple text regions within the image
	input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)

	' Perform OCR on the pre-processed image
	Dim result As OcrResult = ocr.Read(input)

	' Extract and print the recognized text
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
$vbLabelText   $csharpLabel

Erklärung: Der oben bereitgestellte Codeausschnitt ist ein Beispiel dafür, wie die IronOCR-Bibliothek verwendet wird, um OCR an einer Bilddatei durchzuführen. Zunächst wird die IronOCR-Bibliothek importiert und eine neue Instanz der IronTesseract-Klasse erstellt. Dann wird ein OcrInput-Objekt mit dem Pfad zur Eingabebilddatei initialisiert und einige Vorverarbeitungstechniken für die Bildkorrektur unter Verwendung der Methode FindMultipleTextRegions angewendet.

Das Ergebnis von IronOCR

Das Ergebnis von IronOCR ist sehr genau, selbst im Umgang mit komplexen Bildern mit mehreren Schriftarten, Größen und Stilen von Text.

Die Genauigkeit der OCR ist entscheidend beim Extrahieren von Daten aus Bildern, da der extrahierte Text oft für weitere Verarbeitungsschritte wie Datenanalyse, manuelle Dateneingabe, maschinelles Lernen oder natürliche Sprachverarbeitung verwendet wird. Wenn der extrahierte Text Fehler enthält, kann dies nachgelagerte Probleme verursachen. Darüber hinaus ermöglicht Ihnen IronOCR, die Ergebnismengen zu untersuchen, um Vertrauensstufen zu überprüfen.

Anwendungsfälle von OCR-Computer Vision

Die optische Zeichenerkennung (OCR)-Technologie hat die Verarbeitung gedruckter Texte revolutioniert. OCR-Tools sind ein unverzichtbarer Bestandteil der Dokumentenverarbeitung und Datenerfassung geworden. Hier sind einige Anwendungsfälle von Software zur optischen Zeichenerkennung:

OCR-Kennzeichenerkennung

Die Kennzeichenerkennung spielt eine bedeutende Rolle bei der Automatisierung des Verkehrsmanagements, der Parksysteme und der Strafverfolgungsaktivitäten. Durch die Implementierung von OCR-Computer Vision in C# können Entwickler Anwendungen erstellen, die Kennzeichen aus Bildern oder Live-Video-Feeds schnell und genau identifizieren. Diese Technologie kann verwendet werden, um:

  • Verkehrsverstöße zu überwachen und Fahrzeuge zu identifizieren, die an kriminellen Aktivitäten beteiligt sind.
  • Die Parksysteme zu automatisieren, was den Ein- und Ausfahrtmanagement erleichtert und den Abrechnungsprozess rationalisiert.
  • Sicherheitsmaßnahmen zu verbessern, indem Fahrzeugbewegungen in eingeschränkten Bereichen verfolgt und überwacht werden.

Textextraktion aus Rechnungen

OCR-Computer Vision in C# kann genutzt werden, um OCR-Anwendungen zu entwickeln, die die Textextraktion aus Rechnungen und anderen Finanzdokumenten automatisieren. Dieser Prozess kann manuelle Dateneingabefehler erheblich reduzieren und Buchhaltungsaufgaben vereinfachen. Hauptvorteile sind:

  • Höhere Produktivität durch die Automatisierung des Dateneingabeprozesses.
  • Verbesserte Genauigkeit, da OCR die Wahrscheinlichkeit menschlicher Fehler verringert.
  • Nahtlose Integration mit Buchhaltungssoftware und -systemen für effizientes Datenmanagement.

OCR-Untertitelgenerierung

Untertitel für Videos zu erstellen, kann zeitaufwendig und arbeitsintensiv sein. OCR-Computer Vision in C# kann diesen Prozess vereinfachen, indem es automatisch den auf dem Bildschirm angezeigten Text erkennt und transkribiert, wodurch Entwickler Folgendes erreichen können:

  • Erstellen Sie genaue Untertitel für Filme, TV-Shows und Online-Videos.
  • Verbessern Sie die Zugänglichkeit für Menschen mit Hörbeeinträchtigungen oder für Personen, die verschiedene Sprachen sprechen.
  • Steigern Sie SEO-Bemühungen, indem Sie durchsuchbare, indexierbare Inhalte für die Videoplattform bereitstellen

OCR-PDF-Verarbeitung

PDFs werden häufig zum Teilen und Speichern von Dokumenten verwendet, aber die Textextraktion daraus kann herausfordernd sein. OCR-Computer Vision in C# kann Entwicklern helfen, OCR-Anwendungen zu erstellen, die PDF-Dateien mühelos verarbeiten und deren Inhalt extrahieren, was Folgendes erleichtert:

Digitalisierung gedruckten Textes

OCR-Software wird häufig eingesetzt, um gedruckten Text aus Dokumentbildern zu digitalisieren. OCR tools can extract text from scanned digital documents, PDFs, and images in various formats. Dies ist besonders nützlich im Dokumentenmanagement, wo Sie textbasierte Dokumente einfach durchsuchen, speichern und teilen können.

Datenerfassung

OCR-Technologie wird weit verbreitet zur Erfassung von Daten aus Eingabedaten wie Rechnungen, Belegen und Formularen verwendet. OCR-Modelle können wichtige Datenfelder wie Namen, Adressen, Daten und Beträge erkennen und extrahieren. Dies eliminiert die Notwendigkeit der manuellen Dateneingabe und reduziert Fehler bei der Datenverarbeitung.

Bilderdurchsuchung

Auch bei der Bildersuche wird OCR-Technologie eingesetzt, bei der Sie Bilder basierend auf dem Text darin durchsuchen können. Dies ist besonders nützlich für große Bilddatenbanken, wo die manuelle Suche zeitaufwendig wäre.

Übersetzung

OCR-Software kann verwendet werden, um Text aus Dokumenten in einer Sprache zu extrahieren und in eine andere Sprache zu übersetzen. Dies ist besonders nützlich für internationale Unternehmen, bei denen Dokumente schnell und genau übersetzt werden müssen.

Zusammenfassung

Die optische Zeichenerkennung (OCR) ist eine Technologie, die es Computern ermöglicht, Text aus Bildern zu lesen. OCR zusammen mit Computer Vision ist wichtig, da es Maschinen ermöglicht, die visuelle Welt zu verstehen und zu interpretieren, was für Anwendungen wie selbstfahrende Autos, Robotik und automatisierte Dokumentenverarbeitung wesentlich ist.

IronOCR ist eine leistungsstarke OCR-Engine, die verwendet werden kann, um OCR mit Computer Vision anzuwenden, um Text genau zu erkennen und Textextraktionen aus Bildern durchzuführen. Es bietet eine Reihe von Methoden zur Suche und Extraktion von Textbereichen, darunter FindTextRegion, FindMultipleTextRegions und GetTextRegions. Jede Methode hat ihren eigenen Satz von Parametern, die verwendet werden können, um den OCR-Prozess fein abzustimmen und eine hohe OCR-Genauigkeit zu gewährleisten.

By using IronOCR, you can extract the scanned text from input images quickly and accurately using concurrency and customized configuration, which can save you time and effort when dealing with large volumes of input image data. Ob Sie mit gescannten Dokumenten, Fotografien oder Screenshots arbeiten, IronOCR kann Ihnen helfen, den enthaltenen Text freizuschalten.

IronOCR bietet eine kostenlose Testversion für Benutzer, die die Software vor dem Kauf testen möchten. Die Lizenz für IronOCR beginnt bei $799 und beinhaltet Support und Updates für ein Jahr. Mit seinen robusten Funktionen und vernünftigen Preisen ist IronOCR eine großartige Option für jeden, der nach einer zuverlässigen OCR-Lösung mit hoher OCR-Genauigkeit sucht.

Häufig gestellte Fragen

Wie kann ich ein Bild mit C# in Text umwandeln?

Sie können die OCR-Funktionen von IronOCR verwenden, um Bilder mit C# in Text zu konvertieren. Durch die Nutzung von Methoden wie Read und ReadAsync können Sie Bilder effizient verarbeiten, um Text zu extrahieren.

Welche Vorteile bietet die Verwendung von OCR mit Computer Vision?

Die Verwendung von OCR mit Computer Vision ermöglicht eine genauere Texterkennung aus komplexen Bildlayouts, Schriftarten und -stilen. IronOCR nutzt KI und maschinelles Lernen, um die Textextraktion zu verbessern und die Datenverarbeitung zu automatisieren.

Wie verbessern Sie die OCR-Genauigkeit in C#?

IronOCR bietet verschiedene Methoden zur Verbesserung der OCR-Genauigkeit, einschließlich der Anpassung von Konfigurationseinstellungen, der Verwendung von Parallelität und der Überprüfung von Ergebnissen auf Vertrauensniveaus. Dies hilft, den OCR-Prozess für bessere Ergebnisse zu optimieren.

Wie ist der Prozess, um Text aus mehreren Bereichen in einem Bild zu extrahieren?

Um Text aus mehreren Bereichen in einem Bild mit IronOCR zu extrahieren, können Sie die FindMultipleTextRegions-Methode verwenden. Diese Methode gibt eine Liste von CropRectangle-Objekten zurück, die den Standort jedes Textbereichs anzeigen.

Kann die OCR-Technologie zur Erkennung von Nummernschildern verwendet werden?

Ja, OCR-Technologie, wie sie von IronOCR bereitgestellt wird, kann für die Erkennung von Nummernschildern angewendet werden. Durch die Verarbeitung von Bildern von Nummernschildern kann IronOCR den Text für verschiedene Anwendungen extrahieren.

Wie installieren Sie IronOCR in einem C#-Projekt?

Sie können IronOCR in Ihr C#-Projekt installieren, indem Sie die NuGet Package Manager-Konsole verwenden. Führen Sie den Befehl Install-Package IronOcr aus, um die Bibliothek zu Ihrem Projekt hinzuzufügen.

Gibt es eine Testversion zur Erprobung einer C#-OCR-Bibliothek?

Ja, IronOCR bietet eine kostenlose Testversion an, die es Benutzern ermöglicht, die Fähigkeiten der Bibliothek zu testen, bevor sie sich zum Kauf einer Lizenz verpflichten.

Welche Lizenzoptionen sind für eine OCR-Bibliothek in C# verfügbar?

IronOCR bietet verschiedene Lizenzoptionen ab $liteLicense, die Unterstützung und Aktualisierungen für ein Jahr umfassen, um unterschiedlichen Projektanforderungen und Budgets gerecht zu werden.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen