VERWENDUNG VON IRONOCR

OCR mit Computer Vision (Beispiel-Tutorial)

Aktualisiert:22. Juni 2025

Optische Zeichenerkennung (OCR) mit IronOCR

Die optische Zeichenerkennung (OCR) ist eine Technologie, die es Maschinen ermöglicht, Text aus Bildern zu lesen und zu interpretieren, wodurch die Datenverarbeitung und Automatisierung schneller und effizienter wird. Dieser Artikel bietet Richtlinien zur Verwendung von OCR mit der IronOCR-Bibliothek und wie es die Texterkennung verbessern kann, indem es diesen Prozess automatisiert.

Warum ist OCR wichtig?

OCR zusammen mit Computer Vision ist eine fortschrittliche Form der optischen Zeichenerkennung (OCR), die die Leistung von künstlicher Intelligenz und maschinellen Lernalgorithmen nutzt, um Textzeichen aus Bildern genauer und effizienter zu erkennen.

Bildverarbeitungsalgorithmen der Computer Vision ermöglichen es OCR-Systemen, den Kontext und das Layout von Text in einem Bild zu verstehen und Zeichen anhand ihrer Form und Struktur zu erkennen. OCR zusammen mit Computer Vision kann Text aus komplexen Bildern mit mehreren Schriftarten, Stilen und Größen extrahieren, was es zu einem wertvollen Werkzeug bei der Dokumentendigitalisierung, Datenerfassung und Automatisierung macht.

IronOCR: C# OCR-Bibliothek

IronOCR ist eine beliebte OCR-Bibliothek, die Computer Vision-Techniken zur Textextraktion aus Bildern und Dokumenten nutzt. Es ist einfach zu verwenden und integriert sich in mehrere Programmiersprachen, einschließlich C# und VB.NET. IronOCR ist sowohl in On-Premise- als auch in Cloud-Versionen verfügbar und bietet eine Reihe von Funktionen zur Verarbeitung und Textextraktion aus Bildern.

Installation von IronOCR

Um IronOCR zu installieren, verwenden Sie den folgenden Befehl in der NuGet Package Manager-Konsole:

Install-Package IronOcr

OCR-System mit IronOCR

Das folgende Bild wird verwendet, um das OCR-System mit Computer Vision mithilfe von IronOCR zu testen.

OCR mit Computer Vision (Beispiel-Tutorial), Abbildung 1: Bildbeispiel für die OCR-Erkennung Bildbeispiel zur OCR-Erkennung

Methode FindTextRegion

Die Methode FindTextRegion wird verwendet, um einen einzelnen Textbereich innerhalb eines Bildes zu identifizieren. Die Methode akzeptiert mehrere optionale Parameter, darunter Scale, DilationAmount, Binarize und Invert:

Scale passt die Größe des Bildes für eine bessere Texterkennung an.
DilationAmount erhöht die Strichstärke des Textes, um die Lesbarkeit zu verbessern.
Binarize wandelt das Bild in Schwarzweiß um und verbessert so den Kontrast.
Invert kehrt die Farben des Bildes um, was für bestimmte Bildtypen nützlich sein kann.

using IronOcr;
using System;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var inputOCR = new OcrInput("test.jpg")) 
{
    // Identify a text region within the image
    inputOCR.FindTextRegion();

    // Perform OCR on the identified text region
    OcrResult result = ocr.Read(inputOCR);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}

using IronOcr;
using System;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var inputOCR = new OcrInput("test.jpg")) 
{
    // Identify a text region within the image
    inputOCR.FindTextRegion();

    // Perform OCR on the identified text region
    OcrResult result = ocr.Read(inputOCR);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}

$vbLabelText $csharpLabel

Hinweis: Nach dem Ausführen des Codes sehen Sie, dass er Text aus dem Textbereich mit einem maschinellen Lernprozess extrahiert. Das Ausgaberesultat erscheint in der Konsole mit hoher Texterkennungsgenauigkeit.

OCR mit Computer Vision (Beispiel-Tutorial), Abbildung 2: Die Konsolenergebnisse des Textextraktionsprozesses Die Konsolenergebnisse des Textextraktionsprozesses

Methode FindMultipleTextRegions

Die Methode FindMultipleTextRegions ist ähnlich wie die Methode FindTextRegion, wird aber verwendet, wenn ein Bild mehrere Textbereiche enthält. Es gibt eine Liste von CropRectangle-Objekten zurück, die die Position jedes Textbereichs definieren. Diese Methode ist nützlich, wenn Sie Text aus einem Bild extrahieren möchten, das mehrere Textabschnitte enthält.

using IronOcr;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var input = new OcrInput("test.jpg"))
{
    // Identify multiple text regions within the image
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);

    // Perform OCR on the pre-processed image
    OcrResult result = ocr.Read(input);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}

using IronOcr;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var input = new OcrInput("test.jpg"))
{
    // Identify multiple text regions within the image
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);

    // Perform OCR on the pre-processed image
    OcrResult result = ocr.Read(input);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}

$vbLabelText $csharpLabel

Erläuterung : Der obige Codeausschnitt ist ein Beispiel für die Verwendung der IronOCR -Bibliothek zur Texterkennung (OCR) einer Bilddatei. Zuerst wird die IronOCR Bibliothek importiert und eine neue Instanz der Klasse IronTesseract erstellt. Anschließend initialisiert es ein OcrInput Objekt mit dem Pfad der Eingabebilddatei und wendet einige Vorverarbeitungstechniken zur Bildkorrektur mit Hilfe der FindMultipleTextRegions Methode an.

Das Ergebnis von IronOCR

Das Ergebnis von IronOCR ist sehr genau, selbst im Umgang mit komplexen Bildern mit mehreren Schriftarten, Größen und Stilen von Text.

Die Genauigkeit der OCR ist entscheidend beim Extrahieren von Daten aus Bildern, da der extrahierte Text oft für weitere Verarbeitungsschritte wie Datenanalyse, manuelle Dateneingabe, maschinelles Lernen oder natürliche Sprachverarbeitung verwendet wird. Wenn der extrahierte Text Fehler enthält, kann dies nachgelagerte Probleme verursachen. Darüber hinaus ermöglicht Ihnen IronOCR, die Ergebnismengen zu untersuchen, um Vertrauensstufen zu überprüfen.

Anwendungsfälle von OCR-Computer Vision

Die optische Zeichenerkennung (OCR)-Technologie hat die Verarbeitung gedruckter Texte revolutioniert. OCR-Tools sind ein unverzichtbarer Bestandteil der Dokumentenverarbeitung und Datenerfassung geworden. Hier sind einige Anwendungsfälle von Software zur optischen Zeichenerkennung:

OCR-Kennzeichenerkennung

Die Kennzeichenerkennung spielt eine bedeutende Rolle bei der Automatisierung des Verkehrsmanagements, der Parksysteme und der Strafverfolgungsaktivitäten. Durch die Implementierung von OCR-Computer Vision in C# können Entwickler Anwendungen erstellen, die Kennzeichen aus Bildern oder Live-Video-Feeds schnell und genau identifizieren. Diese Technologie kann verwendet werden, um:

Verkehrsverstöße zu überwachen und Fahrzeuge zu identifizieren, die an kriminellen Aktivitäten beteiligt sind.
Die Parksysteme zu automatisieren, was den Ein- und Ausfahrtmanagement erleichtert und den Abrechnungsprozess rationalisiert.
Sicherheitsmaßnahmen zu verbessern, indem Fahrzeugbewegungen in eingeschränkten Bereichen verfolgt und überwacht werden.

Textextraktion aus Rechnungen

OCR-Computer Vision in C# kann genutzt werden, um OCR-Anwendungen zu entwickeln, die die Textextraktion aus Rechnungen und anderen Finanzdokumenten automatisieren. Dieser Prozess kann manuelle Dateneingabefehler erheblich reduzieren und Buchhaltungsaufgaben vereinfachen. Zu den Hauptvorteilen gehören:

Höhere Produktivität durch die Automatisierung des Dateneingabeprozesses.
Verbesserte Genauigkeit, da OCR die Wahrscheinlichkeit menschlicher Fehler verringert.
Nahtlose Integration mit Buchhaltungssoftware und -systemen für effizientes Datenmanagement.

OCR-Untertitelgenerierung

Untertitel für Videos zu erstellen, kann zeitaufwendig und arbeitsintensiv sein. OCR-Computer Vision in C# kann diesen Prozess vereinfachen, indem es automatisch den auf dem Bildschirm angezeigten Text erkennt und transkribiert, wodurch Entwickler Folgendes erreichen können:

Erstellen Sie genaue Untertitel für Filme, TV-Shows und Online-Videos.
Verbessern Sie die Zugänglichkeit für Menschen mit Hörbeeinträchtigungen oder für Personen, die verschiedene Sprachen sprechen.
Steigern Sie SEO-Bemühungen, indem Sie durchsuchbare, indexierbare Inhalte für die Videoplattform bereitstellen

OCR-PDF-Verarbeitung

PDFs werden häufig zum Teilen und Speichern von Dokumenten verwendet, aber die Textextraktion daraus kann herausfordernd sein. OCR-Computer Vision in C# kann Entwicklern helfen, OCR-Anwendungen zu erstellen, die PDF-Dateien mühelos verarbeiten und deren Inhalt extrahieren, was Folgendes erleichtert:

Einfacher Konvertierung von PDFs in bearbeitbare Dateiformate wie Word, Excel oder einfachen Text.
Effiziente Datenerfassung zur Analyse, Indizierung oder weiteren Verarbeitung.
Verbesserte Zugänglichkeit durch Konvertierung gescannter PDFs in durchsuchbaren, lesbaren Text.

Digitalisierung gedruckten Textes

OCR-Software wird häufig eingesetzt, um gedruckten Text aus Dokumentbildern zu digitalisieren. OCR-Tools können Text aus gescannten digitalen Dokumenten, PDFs und Bildern in verschiedenen Formaten extrahieren. Dies ist besonders nützlich im Dokumentenmanagement, wo Sie textbasierte Dokumente einfach durchsuchen, speichern und teilen können.

Datenerfassung

OCR-Technologie wird weit verbreitet zur Erfassung von Daten aus Eingabedaten wie Rechnungen, Belegen und Formularen verwendet. OCR-Modelle können wichtige Datenfelder wie Namen, Adressen, Daten und Beträge erkennen und extrahieren. Dies eliminiert die Notwendigkeit der manuellen Dateneingabe und reduziert Fehler bei der Datenverarbeitung.

Bilderdurchsuchung

Auch bei der Bildersuche wird OCR-Technologie eingesetzt, bei der Sie Bilder basierend auf dem Text darin durchsuchen können. Dies ist besonders nützlich für große Bilddatenbanken, wo die manuelle Suche zeitaufwendig wäre.

Übersetzung

OCR-Software kann verwendet werden, um Text aus Dokumenten in einer Sprache zu extrahieren und in eine andere Sprache zu übersetzen. Dies ist besonders nützlich für internationale Unternehmen, bei denen Dokumente schnell und genau übersetzt werden müssen.

Zusammenfassung

Die optische Zeichenerkennung (OCR) ist eine Technologie, die es Computern ermöglicht, Text aus Bildern zu lesen. OCR zusammen mit Computer Vision ist wichtig, da es Maschinen ermöglicht, die visuelle Welt zu verstehen und zu interpretieren, was für Anwendungen wie selbstfahrende Autos, Robotik und automatisierte Dokumentenverarbeitung wesentlich ist.

IronOCR ist eine leistungsstarke OCR-Engine, die verwendet werden kann, um OCR mit Computer Vision anzuwenden, um Text genau zu erkennen und Textextraktionen aus Bildern durchzuführen. Es bietet eine Reihe von Methoden zum Auffinden und Extrahieren von Textregionen, einschließlich FindTextRegion, FindMultipleTextRegions und GetTextRegions. Jede Methode hat ihren eigenen Satz von Parametern, die verwendet werden können, um den OCR-Prozess fein abzustimmen und eine hohe OCR-Genauigkeit zu gewährleisten.

Durch die Verwendung von IronOCR können Sie den gescannten Text aus Eingabebildern schnell und genau mithilfe von Konkurrenz und benutzerdefinierter Konfiguration extrahieren, was Ihnen Zeit und Mühe spart, wenn Sie mit großen Mengen von Eingabebilddaten arbeiten. Ob Sie mit gescannten Dokumenten, Fotografien oder Screenshots arbeiten, IronOCR kann Ihnen helfen, den enthaltenen Text freizuschalten.

IronOCR bietet eine kostenlose Testversion für Benutzer, die die Software vor dem Kauf testen möchten. Die Lizenz für IronOCR beginnt bei $799 und beinhaltet Support und Updates für ein Jahr. Mit seinen robusten Funktionen und vernünftigen Preisen ist IronOCR eine großartige Option für jeden, der nach einer zuverlässigen OCR-Lösung mit hoher OCR-Genauigkeit sucht.

Häufig gestellte Fragen

Wie kann ich ein Bild mit C# in Text umwandeln?

Sie können die OCR-Funktionen von IronOCR verwenden, um Bilder mit C# in Text zu konvertieren. Durch die Nutzung von Methoden wie Read und ReadAsync können Sie Bilder effizient verarbeiten, um Text zu extrahieren.

Welche Vorteile bietet die Verwendung von OCR mit Computer Vision?

Die Verwendung von OCR mit Computer Vision ermöglicht eine genauere Texterkennung aus komplexen Bildlayouts, Schriftarten und -stilen. IronOCR nutzt KI und maschinelles Lernen, um die Textextraktion zu verbessern und die Datenverarbeitung zu automatisieren.

Wie verbessern Sie die OCR-Genauigkeit in C#?

IronOCR bietet verschiedene Methoden zur Verbesserung der OCR-Genauigkeit, einschließlich der Anpassung von Konfigurationseinstellungen, der Verwendung von Parallelität und der Überprüfung von Ergebnissen auf Vertrauensniveaus. Dies hilft, den OCR-Prozess für bessere Ergebnisse zu optimieren.

Wie ist der Prozess, um Text aus mehreren Bereichen in einem Bild zu extrahieren?

Um Text aus mehreren Bereichen in einem Bild mit IronOCR zu extrahieren, können Sie die FindMultipleTextRegions-Methode verwenden. Diese Methode gibt eine Liste von CropRectangle-Objekten zurück, die den Standort jedes Textbereichs anzeigen.

Kann die OCR-Technologie zur Erkennung von Nummernschildern verwendet werden?

Ja, OCR-Technologie, wie sie von IronOCR bereitgestellt wird, kann für die Erkennung von Nummernschildern angewendet werden. Durch die Verarbeitung von Bildern von Nummernschildern kann IronOCR den Text für verschiedene Anwendungen extrahieren.

Wie installieren Sie IronOCR in einem C#-Projekt?

Sie können IronOCR in Ihr C#-Projekt installieren, indem Sie die NuGet Package Manager-Konsole verwenden. Führen Sie den Befehl Install-Package IronOcr aus, um die Bibliothek zu Ihrem Projekt hinzuzufügen.

Gibt es eine Testversion zur Erprobung einer C#-OCR-Bibliothek?

Ja, IronOCR bietet eine kostenlose Testversion an, die es Benutzern ermöglicht, die Fähigkeiten der Bibliothek zu testen, bevor sie sich zum Kauf einer Lizenz verpflichten.

Welche Lizenzoptionen sind für eine OCR-Bibliothek in C# verfügbar?

IronOCR bietet verschiedene Lizenzoptionen ab $liteLicense, die Unterstützung und Aktualisierungen für ein Jahr umfassen, um unterschiedlichen Projektanforderungen und Budgets gerecht zu werden.

Kannapat Udonpant

Jetzt mit dem Ingenieurteam chatten

Software Ingenieur

Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...

Kunden-Highlight:

Entwickler im Rampenlicht:

Webinare:

Starten Sie die kostenlose 30-Tage-Testversion

OCR mit Computer Vision (Beispiel-Tutorial)

Optische Zeichenerkennung (OCR) mit IronOCR

Warum ist OCR wichtig?

IronOCR: C# OCR-Bibliothek

Installation von IronOCR

OCR-System mit IronOCR

Methode FindTextRegion

Methode FindMultipleTextRegions

Das Ergebnis von IronOCR

Anwendungsfälle von OCR-Computer Vision

OCR-Kennzeichenerkennung

Textextraktion aus Rechnungen

OCR-Untertitelgenerierung

OCR-PDF-Verarbeitung

Digitalisierung gedruckten Textes

Datenerfassung

Bilderdurchsuchung

Übersetzung

Zusammenfassung

Häufig gestellte Fragen

Wie kann ich ein Bild mit C# in Text umwandeln?

Welche Vorteile bietet die Verwendung von OCR mit Computer Vision?

Wie verbessern Sie die OCR-Genauigkeit in C#?

Wie ist der Prozess, um Text aus mehreren Bereichen in einem Bild zu extrahieren?

Kann die OCR-Technologie zur Erkennung von Nummernschildern verwendet werden?

Wie installieren Sie IronOCR in einem C#-Projekt?

Gibt es eine Testversion zur Erprobung einer C#-OCR-Bibliothek?

Welche Lizenzoptionen sind für eine OCR-Bibliothek in C# verfügbar?

Iron Support Team

Starten Sie die kostenlose 30-Tage-Testversion

OCR mit Computer Vision (Beispiel-Tutorial)

Optische Zeichenerkennung (OCR) mit IronOCR

Warum ist OCR wichtig?

IronOCR: C# OCR-Bibliothek

Installation von IronOCR

OCR-System mit IronOCR

Methode FindTextRegion

Methode FindMultipleTextRegions

Das Ergebnis von IronOCR

Anwendungsfälle von OCR-Computer Vision

OCR-Kennzeichenerkennung

Textextraktion aus Rechnungen

OCR-Untertitelgenerierung

OCR-PDF-Verarbeitung

Digitalisierung gedruckten Textes

Datenerfassung

Bilderdurchsuchung

Übersetzung

Zusammenfassung

Häufig gestellte Fragen

Wie kann ich ein Bild mit C# in Text umwandeln?

Welche Vorteile bietet die Verwendung von OCR mit Computer Vision?

Wie verbessern Sie die OCR-Genauigkeit in C#?

Wie ist der Prozess, um Text aus mehreren Bereichen in einem Bild zu extrahieren?

Kann die OCR-Technologie zur Erkennung von Nummernschildern verwendet werden?

Wie installieren Sie IronOCR in einem C#-Projekt?

Gibt es eine Testversion zur Erprobung einer C#-OCR-Bibliothek?

Welche Lizenzoptionen sind für eine OCR-Bibliothek in C# verfügbar?

Verwandte Artikel

Erstellen Sie eine Quittung OCR-API in C#, die tatsächlich nützliche Daten extrahiert

OCR C# GitHub: Texterkennung mit IronOCR

.NET OCR SDK: Eine Texterkennungsbibliothek für C#

Nächster Schritt: Kostenlosen 30-Tage-Test starten

Nächster Schritt: Kostenlosen 30-Tage-Test starten

Von Millionen von Ingenieur*innen weltweit vertraut

Iron Support Team