IRONOCR VERWENDEN

OCR mit Computer Vision (Beispiel-Tutorial)

Aktualisiert 28. Januar 2024
Teilen Sie:

Optische Zeichenerkennung (OCR) ist eine Technologie, die es Maschinen ermöglicht, Text aus Bildern zu lesen und zu interpretieren, wodurch Datenverarbeitung und Automatisierung schneller und effizienter werden. Dieser Artikel enthält Richtlinien zur Verwendung der OCR-Computer-Vision mit der IronOCR-Bibliothek und zeigt, wie sie die Texterkennung verbessern und diesen Prozess automatisieren kann.

Warum ist OCR wichtig?

OCR zusammen mit Computer Vision ist eine fortgeschrittene Form der optischen Zeichenerkennung (OCR) das die Leistungsfähigkeit von künstlicher Intelligenz und Algorithmen des maschinellen Lernens nutzt, um Textzeichen auf Bildern genauer und effizienter zu erkennen.

Bildverarbeitungsalgorithmen ermöglichen es OCR-Systemen, den Kontext und das Layout von Text in einem Bild zu verstehen und Zeichen anhand ihrer Form und Struktur zu erkennen. OCR in Verbindung mit Computer Vision kann Text aus komplexen Bildern mit verschiedenen Schriftarten, Stilen und Größen extrahieren und ist damit ein wertvolles Werkzeug für die Digitalisierung von Dokumenten, die Datenextraktion und die Automatisierung.

IronOCR: C# OCR-Bibliothek

IronOCR ist eine beliebte OCR-Bibliothek, die Computer-Vision-Techniken zur Textextraktion aus Bildern und Dokumenten verwendet. Es ist einfach zu bedienen und lässt sich in mehrere Programmiersprachen integrieren, darunter C# und VB.NET. IronOCR ist sowohl als On-Premise- als auch als Cloud-Version erhältlich und bietet eine Reihe von Funktionalitäten zur Verarbeitung und Extraktion von Text aus Bildern.

Installation von IronOCR

Um IronOCR zu installieren, verwenden Sie den folgenden Befehl in der NuGet Package Manager Console:

:ProductInstall

OCR-System mit IronOCR

Das folgende Bild dient zum Testen der OCR-System mit Computer Vision mit IronOCR.

OCR mit Computer Vision (Beispiel-Tutorial), Abbildung 1: Bildbeispiel für die OCR-Erkennung

Bildbeispiel für die OCR-Erkennung

FindTextRegion

Die textRegion finden" methode wird verwendet, um einen einzelnen Textbereich in einem Bild zu identifizieren. Die Methode benötigt mehrere optionale Parameter, darunter "Scale", "DilationAmount", "Binarize" und "Invert". Scale" passt die Größe des Bildes an, "DilationAmount" erhöht die Dicke des Textes, "Binarize" wandelt das Bild in Schwarz und Weiß um und "Invert" invertiert die Farben des Bildes.

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using inputOCR = New OcrInput("test.jpg")
	inputOCR.FindTextRegion()
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

Nachdem Sie den Code ausgeführt haben, werden Sie sehen, dass der Text mithilfe eines maschinellen Lernprozesses aus dem Textbereich extrahiert wird. Das Ausgabeergebnis erscheint in der Konsole mit fast 100 % Texterkennungsgenauigkeit. Die Genauigkeit von IronOCR liegt bei nahezu 100 % für jede Form von Text, ob gedruckt oder handschriftlich.

OCR mit Computer Vision (Beispiel-Tutorial), Abbildung 2: Die Konsolenergebnisse der Textextraktion

Die Ergebnisse der Textextraktion in der Konsole

FindMultipleTextRegions-Methode

Die mehrereTextRegionenfinden methode ähnelt der Methode FindTextRegion, wird aber verwendet, wenn es mehrere Textregionen in einem Bild gibt. Sie gibt eine Liste von "CropRectangle"-Objekten zurück, die die Lage der einzelnen Textbereiche definieren. Diese Methode ist nützlich, wenn Sie Text aus einem Bild extrahieren möchten, das mehrere Textabschnitte enthält.

using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr

Private ocr = New IronTesseract()
Using input = New OcrInput("test.jpg")
	input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

Das obige Codeschnipsel ist ein Beispiel für die Verwendung der IronOCR-Bibliothek zur Durchführung von OCR an einer Bilddatei. Zunächst wird die IronOCR-Bibliothek importiert und eine neue Instanz der eisen-Tesserakt klasse. Dann initialisiert sie eine ocrInput objekt mit dem Pfad der Eingabebilddatei und wendet einige Vorverarbeitungstechniken zur Bildkorrektur unter Verwendung der Methode "FindMultipleTextRegions".

Danach ruft es die lesen methode des "IronTesseract"-Objekts, die die OCR an dem vorverarbeiteten Bild durchführt und ein ocrResult objekt. Der aus dem Objekt OcrResult extrahierte Text wird dann in einer String-Variablen gespeichert und auf der Konsole ausgegeben.

Die Ausgabe von IronOCR

Die Ausgabe von IronOCR ist sehr genau, selbst bei komplexen Bildern mit verschiedenen Schriftarten, Größen und Textstilen.

Die OCR-Genauigkeit ist bei der Extraktion von Daten aus Bildern von entscheidender Bedeutung, da der extrahierte Text häufig für die weitere Verarbeitung verwendet wird, beispielsweise für die Datenanalyse, die manuelle Dateneingabe, das maschinelle Lernen oder die Verarbeitung natürlicher Sprache. Wenn der extrahierte Text Fehler enthält, kann dies zu Problemen im weiteren Verlauf führen. Darüber hinaus ermöglicht IronOCR die Untersuchung von Ergebnisobjekten, um konfidenzniveau prüfen.

Anwendungsfälle von OCR Computer Vision

Optische Zeichenerkennung (OCR) die Technologie hat den Umgang mit gedrucktem und handgeschriebenem Text revolutioniert. OCR-Tools sind ein unverzichtbarer Bestandteil der Dokumentenverarbeitung und Datenextraktion geworden. Hier sind einige Anwendungsfälle für Software zur optischen Zeichenerkennung:

OCR-Nummernschild-Erkennung

Nummernschild-Erkennung spielt eine wichtige Rolle bei der Automatisierung von Verkehrsmanagement, Parksystemen und Strafverfolgungsmaßnahmen. Durch die Implementierung von OCR-Computer-Vision in C# können Entwickler Anwendungen erstellen, die schnell und genau Nummernschilder aus Bildern oder Live-Videobildern identifizieren. Diese Technologie kann verwendet werden, um:

  • Überwachung von Verkehrsverstößen und Ermittlung von Fahrzeugen, die in kriminelle Aktivitäten verwickelt sind.
  • Automatisierung der Parksysteme, Erleichterung der Ein- und Ausfahrtverwaltung und Rationalisierung des Abrechnungsprozesses.
  • Verstärkung der Sicherheitsmaßnahmen durch Verfolgung und Überwachung der Fahrzeugbewegungen in Sperrgebieten.

Text aus Rechnungen extrahieren

OCR Computer Vision in C# kann zur Entwicklung von OCR-Anwendungen genutzt werden, die die extraktion von Text aus Rechnungen und andere Finanzdokumente. Dieser Prozess kann Fehler bei der manuellen Dateneingabe drastisch reduzieren und die Buchhaltungsaufgaben rationalisieren. Die wichtigsten Vorteile sind:

  • Höhere Produktivität durch Automatisierung der Dateneingabe.
  • Verbesserte Genauigkeit, da OCR die Wahrscheinlichkeit menschlicher Fehler verringert.
  • Nahtlose Integration mit Buchhaltungssoftware und -systemen für eine effiziente Datenverwaltung.

OCR-Untertitelgenerierung

Die Erstellung von Untertiteln für Videos kann zeitaufwändig und arbeitsintensiv sein. OCR Computer Vision in C# kann diesen Prozess vereinfachen, indem es automatisch erkennung und Transkription des Textes auf dem Bildschirmdie es Entwicklern ermöglicht:

  • Erstellen Sie präzise Untertitel für Filme, Fernsehsendungen und Online-Videos.
  • Verbessern Sie die Zugänglichkeit für Menschen mit Hörbehinderungen oder für Menschen, die verschiedene Sprachen sprechen.
  • Verstärkung der SEO-Bemühungen durch Bereitstellung durchsuchbarer, indizierbarer Inhalte für die Videoplattform

OCR-PDF-Verarbeitung

PDF-Dateien werden häufig für die gemeinsame Nutzung und Speicherung von Dokumenten verwendet, aber das Extrahieren von Text aus diesen Dateien kann schwierig sein. OCR Computer Vision in C# kann Entwicklern helfen, OCR-Anwendungen zu erstellen, die mühelos PDF-Dateien verarbeiten und ihren Inhalt zu extrahieren, Erleichterung:

Digitalisieren von gedrucktem Text

OCR-Software wird häufig verwendet, um digitalisieren von gedrucktem Text aus Dokumentenbildern. OCR-Tools können Text aus gescannten digitalen Dokumenten extrahieren, PDFsund bilder in verschiedenen Formaten. Dies ist besonders nützlich für die Dokumentenverwaltung, wo Sie textbasierte Dokumente einfach suchen, speichern und gemeinsam nutzen können.

Extrahieren von handgeschriebenem Text

Die OCR-Technologie ist inzwischen so weit fortgeschritten, dass sie handschriftlichen Text erkennen mit hoher Genauigkeit. Dies ist besonders in Bereichen wie dem Gesundheitswesen nützlich, wo medizinische Aufzeichnungen oft handschriftliche Notizen enthalten. OCR-Tools können handschriftlichen Text aus medizinischen Aufzeichnungen, Rezeptetiketten und anderen handschriftlichen Dokumenten extrahieren.

Datenextraktion

Die OCR-Technologie wird häufig eingesetzt, um Daten aus Eingangsdaten wie Rechnungen, Quittungen und Formularen zu extrahieren. OCR-Modelle können wichtige Datenfelder wie Namen, Adressen, Daten und Beträge erkennen und extrahieren. Dadurch entfällt die Notwendigkeit der manuellen Dateneingabe und die Fehlerquote bei der Datenverarbeitung wird reduziert.

Bildsuche

Die OCR-Technologie wird auch für die Bildsuche verwendet, bei der Sie anhand des darin enthaltenen Textes nach Bildern suchen können. Dies ist besonders nützlich für große Bildbibliotheken, bei denen eine manuelle Suche sehr zeitaufwändig wäre.

Übersetzung

OCR-Software kann verwendet werden, um Text aus Dokumenten in einer Sprache zu extrahieren und ihn in eine andere Sprache zu übersetzen. Dies ist besonders nützlich für internationale Unternehmen, bei denen die Dokumente schnell und präzise übersetzt werden müssen.

Zusammenfassung

Optische Zeichenerkennung (OCR) ist eine Technologie, die es Computern ermöglicht, Text aus Bildern zu lesen. OCR in Verbindung mit Computer Vision ist wichtig, weil sie es Maschinen ermöglicht, die visuelle Welt zu verstehen und zu interpretieren, was für Anwendungen wie selbstfahrende Autos, Robotik und automatische Dokumentenverarbeitung unerlässlich ist.

IronOCR ist eine leistungsstarke OCR-Engine, mit der OCR mit Computer Vision angewendet werden kann, um Text genau zu erkennen und Text aus Bildern zu extrahieren. Sie bietet eine Reihe von Methoden zum Auffinden und Extrahieren von Textregionen, darunter FindTextRegion, FindMultipleTextRegions und GetTextRegions. Jede Methode hat einen eigenen Satz von Parametern, die verwendet werden können, um feinabstimmung des OCR-Prozesses und bieten eine hohe OCR-Genauigkeit.

Mit IronOCR können Sie den gescannten Text aus Eingabebildern schnell und genau extrahieren, indem Sie gleichzeitigkeit und individuelle Konfigurationdas spart Ihnen Zeit und Mühe bei der Bearbeitung großer Mengen von Bilddaten. Egal, ob Sie mit gescannten Dokumenten, Fotos oder Screenshots arbeiten, IronOCR kann Ihnen helfen, den darin enthaltenen Text zu entschlüsseln.

IronOCR bietet einen kostenlosen Test für Benutzer, die die Software testen möchten, bevor sie eine Kaufentscheidung treffen. Die lizenz für IronOCR beginnt bei $749 und beinhaltet Support und Updates für ein Jahr. Mit seinen robusten Funktionen und dem günstigen Preis ist IronOCR eine gute Wahl für alle, die eine zuverlässige OCR-Lösung mit hoher OCR-Genauigkeit suchen.

< PREVIOUS
OCR-Bon-Datenextraktion (Schritt-für-Schritt-Anleitung)
NÄCHSTES >
OCR von Führerscheinen in C#

Sind Sie bereit, loszulegen? Version: 2024.10 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 2,561,036 Lizenzen anzeigen >