Textextraktion von Bild mit maschineller Lernsoftware
Textextraktion aus Textbildern erfasster oder gescannter Dokumente mithilfe von maschinellem Lernen ist ein wachsendes Gebiet an der Schnittstelle von Computer Vision und natürlichsprachlicher Verarbeitung. Diese Technologie nutzt fortschrittliches maschinelles Lernen, Objekterkennungsalgorithmen, fortschrittliche Grafiksoftware, Deep- und Dark-Web sowie neuronale Netzwerkarchitekturen, um Textinformationen aus Bildern und gescannten Papierdokumenten genau zu identifizieren und zu extrahieren. Durch den Einsatz verschiedener maschineller Lerntechnologien wie optische Zeichenerkennung (OCR) und Deep Learning ermöglicht sie eine automatisierte und effiziente Umwandlung der Visual-Scene-Text-Erkennung in bearbeitbare und durchsuchbare strukturierte Daten und Objekterkennung.
In dieser sich entwickelnden Landschaft arbeiten Forscher und Praktiker ständig daran, Genauigkeit, Geschwindigkeit und Vielseitigkeit zu verbessern, sodass die Texterkennung und -extraktion aus Bildern, maschinenlesbaren Daten und gescannten Dokumenten zu einer entscheidenden Komponente in Anwendungen wie Digitalisierung gedruckter Dokumente, Inhaltsindexierung, Übersetzung und Barrierefreiheitserweiterung wird.
In diesem Artikel werden wir besprechen, wie Sie Text aus Bildern extrahieren können, indem Sie IronOCR, eine OCR-Bibliothek, die von leistungsstarken maschinellen Lernalgorithmen und textbezogenen Funktionen betrieben wird, einsetzen. Textextraktion, auch bekannt als Schlagwortextraktion, basiert auf maschinellem Lernen, um automatisch relevante oder grundlegende Wörter und Phrasen aus unstrukturierten Daten oder der zentralen Datenbank des Unternehmens herauszufiltern.
Wie extrahiert man Text aus einem Bild mit maschinellem Lernen?
- Laden Sie die C#-Bibliothek für die Textextraktion aus Bildern herunter.
- Laden Sie ein bestimmtes Bild, indem Sie das OcrInput-Objekt für die Texterkennung der Szene instanziieren.
- Extrahieren Sie Daten aus dem Bild mit der Methode ocrTesseract.Read.
- Drucken Sie den extrahierten Text in der Konsole, indem Sie die Methode Console.WriteLine verwenden.
- Führen Sie OCR auf dem Bereich eines Bildes unter Verwendung des CropRectangle-Objekts durch.
IronOCR - Eine OCR (Optical Character Recognition) Bibliothek
IronOCR, eine prominente und anspruchsvolle optische Zeichenerkennungssoftware (OCR), steht an der Spitze der Textextraktionstechnologie aus Bildern und Dokumenten. Entwickelt von Iron Software ist diese leistungsstarke OCR-Engine darauf ausgelegt, gescannte Bilder, PDFs oder sogar Fotografien von Text genau und effizient in bearbeitbare und durchsuchbare digitale Inhalte umzuwandeln. Durch den geschickten Einsatz von maschinellen Lernalgorithmen und neuronalen Netzwerken bietet IronOCR eine robuste Lösung für verschiedene Anwendungen, einschließlich Datenextraktion, Inhaltsindexierung und Automatisierungsprozessen, die präzise Texterkennung erfordern.
Seine Fähigkeit, mehrere Sprachen und vielfältige Schriftarten zu verarbeiten, macht es zu einem vielseitigen Werkzeug sowohl für Entwickler als auch für Unternehmen, die in ihrer Software und Anwendungen eine optimierte Texterkennungsalgorithmus-Extraktionsfähigkeit suchen. Sie können IronOCR verwenden, um Text automatisch zu scannen, indem Sie eine übliche Texterkennungstechnik verwenden, die unstrukturierte Daten in eine perfekt gescannte Seite mit Hilfe von Textextraktionsalgorithmen umwandelt.
Installation von IronOCR
IronOCR kann über den NuGet Package Manager installiert werden. Hier sind die Schritte zur Installation von IronOCR:
- Erstellen Sie zuerst ein neues C#-Visual-Studio-Projekt oder öffnen Sie ein bestehendes.

- Sobald das Projekt erstellt ist, gehen Sie im oberen Menü zu Tools und wählen Sie NuGet Package Manager aus, dann wählen Sie den NuGet Package Manager für die Lösung aus.

- Ein neues Fenster erscheint auf dem Bildschirm. Gehen Sie zur Registerkarte Durchsuchen und schreiben Sie IronOCR in die Suchleiste.
- Eine Liste von IronOCR-Paketen erscheint. Wählen Sie das neueste aus und klicken Sie auf Installieren.

- Es dauert einige Sekunden, je nach Ihrer Internetverbindung; danach ist IronOCR bereit, in Ihrem C#-Projekt verwendet zu werden.
Texterkennung von Bildern zu bearbeitbaren und durchsuchbaren Daten
Mit IronOCR können Sie Text einfach unter Verwendung von Bildverarbeitungstechniken und maschinellem Lernen extrahieren. In diesem Abschnitt werden wir besprechen, wie man mit IronOCR Text aus Bildern extrahiert.
using IronOcr;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the image path and perform OCR on the image
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the image path and perform OCR on the image
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System
' Create a new instance of the IronTesseract class
Private ocrTesseract = New IronTesseract()
' Specify the image path and perform OCR on the image
Using ocrInput As New OcrInput("images\image.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Print the extracted text to the console
Console.WriteLine(ocrResult.Text)
End Using
Dieser C#-Code demonstriert die Verwendung von IronOCR, einer Bibliothek für die optische Zeichenerkennung (OCR). Hier ist eine schrittweise Erklärung:
-
Bibliotheken importieren:
using IronOcr; using System;using IronOcr; using System;Imports IronOcr Imports System$vbLabelText $csharpLabelDer Code beginnt mit dem Import der notwendigen Bibliotheken, einschließlich IronOcr, das die OCR-Funktionalität bereitstellt, und dem System-Namensraum für allgemeine Funktionen.
-
Initialisierung von IronTesseract und Laden des Bildes:
var ocrTesseract = new IronTesseract();var ocrTesseract = new IronTesseract();IRON VB CONVERTER ERROR developers@ironsoftware.com$vbLabelText $csharpLabelDiese Zeile erstellt eine Instanz von IronTesseract, welche die OCR-Engine von IronOCR ist.
using (var ocrInput = new OcrInput(@"images\image.png"))using (var ocrInput = new OcrInput(@"images\image.png"))Using ocrInput As New OcrInput("images\image.png")$vbLabelText $csharpLabelEin OcrInput-Objekt wird mit dem Pfad zum zu verarbeitenden Bild instanziiert. In diesem Fall befindet sich die Bilddatei "image.png" im Verzeichnis "images".
-
Ausführung von OCR und Extraktion von Text:
var ocrResult = ocrTesseract.Read(ocrInput);var ocrResult = ocrTesseract.Read(ocrInput);IRON VB CONVERTER ERROR developers@ironsoftware.com$vbLabelText $csharpLabelDiese Zeile ruft die Read-Methode der IronTesseract-Instanz auf, in die das OcrInput-Objekt übergeben wird. Diese Methode führt eine OCR auf dem angegebenen Bild durch und extrahiert den Text.
-
Anzeigen des extrahierten Textes:
Console.WriteLine(ocrResult.Text);Console.WriteLine(ocrResult.Text);Console.WriteLine(ocrResult.Text)$vbLabelText $csharpLabelSchließlich wird der extrahierte Text mit Console.WriteLine in die Konsole gedruckt, wodurch das OCR-Ergebnis des Bildes angezeigt wird.
Dieses Code-Snippet verwendet IronOCR, um OCR für die Texterkennung des angegebenen Bildes durchzuführen und den extrahierten Text in die Konsole auszugeben.
Eingabebild

Ausgabe

Führen Sie OCR auf einem bestimmten Bereich des Bildes durch
Sie können auch OCR auf spezifischen Bereichen des Bildes unter Verwendung von IronOCR durchführen. Hier ist ein Code-Beispiel:
using IronOcr;
using IronSoftware.Drawing;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the region on the image to be processed
using (var ocrInput = new OcrInput())
{
var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
// Add the image with the defined content area
ocrInput.AddImage("r3.png", ContentArea);
// Perform OCR on the specified region and extract text
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using IronSoftware.Drawing;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the region on the image to be processed
using (var ocrInput = new OcrInput())
{
var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
// Add the image with the defined content area
ocrInput.AddImage("r3.png", ContentArea);
// Perform OCR on the specified region and extract text
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
' Create a new instance of the IronTesseract class
Private ocrTesseract = New IronTesseract()
' Specify the region on the image to be processed
Using ocrInput As New OcrInput()
Dim ContentArea = New CropRectangle(x:= 20, y:= 20, width:= 400, height:= 50)
' Add the image with the defined content area
ocrInput.AddImage("r3.png", ContentArea)
' Perform OCR on the specified region and extract text
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Print the extracted text to the console
Console.WriteLine(ocrResult.Text)
End Using
Dieser C#-Code nutzt die IronOCR-Bibliothek für die optische Zeichenerkennung (OCR). Es importiert zuerst die notwendigen Bibliotheken, einschließlich IronOCR und System. Eine IronTesseract-Instanz, die OCR-Engine, wird erstellt. Der Code legt einen bestimmten Inhaltsbereich im Bild fest, der mit einem CropRectangle zu verarbeiten ist, indem er auf einen definierten Bereich fokussiert. Das Bild ("r3.png") innerhalb dieses bestimmten Bereichs wird dann zur OCR-Verarbeitung hinzugefügt. Der OCR-Engine liest den festgelegten Inhaltsbereich, extrahiert den Text, und der resultierende Text wird mit Console.WriteLine in die Konsole gedruckt.
Ausgabe

Abschluss
Textextraktion aus Bildern durch maschinelles Lernen, besonders unter Verwendung von Bibliotheken zur optischen Zeichenerkennung (OCR) wie IronOCR, bedeutet einen transformativen Schritt an der Schnittstelle von Computer Vision und natürlichsprachlicher Verarbeitung. Sowohl OCR-Technologie als auch Deep-Learning-Techniken spielen eine entscheidende Rolle bei der effizienten Umwandlung von visuellem Text in bearbeitbare und durchsuchbare Daten und dienen wichtigen Zwecken wie Dokumentendigitalisierung, Inhaltsindexierung und Verbesserung der Zugänglichkeit.
IronOCR, als eine prominente OCR-Bibliothek, exemplifiziert das Potenzial dieser Fusion und glänzt in der genauen Umwandlung von gescannten Bildern und PDFs in digitale, bearbeitbare Inhalte in mehreren Sprachen und Schriftstilen. Die nahtlose Integration in Programmiersprachen wie C# ermöglicht eine optimierte Implementierung und verstärkt weiter den transformativen Einfluss der Textextraktion aus Bildern in zahlreichen Anwendungen und Bereichen.
Um mehr über IronOCR und alle relateden Funktionen zu erfahren, besuchen Sie diesen Link. Das komplette Tutorial zur Textextraktion aus Bildern steht unter folgendem Link zur Verfügung. IronOCR-Lizenzen können über diesen Link erworben werden.