Textextraktion aus Bildern mit Hilfe von Software für maschinelles Lernen
Die Textextraktion aus aufgenommenen Textbildern oder gescannten Dokumenten mit Hilfe von maschinellem Lernen ist ein aufstrebendes Gebiet an der Schnittstelle von Computer Vision und natürlicher Sprachverarbeitung. Diese Technologie nutzt fortschrittliches maschinelles Lernen, Objekterkennungsalgorithmen, fortschrittliche Grafiksoftware, Deep- und Dark-Web sowie neuronale Netzwerkarchitekturen, um Textinformationen aus Bildern und gescannten Papierdokumenten - von handschriftlichen Notizen und gedrucktem Text bis hin zu komplexer Typografie - in verschiedenen Kontexten genau zu identifizieren und zu extrahieren. Durch den Einsatz verschiedener Technologien des maschinellen Lernens wie der optischen Zeichenerkennung(OCR) und Deep Learning ermöglicht es die automatisierte und effiziente Umwandlung von visueller Szenentexterkennung in editierbare und durchsuchbare strukturierte Daten sowie die Objekterkennung.
In dieser sich ständig weiterentwickelnden Landschaft bemühen sich Forscher und Praktiker kontinuierlich um eine Verbesserung der Genauigkeit, Geschwindigkeit und Vielseitigkeit, wodurch die Texterkennung und -extraktion aus Bildern, maschinenlesbaren Daten und gescannten Dokumenten zu einer zentralen Komponente in Anwendungen wie der Digitalisierung gedruckter Dokumente, der Indexierung von Inhalten, der Übersetzung und der Verbesserung der Barrierefreiheit wird.
In diesem Artikel wird beschrieben, wie Sie Text aus Bildern extrahieren können, indem SieIronOCReine OCR-Bibliothek, die auf leistungsstarken Algorithmen für maschinelles Lernen und textbezogenen Funktionen basiert. Die Textextraktion, auch bekannt als Schlagwortextraktion, basiert auf maschinellem Lernen, um automatisch relevante oder grundlegende Wörter und Phrasen aus unstrukturierten Daten oder der zentralen Datenbank des Unternehmens zu scannen und zu extrahieren.
Wie extrahiert man mit maschinellem Lernen Text aus einem Bild?
Laden Sie die C#-Bibliothek für die Textextraktion aus Bildern herunter.
Laden eines bestimmten Bildes durch Instanziierung des OcrInput-Objekts für die Erkennung von Szenentext.
Extrahieren von Daten aus dem Bild mit der Methode ocrTesseract.Read.
Drucken Sie den extrahierten Text mit der Methode Console.WriteLine in der Konsole aus.
- Führen Sie OCR auf dem Bereich eines Bildes mit dem CropRectangle-Objekt** durch
IronOCR- Eine OCR(Optische Zeichenerkennung) Bibliothek
IronOCR, eine bekannte und hochentwickelte optische Zeichenerkennung(OCR) software, steht an der Spitze der Technologie zur Textextraktion aus Bildern und Dokumenten. Diese von Iron Software entwickelte, leistungsstarke OCR-Engine wurde entwickelt, um gescannte Bilder, PDFs oder sogar Fotos mit Text präzise und effizient in bearbeitbare und durchsuchbare digitale Inhalte zu konvertieren. Durch den geschickten Einsatz von Algorithmen des maschinellen Lernens und neuronalen Netzen bietet IronOCR eine robuste Lösung für verschiedene Anwendungen, darunter Datenextraktion, Inhaltsindizierung und Automatisierungsprozesse, die eine präzise Texterkennung erfordern.
Seine Fähigkeit, mehrere Sprachen und verschiedene Schriftarten zu verarbeiten, macht es zu einem vielseitigen Werkzeug für Entwickler und Unternehmen, die eine optimierte Texterkennungsalgorithmus-Extraktionsfunktion für ihre Software und Anwendungen suchen. Sie können IronOCR zum automatischen Scannen von Text verwenden, wobei eine gängige Texterkennungstechnik zum Einsatz kommt, die unstrukturierte Daten mithilfe von Textextraktionsalgorithmen in eine perfekt gescannte Seite umwandelt.
Installation von IronOCR
IronOCR kann mit dem NuGet Package Manager installiert werden. Hier sind die Schritte, um IronOCR zu installieren.
Erstellen Sie zunächst ein neues C# Visual Studio Projekt oder öffnen Sie ein bestehendes Projekt.
Sobald das Projekt erstellt ist, gehen Sie im oberen Menü auf Tools und wählen Sie NuGet Package Manager und dann NuGet Package Manager for Solution.
Ein neues Fenster wird auf dem Bildschirm angezeigt. Gehen Sie auf die Registerkarte Durchsuchen und geben Sie IronOCR in die Suchleiste ein.
Es erscheint eine Liste der IronOCR-Pakete, wählen Sie das neueste aus und klicken Sie auf Installieren.
- Es wird ein paar Sekunden dauern, abhängig von Ihrem Internet, danach ist IronOCR bereit, in Ihrem C# Projekt verwendet zu werden.
Texterkennung von Bildern zu bearbeitbaren und durchsuchbaren Daten
Mit IronOCR können Sie den Text mithilfe von Bildverarbeitungstechniken und maschinellem Lernen leicht extrahieren. In diesem Abschnitt wird erläutert, wie man mit IronOCR Text aus Bildern extrahiert.
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput("images\image.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
End Using
Dieser C#-Code demonstriert die Verwendung von IronOCR, einer Bibliothek zur optischen Zeichenerkennung(OCR). Hier ist eine schrittweise Erklärung:
- Importieren von Bibliotheken:
unter Verwendung von IronOcr;
mit System;
Der Code beginnt mit dem Import der erforderlichen Bibliotheken, darunter **IronOcr**, das die OCR-Funktionen bereitstellt, und der Namensraum **System** für allgemeine Funktionen.
2. **Initialisierung von IronTesseract und Laden des Bildes**:
var ocrTesseract = new EisenTesserakt();
Diese Zeile erzeugt eine Instanz von **IronTesseract**, der von IronOCR bereitgestellten OCR-Engine.
```cs
using (var ocrInput = new OcrInput(@"images\image.png"))
Ein OcrInput-Objekt wird mit dem Pfad zu dem zu verarbeitenden Bild instanziiert. In diesem Fall handelt es sich um die Bilddatei "image.png" im Verzeichnis "images".
- OCR durchführen und Text extrahieren:
var ocrResult = ocrTesseract.Read(ocrInput);
Diese Zeile ruft die Methode **Read** der Instanz **IronTesseract** auf und übergibt das Objekt **OcrInput**. Diese Methode führt eine OCR an dem bereitgestellten Bild durch und extrahiert den Text.
4. **Anzeigen des extrahierten Textes**:
Console.WriteLine(ocrResult.Text);
Schließlich wird der extrahierte Text mit **Console.WriteLine** auf der Konsole ausgedruckt, wobei das OCR-Ergebnis des Bildes angezeigt wird.
Dieses Codeschnipsel verwendet IronOCR, um eine OCR-Texterkennung des angegebenen Bildes durchzuführen und den extrahierten Text auf der Konsole auszugeben.
### Eingangsbild
![Rechnung](/static-assets/ironsoftware/white-papers/text-extraction-from-image-using-machine-learning/text-extraction-from-image-using-machine-learning-4.webp)
### Ausgabe
![Ausgabe von Kundenrechnungen](/static-assets/ironsoftware/white-papers/text-extraction-from-image-using-machine-learning/text-extraction-from-image-using-machine-learning-5.webp)
### OCR für den angegebenen Bereich im Bild durchführen
Sie können mit IronOCR auch eine OCR für bestimmte Bildbereiche durchführen, hier ein Codebeispiel.
unter Verwendung von IronOcr;
mit IronSoftware.Drawing;
mit System;
var ocrTesseract = new EisenTesserakt();
mit(var ocrInput = new OcrInput())
{
var ContentArea = new CropRectangle(x: 20, y: 20, Breite: 400, Höhe: 50);
ocrInput.AddImage("r3.png", ContentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
Dieser C#-Code verwendet die IronOCR-Bibliothek zur optischen Zeichenerkennung(OCR). Es importiert zunächst die erforderlichen Bibliotheken, einschließlich IronOCR und System. Eine IronTesseract-Instanz, die OCR-Engine, wird erstellt. Der Code legt einen bestimmten ContentArea im Bild fest, der mit einem CropRectangle bearbeitet werden soll, und konzentriert sich dabei auf eine bestimmte Region. Das Bild("r3.png") innerhalb dieses festgelegten Bereichs wird dann zur OCR-Verarbeitung hinzugefügt. Die OCR-Engine liest den angegebenen Inhaltsbereich, extrahiert den Text, und der resultierende Text wird mit Console.WriteLine auf der Konsole ausgegeben.
### Ausgabe
![Ausgabe](/static-assets/ironsoftware/white-papers/text-extraction-from-image-using-machine-learning/text-extraction-from-image-using-machine-learning-6.webp)
## Schlussfolgerung
Textextraktion aus Bildern durch maschinelles Lernen, vor allem durch optische Zeichenerkennung(OCR) bibliotheken wie IronOCR bedeuten einen transformativen Schritt an der Kreuzung von Computer Vision und natürlicher Sprachverarbeitung. Diese Technologie, die auf fortschrittlichen Algorithmen für maschinelles Lernen und neuronalen Netzwerken basiert, entziffert und extrahiert Text aus verschiedenen Bildtypen, einschließlich Handschrift, gedrucktem Text und komplizierter Typografie. Sowohl die OCR-Technologie als auch Deep-Learning-Techniken spielen eine zentrale Rolle bei der effizienten Umwandlung von visuellem Text in bearbeitbare und durchsuchbare Daten und dienen wichtigen Zwecken wie der Digitalisierung von Dokumenten, der Indexierung von Inhalten und der Verbesserung der Barrierefreiheit.
IronOCR, eine führende OCR-Bibliothek, ist ein Beispiel für das Potenzial dieser Verschmelzung. Sie zeichnet sich durch die präzise Umwandlung gescannter Bilder und PDFs in digitale, bearbeitbare Inhalte in mehreren Sprachen und Schriftarten aus. Die nahtlose Integration in Programmiersprachen wie C# ermöglicht eine rationelle Implementierung, wodurch die transformative Wirkung der Textextraktion aus Bildern in zahlreichen Anwendungen und Bereichen noch verstärkt wird.
Mehr Informationen über[IronOCR](https://ironsoftware.com/csharp/ocr/) und alle damit verbundenen Funktionen finden Sie unter diesem Link[hier](https://ironsoftware.com/csharp/ocr/features/). Die vollständige Anleitung zum Extrahieren von Text aus Bildern finden Sie unter folgender Adresse[link](https://ironsoftware.com/csharp/ocr/tutorials/how-to-read-text-from-an-image-in-csharp-net/). Die IronOCR-Lizenz kann hier erworben werden[link](https://ironsoftware.com/csharp/ocr/licensing/).
Software zur Bearbeitung von Lebensversicherungsansprüchen
Software zum Drucken von Eintrittskarten für Veranstaltungen