WEIßE PAPIERE

Textextraktion aus Bildern mit Hilfe von Software für maschinelles Lernen

Aktualisiert 28. Februar 2023
TECHNOLOGIE
Teilen Sie:

Die Textextraktion aus aufgenommenen Textbildern oder gescannten Dokumenten mit Hilfe von maschinellem Lernen ist ein aufstrebendes Gebiet an der Schnittstelle von Computer Vision und natürlicher Sprachverarbeitung. Diese Technologie nutzt fortschrittliches maschinelles Lernen, Objekterkennungsalgorithmen, fortschrittliche Grafiksoftware, Deep- und Dark-Web sowie neuronale Netzwerkarchitekturen, um Textinformationen aus Bildern und gescannten Papierdokumenten - von handschriftlichen Notizen und gedrucktem Text bis hin zu komplexer Typografie - in verschiedenen Kontexten genau zu identifizieren und zu extrahieren. Durch den Einsatz verschiedener Technologien des maschinellen Lernens wie der optischen Zeichenerkennung(OCR) und Deep Learning ermöglicht es die automatisierte und effiziente Umwandlung von visueller Szenentexterkennung in editierbare und durchsuchbare strukturierte Daten sowie die Objekterkennung.

In dieser sich ständig weiterentwickelnden Landschaft bemühen sich Forscher und Praktiker kontinuierlich um eine Verbesserung der Genauigkeit, Geschwindigkeit und Vielseitigkeit, wodurch die Texterkennung und -extraktion aus Bildern, maschinenlesbaren Daten und gescannten Dokumenten zu einer zentralen Komponente in Anwendungen wie der Digitalisierung gedruckter Dokumente, der Indexierung von Inhalten, der Übersetzung und der Verbesserung der Barrierefreiheit wird.

In diesem Artikel wird beschrieben, wie Sie Text aus Bildern extrahieren können, indem SieIronOCReine OCR-Bibliothek, die auf leistungsstarken Algorithmen für maschinelles Lernen und textbezogenen Funktionen basiert. Die Textextraktion, auch bekannt als Schlagwortextraktion, basiert auf maschinellem Lernen, um automatisch relevante oder grundlegende Wörter und Phrasen aus unstrukturierten Daten oder der zentralen Datenbank des Unternehmens zu scannen und zu extrahieren.

Wie extrahiert man mit maschinellem Lernen Text aus einem Bild?

  1. Laden Sie die C#-Bibliothek für die Textextraktion aus Bildern herunter.
  2. Laden eines bestimmten Bildes durch Instanziierung des OcrInput-Objekts für die Erkennung von Szenentext.
  3. Extrahieren von Daten aus dem Bild mit der Methode ocrTesseract.Read.
  4. Drucken Sie den extrahierten Text mit der Methode Console.WriteLine in der Konsole aus.
  5. Führen Sie OCR auf dem Bereich eines Bildes mit dem CropRectangle-Objekt** durch

IronOCR- Eine OCR(Optische Zeichenerkennung) Bibliothek

IronOCR, eine bekannte und hochentwickelte optische Zeichenerkennung(OCR) software, steht an der Spitze der Technologie zur Textextraktion aus Bildern und Dokumenten. Diese von Iron Software entwickelte, leistungsstarke OCR-Engine wurde entwickelt, um gescannte Bilder, PDFs oder sogar Fotos mit Text präzise und effizient in bearbeitbare und durchsuchbare digitale Inhalte zu konvertieren. Durch den geschickten Einsatz von Algorithmen des maschinellen Lernens und neuronalen Netzen bietet IronOCR eine robuste Lösung für verschiedene Anwendungen, darunter Datenextraktion, Inhaltsindizierung und Automatisierungsprozesse, die eine präzise Texterkennung erfordern.

Seine Fähigkeit, mehrere Sprachen und verschiedene Schriftarten zu verarbeiten, macht es zu einem vielseitigen Werkzeug für Entwickler und Unternehmen, die eine optimierte Texterkennungsalgorithmus-Extraktionsfunktion für ihre Software und Anwendungen suchen. Sie können IronOCR zum automatischen Scannen von Text verwenden, wobei eine gängige Texterkennungstechnik zum Einsatz kommt, die unstrukturierte Daten mithilfe von Textextraktionsalgorithmen in eine perfekt gescannte Seite umwandelt.

Installation von IronOCR

IronOCR kann mit dem NuGet Package Manager installiert werden. Hier sind die Schritte, um IronOCR zu installieren.

  1. Erstellen Sie zunächst ein neues C# Visual Studio Projekt oder öffnen Sie ein bestehendes Projekt.

    Visual Studio

  2. Sobald das Projekt erstellt ist, gehen Sie im oberen Menü auf Tools und wählen Sie NuGet Package Manager und dann NuGet Package Manager for Solution.

    Menü Werkzeuge

  3. Ein neues Fenster wird auf dem Bildschirm angezeigt. Gehen Sie auf die Registerkarte Durchsuchen und geben Sie IronOCR in die Suchleiste ein.
  4. Es erscheint eine Liste der IronOCR-Pakete, wählen Sie das neueste aus und klicken Sie auf Installieren.

    IronOCR

  5. Es wird ein paar Sekunden dauern, abhängig von Ihrem Internet, danach ist IronOCR bereit, in Ihrem C# Projekt verwendet zu werden.

Texterkennung von Bildern zu bearbeitbaren und durchsuchbaren Daten

Mit IronOCR können Sie den Text mithilfe von Bildverarbeitungstechniken und maschinellem Lernen leicht extrahieren. In diesem Abschnitt wird erläutert, wie man mit IronOCR Text aus Bildern extrahiert.

using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

Dieser C#-Code demonstriert die Verwendung von IronOCR, einer Bibliothek zur optischen Zeichenerkennung(OCR). Hier ist eine schrittweise Erklärung:

  1. Importieren von Bibliotheken: ``` unter Verwendung von IronOcr; mit System;

Der Code beginnt mit dem Import der erforderlichen Bibliotheken, darunter IronOcr, das die OCR-Funktionen bereitstellt, und der Namensraum System für allgemeine Funktionen.

  1. Initialisierung von IronTesseract und Laden des Bildes: ``` var ocrTesseract = new EisenTesserakt();

Diese Zeile erzeugt eine Instanz von IronTesseract, der von IronOCR bereitgestellten OCR-Engine.

using (var ocrInput = new OcrInput(@"images\image.png"))
using (var ocrInput = new OcrInput(@"images\image.png"))
Using ocrInput As New OcrInput("images\image.png")
VB   C#

Ein OcrInput-Objekt wird mit dem Pfad zu dem zu verarbeitenden Bild instanziiert. In diesem Fall handelt es sich um die Bilddatei "image.png" im Verzeichnis "images".

  1. OCR durchführen und Text extrahieren: var ocrResult = ocrTesseract.Read(ocrInput); Diese Zeile ruft die Methode Read der Instanz IronTesseract auf und übergibt das Objekt OcrInput. Diese Methode führt eine OCR an dem bereitgestellten Bild durch und extrahiert den Text.
  2. Anzeigen des extrahierten Textes: ``` Console.WriteLine(ocrResult.Text);

Schließlich wird der extrahierte Text mit Console.WriteLine auf der Konsole ausgedruckt, wobei das OCR-Ergebnis des Bildes angezeigt wird.

Dieses Codeschnipsel verwendet IronOCR, um eine OCR-Texterkennung des angegebenen Bildes durchzuführen und den extrahierten Text auf der Konsole auszugeben.

Eingangsbild

Rechnung

Ausgabe

Ausgabe von Kundenrechnungen

OCR für den angegebenen Bereich im Bild durchführen

Sie können mit IronOCR auch eine OCR für bestimmte Bildbereiche durchführen, hier ein Codebeispiel. ``` unter Verwendung von IronOcr; mit IronSoftware.Drawing; mit System; var ocrTesseract = new EisenTesserakt(); mit(var ocrInput = new OcrInput()) { var ContentArea = new CropRectangle(x: 20, y: 20, Breite: 400, Höhe: 50); ocrInput.AddImage("r3.png", ContentArea); var ocrResult = ocrTesseract.Read(ocrInput); Console.WriteLine(ocrResult.Text); }



Dieser C#-Code verwendet die IronOCR-Bibliothek zur optischen Zeichenerkennung(OCR). Es importiert zunächst die erforderlichen Bibliotheken, einschließlich IronOCR und System. Eine IronTesseract-Instanz, die OCR-Engine, wird erstellt. Der Code legt einen bestimmten ContentArea im Bild fest, der mit einem CropRectangle bearbeitet werden soll, und konzentriert sich dabei auf eine bestimmte Region. Das Bild("r3.png") innerhalb dieses festgelegten Bereichs wird dann zur OCR-Verarbeitung hinzugefügt. Die OCR-Engine liest den angegebenen Inhaltsbereich, extrahiert den Text, und der resultierende Text wird mit Console.WriteLine auf der Konsole ausgegeben.

### Ausgabe

![Ausgabe](/static-assets/ironsoftware/white-papers/text-extraction-from-image-using-machine-learning/text-extraction-from-image-using-machine-learning-6.webp)

## Schlussfolgerung

Textextraktion aus Bildern durch maschinelles Lernen, vor allem durch optische Zeichenerkennung(OCR) bibliotheken wie IronOCR bedeuten einen transformativen Schritt an der Kreuzung von Computer Vision und natürlicher Sprachverarbeitung. Diese Technologie, die auf fortschrittlichen Algorithmen für maschinelles Lernen und neuronalen Netzwerken basiert, entziffert und extrahiert Text aus verschiedenen Bildtypen, einschließlich Handschrift, gedrucktem Text und komplizierter Typografie. Sowohl die OCR-Technologie als auch Deep-Learning-Techniken spielen eine zentrale Rolle bei der effizienten Umwandlung von visuellem Text in bearbeitbare und durchsuchbare Daten und dienen wichtigen Zwecken wie der Digitalisierung von Dokumenten, der Indexierung von Inhalten und der Verbesserung der Barrierefreiheit.

IronOCR, eine führende OCR-Bibliothek, ist ein Beispiel für das Potenzial dieser Verschmelzung. Sie zeichnet sich durch die präzise Umwandlung gescannter Bilder und PDFs in digitale, bearbeitbare Inhalte in mehreren Sprachen und Schriftarten aus. Die nahtlose Integration in Programmiersprachen wie C# ermöglicht eine rationelle Implementierung, wodurch die transformative Wirkung der Textextraktion aus Bildern in zahlreichen Anwendungen und Bereichen noch verstärkt wird.

Mehr Informationen über[IronOCR](https://ironsoftware.com/csharp/ocr/) und alle damit verbundenen Funktionen finden Sie unter diesem Link[hier](https://ironsoftware.com/csharp/ocr/features/). Die vollständige Anleitung zum Extrahieren von Text aus Bildern finden Sie unter folgender Adresse[link](https://ironsoftware.com/csharp/ocr/tutorials/how-to-read-text-from-an-image-in-csharp-net/). Die IronOCR-Lizenz kann hier erworben werden[link](https://ironsoftware.com/csharp/ocr/licensing/).
< PREVIOUS
Software zur Bearbeitung von Lebensversicherungsansprüchen
NÄCHSTES >
Software zum Drucken von Eintrittskarten für Veranstaltungen

Holen Sie sich Ihr kostenloses Whitepaper

Dankeschön,

Die E-Mail mit dem Download-Link wird Ihnen in Kürze zugesandt.