OCR-WERKZEUGE

Wie man Bilder in Text umwandelt

Kannaopat Udonpant
Kannapat Udonpant
24. Oktober 2024
Teilen Sie:

Im heutigen digitalen Zeitalter müssen bildbasierte Inhalte in leicht lesbaren, editierbaren und durchsuchbaren Text umgewandelt werden. Dies ist insbesondere in Szenarien wie der Archivierung papierbasierter Dokumente, dem Extrahieren von Schlüsselinformationen aus Bildern oder der Digitalisierung gedruckter Materialien von Bedeutung. Die Optical Character Recognition (OCR) Technologie bietet eine Lösung zur Automatisierung dieses Umwandlungsprozesses. Ein äußerst zuverlässiges und effizientes Werkzeug, um dies zu erreichen, ist IronOCR, eine robuste OCR-Bibliothek für .NET.

Dieser Artikel erklärt, wie man mit IronOCR ein Bild in Text umwandelt und untersucht, wie diese Umwandlung Zeit sparen, Fehler reduzieren und Prozesse wie Datenextraktion, Archivierung und Dokumentenverarbeitung optimieren kann.

Wie man Bilder in Text umwandelt

  1. Laden Sie eine C#-Bibliothek für OCR-Arbeiten herunter

  2. Erstellen Sie eine neue `IronTesseract`-Instanz

  3. Laden Sie Ihr Bild mit `OcrImageInput`

  4. Lesen Sie den Inhalt des Bildes mithilfe von `OcrRead`

  5. Exportieren der OCR-Ergebnisse in eine Textdatei

Warum ein Bild in Text umwandeln?

Es gibt viele Gründe, warum Sie ein Bild in Text umwandeln möchten, darunter:

  • Datenextraktion: Extrahieren von Text aus gescannten Dokumenten und Bildern für Archivierungs- oder Datenverarbeitungszwecke.
  • Bearbeitung gescannter Inhalte: Bearbeiten oder Aktualisieren von Texten in zuvor gescannten Dokumenten, um die Zeit für das manuelle Abtippen des Inhalts zu sparen.
  • Verbesserung der Barrierefreiheit: Gedrucktes Material in digitalen Text umwandeln, um es für Bildschirmlesegeräte oder Text-to-Speech-Anwendungen zugänglich zu machen.
  • Automatisierung: Automatisieren Sie die Dateneingabe und -verarbeitung, indem Sie Text von Rechnungen, Quittungen oder Visitenkarten lesen.

So beginnen Sie mit der Umwandlung von Bildern in Text

Bevor wir erkunden, wie die leistungsstarken Bild-zu-Text-Fähigkeiten von IronOCR genutzt werden können, um Text aus Bildern zu extrahieren, werfen wir zunächst einen Blick auf den allgemeinen Schritt-für-Schritt-Prozess mit einem Online-Tool, docsumo. Online-OCR-Tools sind eine hilfreiche Option für diejenigen, die gelegentlich oder sogar nur einmalig OCR-Aufgaben erledigen möchten, da sie keine manuelle Einrichtung erfordern. Wenn Sie regelmäßig OCR-Aufgaben durchführen müssen, ist ein leistungsfähiges OCR-Tool wie IronOCR natürlich besser für Sie geeignet.

  1. Navigieren Sie zum Online-OCR-Tool

  2. Laden Sie Ihr Bild hoch und beginnen Sie den Extraktionsprozess

  3. Laden Sie die resultierenden Daten als Textdokument herunter

Schritt eins: Navigieren Sie zum Online-OCR-Tool

Um die OCR-Technologie zum Extrahieren von Text aus Bilddateien zu nutzen, navigieren wir zunächst zu dem Online-OCR-Tool für Bilder, das wir verwenden möchten.

Wie man ein Bild in Text umwandelt: Abbildung 1 - Docsumo OCR-Tool

Schritt zwei: Laden Sie Ihr Bild hoch und beginnen Sie mit dem Extraktionsprozess

Mit einem Klick auf die Schaltfläche "Datei hochladen" können wir nun die Bilddatei hochladen, aus der wir den Text extrahieren möchten. Das Tool wird sofort mit der Verarbeitung des Bildes beginnen.

Wie man ein Bild in Text umwandelt: Abbildung 2 - Docsumo - Datei Verarbeitung

Dritter Schritt: Herunterladen der resultierenden Daten als Textdokument

Nachdem die Bearbeitung des Bildes abgeschlossen ist, können wir den extrahierten Text als neues Textdokument herunterladen, um ihn weiter zu verwenden oder zu bearbeiten.

Wie man ein Bild in Text umwandelt: Abbildung 3 - Docsumo - Bildverarbeitung abgeschlossen

Sie können sich die Datei auch ansehen und die verschiedenen Abschnitte markieren, um den darin enthaltenen Text zu lesen. Dies könnte besonders hilfreich sein, wenn Sie den Text in bestimmten Abschnitten nur ansehen möchten. Anschließend können Sie den Text immer noch als Textdokument, XLS oder JSON herunterladen.

Wie man ein Bild in Text umwandelt: Abbildung 4

Erste Schritte mit IronOCR

IronOCR ist eine vielseitige .NET-Bibliothek, die es Ihnen ermöglicht, OCR-Operationen auf Bildern durchzuführen. Mit einer Vielzahl von Funktionen kann es verschiedene Dateiformate (wie PNG, JPEG, TIFF und PDF) verarbeiten, Bildkorrekturen durchführen, spezielle Dokumente scannen (Pässe, Kennzeichen usw.), erweiterte Informationen über die gescannten Dateien bereitstellen, gescannte Dokumente konvertieren und Text hervorheben.

Installieren Sie die IronOCR-Bibliothek

Bevor Sie mit dem Lesen von Bildern mit IronOCR beginnen können, müssen Sie es installieren, falls Sie es nicht bereits in Ihrem Projekt installiert haben. Sie können IronOCR einfach mit NuGet in Visual Studio installieren. Öffnen Sie die NuGet-Paketmanager-Konsole und führen Sie den folgenden Befehl aus:

Install-Package IronOcr
Install-Package IronOcr
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr
$vbLabelText   $csharpLabel

Alternativ können Sie IronOCR über die Seite NuGet Package Manager for Solution installieren, indem Sie nach IronOCR suchen.

Wie man ein Bild in Text umwandelt: Abbildung 5

Um IronOCR in Ihrem Code zu verwenden, stellen Sie sicher, dass Sie die richtige Import-Anweisung am Anfang Ihres Codes haben:

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

Bild in Text umwandeln: Ein einfaches Beispiel

Werfen wir zunächst einen Blick auf ein einfaches Bild-zu-Text-Beispiel mit IronOCR. Dies ist eine Kernfunktion jedes OCR-Tools, und für dieses Beispiel werden wir die PNG-Datei verwenden, die wir für das Online-Tool verwendet haben. In diesem Beispiel haben wir zunächst die IronTesseract-Klasse instanziiert und ihr die Variable 'ocr' zugewiesen. Wir verwenden dann die OcrImageInput-Klasse, um ein neues OcrImageInput-Objekt aus der bereitgestellten Bilddatei zu erstellen. Schließlich wird die Read-Methode verwendet, um den Text aus dem Bild zu lesen, und gibt ein OcrResult-Objekt zurück. Wir können dann den extrahierten Text abrufen und ihn mit ocrResult.Text auf der Konsole anzeigen.

using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

Ausgabe Bild

So konvertieren Sie ein Bild in Text: Abbildung 6

Umgang mit verschiedenen Bildformaten

IronOCR unterstützt mehrere Bildformate wie PNG, JPEG, BMP, GIF und TIFF. Der Prozess zum Lesen von Text aus verschiedenen Bildformaten bleibt derselbe, Sie müssen nur die Datei mit der richtigen Erweiterung laden.

using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.bmp");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.bmp");
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

Verbesserung der OCR-Genauigkeit

Die OCR-Leistung kann durch die Optimierung des Bildes und die Konfiguration von Optionen wie Sprache, Bildauflösung und Rauschgrad des Bildes verbessert werden. So können Sie die OCR-Funktion feinabstimmen, um die Genauigkeit der Textextraktion bei einem Bild zu erhöhen, dessen Qualität durch die Verwendung der DeNoise()- und Sharpen()-Methoden verbessert werden muss:

using IronOcr
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
using IronOcr
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
OcrResult ocrResult = ocr.Read(image);
Console.WriteLine(ocrResult.Text);
Using IronOcr IronTesseract ocr = New IronTesseract()
	Using image As New OcrImageInput("example.png")
		image.DeNoise()
		image.Sharpen()
		Dim ocrResult As OcrResult = ocr.Read(image)
		Console.WriteLine(ocrResult.Text)
	End Using
End Using
$vbLabelText   $csharpLabel

Exportieren des extrahierten Textes

Nachdem wir nun die Grundlagen des Bild-zu-Text-Prozesses kennen, wollen wir uns nun ansehen, wie wir den resultierenden Text zur späteren Verwendung exportieren können. Für dieses Beispiel werden wir den gleichen Prozess wie zuvor verwenden, um das Bild zu laden und es zu scannen. Anschließend erstellen wir mithilfe von File.WriteAllText("output.txt", ocrResult.Text) eine neue Textdatei namens 'output.txt' und speichern den extrahierten Text in dieser Datei.

using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
File.WriteAllText("output.txt", ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
using OcrImageInput image = new OcrImageInput("example.png");
OcrResult ocrResult = ocr.Read(image);
File.WriteAllText("output.txt", ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
Private OcrImageInput As using
Private ocrResult As OcrResult = ocr.Read(image)
File.WriteAllText("output.txt", ocrResult.Text)
$vbLabelText   $csharpLabel

Wie man Bild in Text umwandelt: Abbildung 7

Hauptmerkmale von IronOCR

  1. Hohe Genauigkeit: IronOCR verwendet fortschrittliche Tesseract OCR-Algorithmen und enthält integrierte Werkzeuge zur Verarbeitung komplexer Bilder, um eine hohe Genauigkeit zu gewährleisten.

  2. Mehrsprachige Unterstützung: Unterstützt über 125 Sprachen, einschließlich verschiedener Schriftsysteme wie lateinische, kyrillische, arabische und asiatische Zeichen. Es sollte jedoch beachtet werden, dass neben IronOCR nur Englisch installiert ist. Um andere Sprachen zu verwenden, müssen Sie das zusätzliche Sprachpaket für diese Sprache installieren.

  3. PDF OCR: IronOCR kann Text aus gescannten PDFs extrahieren, was es zu einem wertvollen Werkzeug für die Dokumenten-Digitalisierung macht.

  4. Bildbereinigung: Es bietet Vorverarbeitungstools wie Schräglagenkorrektur, Rauschunterdrückung und Inversion, um die Bildqualität für eine bessere OCR-Genauigkeit zu verbessern.

  5. Einfache Integration: Die API lässt sich nahtlos in jedes .NET-Projekt integrieren, sei es eine Konsolenanwendung, eine Webanwendung oder Desktop-Software.

Häufige Anwendungsfälle für die Umwandlung von Bildern in Text

  • Automatisierung der Dateneingabe: Unternehmen können OCR verwenden, um automatisch Daten aus Formularen, Quittungen oder Visitenkarten zu extrahieren.
  • Dokumentenarchivierung: Organisationen können physische Dokumente digitalisieren, wodurch sie durchsuchbar und einfacher zu lagern werden.
  • Barrierefreiheit: Gedruckte Materialien in Text umwandeln, um sie in Bildschirmlesegeräten oder anderen unterstützenden Technologien zu verwenden.
  • Forschung und Analyse: Scannen Sie schnell Forschungsmaterialien und wandeln Sie sie in Text um, um sie für Analysen oder die Integration in andere Softwaretools zu verwenden.
  • Studie: Konvertieren Sie gescannte Studiennotizen in bearbeitbaren Text, den Sie dann als Word-Dokument speichern können, um ihn in Tools wie IronWord, Microsoft Word oder Google Docs weiter zu bearbeiten.

Schlussfolgerung

Die Konvertierung von Text aus einem Bild mit IronOCR ist eine schnelle, genaue und effiziente Methode, um Aufgaben der Dokumentenverarbeitung zu erledigen. Egal, ob Sie mit gescannten Dokumenten, digitalen Bildern oder PDF-Dokumenten arbeiten, IronOCR vereinfacht den Prozess und bietet hohe Genauigkeit, mehrsprachige Unterstützung und leistungsstarke Bildverarbeitungstools. Dieses Tool ist ideal für Unternehmen, die ihre Dokumentenmanagement-Workflows rationalisieren, die Datenextraktion automatisieren oder die Zugänglichkeit verbessern möchten.

Nutzen Sie die kostenlose Testversion, um die leistungsstarken Funktionen von IronOCR noch heute selbst auszuprobieren. Es dauert nur wenige Minuten, um es vollständig in Ihrem Arbeitsbereich einzurichten, damit Sie in kürzester Zeit mit der Verarbeitung von OCR-Aufgaben beginnen können!

Kannaopat Udonpant
Software-Ingenieur
Bevor er Software-Ingenieur wurde, promovierte Kannapat an der Universität Hokkaido in Japan im Bereich Umweltressourcen. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Abteilung für Bioproduktionstechnik ist. Im Jahr 2022 wechselte er mit seinen C#-Kenntnissen zum Engineering-Team von Iron Software, wo er sich auf IronPDF konzentriert. Kannapat schätzt an seiner Arbeit, dass er direkt von dem Entwickler lernt, der den Großteil des in IronPDF verwendeten Codes schreibt. Neben dem kollegialen Lernen genießt Kannapat auch den sozialen Aspekt der Arbeit bei Iron Software. Wenn er nicht gerade Code oder Dokumentationen schreibt, kann man Kannapat normalerweise beim Spielen auf seiner PS5 oder beim Wiedersehen mit The Last of Us antreffen.
< PREVIOUS
Easyocr vs Tesseract (Vergleich der OCR-Funktionen)
NÄCHSTES >
Quittungs-OCR-Bibliothek (Liste für Entwickler)