Zum Fußzeileninhalt springen
OCR-WERKZEUGE

Wie man Bilder in Text umwandelt

In der aktuellen digitalen Ära ist die Umwandlung von bildbasierten Inhalten in leicht lesbaren, bearbeitbaren und durchsuchbaren Text entscheidend. Dies ist besonders wichtig in Szenarien wie der Archivierung von papierbasierten Dokumenten, der Extraktion von wichtigen Informationen aus Bildern oder der Digitalisierung von gedruckten Materialien. Die Technologie der optischen Zeichenerkennung (OCR) bietet eine Lösung, um diesen Umwandlungsprozess zu automatisieren. Ein sehr zuverlässiges und effizientes Tool, um dies zu erreichen, ist IronOCR, eine robuste OCR-Bibliothek für .NET.

Dieser Artikel wird erläutern, wie man mit IronOCR ein Bild in Text umwandelt, und erkunden, wie diese Umwandlung Zeit sparen, Fehler reduzieren und Prozesse wie Datenextraktion, Archivierung und Dokumentenverarbeitung optimieren kann.

Wie verwandelt man ein Bild in Text

  1. Laden Sie eine C#-Bibliothek für OCR-Arbeiten herunter
  2. Erstellen Sie eine neue IronTesseract-Instanz
  3. Laden Sie Ihr Bild mit OcrImageInput
  4. Lesen Sie den Inhalt des Bildes mit OcrRead
  5. Exportieren Sie die OCR-Ergebnisse in eine Textdatei

Warum ein Bild in Text umwandeln?

Es gibt viele Gründe, warum man ein Bild in Text umwandeln möchte, darunter:

  • Datenextraktion: Extrahieren von Text aus gescannten Dokumenten und Bildern für Archivierungs- oder Datenverarbeitungszwecke.
  • Bearbeiten gescannter Inhalte: Bearbeiten oder Aktualisieren von Text in zuvor gescannten Dokumenten, um die Zeit des manuellen Neu-Eintippens des Inhalts zu sparen.
  • Verbesserung der Zugänglichkeit: Umwandlung von gedrucktem Material in digitalen Text, um es für Screenreader oder Text-to-Speech-Anwendungen zugänglich zu machen.
  • Automatisierung: Automatisieren der Dateneingabe und -verarbeitung, indem Text von Rechnungen, Quittungen oder Visitenkarten gelesen wird.

Wie fängt man an, Bilder in Text umzuwandeln

Bevor wir erkunden, wie IronOCRs leistungsstarke Bild-zu-Text-Fähigkeiten genutzt werden können, um Text aus Bildern zu extrahieren, werfen wir zunächst einen Blick auf den allgemeinen Schritt-für-Schritt-Prozess mit einem Online-Tool wie Docsumo. Online-OCR-Tools sind eine hilfreiche Option für diejenigen, die gelegentliche oder sogar einmalige OCR-Aufgaben durchführen möchten, dank ihrer Einfachheit ohne jegliche manuelle Einrichtung. Natürlich, wenn Sie regelmäßig OCR-Aufgaben erledigen müssen, könnte ein leistungsstarkes OCR-Tool wie IronOCR besser für Sie funktionieren.

  1. Navigieren Sie zum Online-OCR-Tool
  2. Laden Sie Ihr Bild hoch und starten Sie den Extraktionsprozess
  3. Laden Sie die resultierenden Daten als Textdokument herunter

Schritt Eins: Navigieren Sie zum Online-OCR-Tool

Um mit der Nutzung von OCR-Technologie Text aus Bilddateien zu extrahieren zu beginnen, navigieren wir zuerst zu dem Online-Bild-OCR-Tool, das wir verwenden möchten.

Wie man ein Bild in Text umwandelt: Abbildung 1 - Docsumo OCR Tool

Schritt Zwei: Laden Sie Ihr Bild hoch und beginnen Sie den Extraktionsprozess

Nun, durch Klicken auf die Schaltfläche 'Datei hochladen', können wir die Bilddatei hochladen, aus der wir Text extrahieren möchten. Das Tool wird umgehend mit der Verarbeitung des Bildes beginnen.

Wie man ein Bild in Text umwandelt: Abbildung 2 - Docsumo - Datei wird verarbeitet

Schritt Drei: Laden Sie die resultierenden Daten als Textdokument herunter

Jetzt, da das Bild verarbeitet wurde, können wir den extrahierten Text als neues Textdokument herunterladen, zur weiteren Nutzung oder Bearbeitung.

Wie man ein Bild in Text umwandelt: Abbildung 3 - Docsumo - Bildverarbeitung abgeschlossen

Sie können die Datei auch anzeigen, um die verschiedenen Abschnitte hervorzuheben und den darin enthaltenen Text anzuzeigen. Dies könnte besonders hilfreich sein, wenn Sie nur den Text in bestimmten Abschnitten ansehen möchten. Dann können Sie den Text immer noch als Textdokument, XLS oder JSON herunterladen.

Wie man ein Bild in Text umwandelt: Abbildung 4

Einstieg mit IronOCR

IronOCR ist eine vielseitige .NET-Bibliothek, die es Ihnen ermöglicht, OCR-Operationen auf Bildern durchzuführen. Mit einer Vielzahl von Funktionen kann es verschiedene Dateiformate (wie PNG, JPEG, TIFF und PDF) verarbeiten, Bildkorrekturen durchführen, spezielle Dokumente scannen (Pässe, Kennzeichen usw.), erweiterte Informationen über die gescannten Dateien bereitstellen, gescannte Dokumente konvertieren und Text hervorheben.

Installation der IronOCR-Bibliothek

Bevor Sie anfangen können, Bilder mit IronOCR zu lesen, müssen Sie es installieren, wenn es noch nicht in Ihrem Projekt installiert ist. Sie können IronOCR einfach mit NuGet in Visual Studio installieren. Öffnen Sie die NuGet-Pakete-Verwaltungskonsole und führen Sie den folgenden Befehl aus:

Install-Package IronOcr

Alternativ können Sie IronOCR über den NuGet-Paketmanager für die Lösungseite installieren, indem Sie nach IronOCR suchen.

Wie man ein Bild in Text umwandelt: Abbildung 5

Um IronOCR in Ihrem Code zu verwenden, stellen Sie sicher, dass Sie die richtige Import-Anweisung am Anfang Ihres Codes haben:

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

Bild zu Text konvertieren: Ein einfaches Beispiel

Lassen Sie uns mit einem einfachen Beispiel zur Bild-zu-Text-Konvertierung mit IronOCR beginnen. Dies ist eine Kernfunktionalität eines jeden OCR-Tools, und für dieses Beispiel werden wir die PNG-Datei verwenden, die wir bereits für das Online-Tool genutzt haben. In diesem Beispiel haben wir zuerst die IronTesseract-Klasse instanziiert und die Variable ocr zugewiesen. Dann verwenden wir die OcrImageInput-Klasse, um ein neues OcrImageInput-Objekt aus der bereitgestellten Bilddatei zu erstellen. Schließlich wird die Read-Methode verwendet, um den Text aus dem Bild zu lesen und ein OcrResult-Objekt zurückzugeben. Wir können dann auf den extrahierten Text zugreifen und ihn mit ocrResult.Text an die Konsole ausgeben.

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr

Private ocr As New IronTesseract()

' Load the image from which to extract text
Private OcrImageInput As using

' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)

' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

Ausgabebild

Wie man ein Bild in Text umwandelt: Abbildung 6

Umgang mit verschiedenen Bildformaten

IronOCR unterstützt mehrere Bildformate wie PNG, JPEG, BMP, GIF und TIFF. Das Verfahren, um Text aus verschiedenen Bildformaten zu lesen, bleibt gleich, Sie müssen nur die Datei mit der richtigen Erweiterung laden.

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr

Private ocr As New IronTesseract()

' Load a BMP image
Private OcrImageInput As using

' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)

' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

Verbesserung der OCR-Genauigkeit

Die Leistung von OCR kann durch Optimierung des Bildes und Konfiguration von Optionen wie Sprache, Bildauflösung und dem Rauschlevel im Bild verbessert werden. Hier ist, wie Sie OCR feinabstimmen können, um die Genauigkeit der Textextraktion zu erhöhen, wenn die Bildqualität durch die Verwendung der DeNoise() und Sharpen() Methoden verbessert werden muss:

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr

Private ocr As New IronTesseract()

' Load the image and apply image processing to improve accuracy
Private OcrImageInput As using
image.DeNoise()
image.Sharpen()

' Perform OCR to extract text
Dim ocrResult As OcrResult = ocr.Read(image)

' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

Exportieren des extrahierten Textes

Nun, da wir die Grundlagen des Bild-zu-Text-Prozesses kennen, schauen wir uns an, wie wir den resultierenden Text für die spätere Verwendung exportieren können. Für dieses Beispiel werden wir denselben Prozess wie zuvor verwenden, um das Bild zu laden und zu scannen. Dann erstellen wir mit File.WriteAllText("output.txt", ocrResult.Text) eine neue Textdatei namens output.txt und speichern den extrahierten Text in der Datei.

using IronOcr;
using System.IO;

IronTesseract ocr = new IronTesseract();

// Load the image
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
using IronOcr;
using System.IO;

IronTesseract ocr = new IronTesseract();

// Load the image
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
Imports IronOcr
Imports System.IO

Private ocr As New IronTesseract()

' Load the image
Private OcrImageInput As using

' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)

' Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text)
$vbLabelText   $csharpLabel

Wie man ein Bild in Text umwandelt: Abbildung 7

Schlüsselfunktionen von IronOCR

  1. Hohe Genauigkeit: IronOCR verwendet fortgeschrittene Tesseract OCR-Algorithmen und beinhaltet werkseitig eingebaute Tools, um komplexe Bilder zu bearbeiten und eine hohe Genauigkeit sicherzustellen.
  2. Mehrsprachige Unterstützung: Unterstützt 125+ Sprachen, darunter mehrere Schriftsysteme wie lateinisch, kyrillisch, arabisch und asiatische Schriftzeichen. Es sollte jedoch beachtet werden, dass nur Englisch zusammen mit IronOCR installiert ist. Um andere Sprachen zu verwenden, müssen Sie das zusätzliche Sprachpaket für diese Sprache installieren.
  3. PDF OCR: IronOCR kann Text aus gescannten PDFs extrahieren, was es zu einem wertvollen Tool für die Dokumentendigitalisierung macht.
  4. Image Cleanup: It provides pre-processing tools such as de-skewing, noise removal, and inversion to improve image quality for better OCR accuracy.
  5. Einfache Integration: Die API lässt sich nahtlos in jedes .NET-Projekt integrieren, sei es eine Konsolenanwendung, eine Webanwendung oder eine Desktop-Software.

Häufige Anwendungsfälle für die Umwandlung von Bildern in Text

  • Automatisierte Dateneingabe: Unternehmen können OCR verwenden, um automatisch Daten aus Formularen, Quittungen oder Visitenkarten zu extrahieren.
  • Dokumentenarchivierung: Organisationen können physische Dokumente digitalisieren, um sie durchsuchbar und leichter zu lagern.
  • Zugänglichkeit: Gedruckte Materialien in Text umwandeln, um sie für Screenreader oder andere unterstützende Technologien nutzbar zu machen.
  • Forschung und Analyse: Schnell gescanntes Forschungsmaterial in Text umwandeln, um es zur Analyse oder Integration in andere Software-Tools zu verwenden.
  • Studium: Gescannte Studiennotizen in bearbeitbaren Text umwandeln, den Sie dann als Word-Dokument speichern können, um ihn weiter in Tools wie IronWord, Microsoft Word oder Google Docs zu bearbeiten.

Abschluss

Text aus einem Bild mit IronOCR zu extrahieren ist eine schnelle, genaue und effiziente Möglichkeit, Dokumentverarbeitungsaufgaben zu erledigen. Egal, ob Sie mit gescannten Dokumenten, digitalen Bildern oder PDF-Dokumenten arbeiten, IronOCR vereinfacht den Prozess, bietet hohe Genauigkeit, mehrsprachige Unterstützung und leistungsstarke Bildverarbeitungstools. Dieses Tool ist ideal für Unternehmen, die ihre Dokumentenmanagement-Workflows optimieren, die Datenextraktion automatisieren oder die Zugänglichkeit verbessern möchten.

Nutzen Sie die kostenlose Testversion, um die leistungsstarken Funktionen von IronOCR selbst auszuprobieren. Es dauert nur wenige Minuten, um es vollständig in Ihrer Arbeitsumgebung einsatzbereit zu machen, sodass Sie im Handumdrehen mit OCR-Aufgaben beginnen können!

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen