OCR-WERKZEUGE

Einscannen von Schrift in Text (Anleitung für Anfänger)

Veröffentlicht 29. November 2023
Teilen Sie:

Einführung

In der Welt der digitalen Informationen ist die Fähigkeit, handschriftlichen oder gedruckten Text aus gescannten Dokumenten in bearbeitbare und durchsuchbare Formate zu konvertieren, von größter Bedeutung. Optische Zeichenerkennung (OCR) technologie hat in diesem Prozess eine Schlüsselrolle gespielt, da sie die Extraktion von Textinformationen aus Bildern ermöglicht.

In diesem Artikel werden wir die Grundlagen von Scan Writing to Text mit Tesseract, einer Open-Source-OCR-Engine, erforschen und später die IronOCR als leistungsstarke Alternative mit fortschrittlichen Funktionen zur Umwandlung von Handschrift, digitalem Text und gescannten Dokumenten in bearbeitbaren Text mit einem Codebeispiel.

Verständnis der OCR-Technologie

Bei der OCR-Technologie werden hochentwickelte Algorithmen eingesetzt, um die Muster gedruckter oder handschriftlicher Zeichen in einem Bild zu erkennen und zu interpretieren. Sie überbrückt im Wesentlichen die Kluft zwischen der physischen und der digitalen Welt und ermöglicht es uns, Text aus einer Vielzahl von Quellen zu erfassen und zu digitalisieren, darunter gescannte Dokumente, gescannte Handschrift, PDF-Dateien, gescannte Bilddateien und sogar erkannte Handschrift.

Tesseract: Eine Open-Source OCR-Lösung

Tesseract verstehen

Tesseraktist eine von Google entwickelte Open-Source-OCR-Engine, die weithin für die Umwandlung verschiedener Arten von gescannten Dokumenten, einschließlich handgeschriebenem Text, gescannten Bildern und PDF-Dokumenten, in maschinenlesbaren, editierbaren Text verwendet wird. Es unterstützt mehrere Sprachen und ist aufgrund seiner Genauigkeit und Vielseitigkeit sehr beliebt. Lassen Sie uns einen Blick auf die wichtigsten Funktionen und Schritte bei der Verwendung von Tesseract für Scan Writing to Text werfen.

Hauptmerkmale von Tesseract

  1. Vielseitigkeit: Tesseract unterstützt eine breite Palette von Eingabeformaten und eignet sich daher für verschiedene Anwendungen, darunter gescannte Dokumente, Bilder und PDF-Dateien.

  2. Sprachunterstützung: Tesseract ist darauf ausgelegt, Text in mehreren Sprachen zu erkennen, was es zu einer flexiblen Lösung für internationale Benutzer und Entwickler macht, die mit Dokumenten in unterschiedlichen sprachlichen Kontexten arbeiten.

  3. Open-Source-Gemeinschaft: Der Open-Source-Charakter von Tesseract hat zu einer starken Gemeinschaft von Entwicklern geführt, die zur Verbesserung des Programms beitragen. Regelmäßige Aktualisierungen und Erweiterungen sorgen dafür, dass Tesseract eine wettbewerbsfähige OCR-Lösung bleibt.

  4. OCR-Genauigkeit: Tesseract ist bekannt für seine Genauigkeit bei der Erkennung von Text, selbst in komplexen Szenarien mit unterschiedlichen Schriftarten, Stilen und Bildqualitäten.

Schritte zur Verwendung von Tesseract

Die Verwendung von Tesseract OCR zur Konvertierung handschriftlicher Notizen oder zur Entzifferung unleserlicher Handschrift in Windows erfordert einige Schritte. Hier ist ein grundlegender Leitfaden:

  1. Installieren Sie Tesseract OCR:

    • Laden Sie den Tesseract-Installer für Windows aus dem offiziellen GitHub-Repository der UB Mannheim herunter: Tesseract OCR exe.

    • Starten Sie das Installationsprogramm und folgen Sie den Anweisungen auf dem Bildschirm, um die Installation abzuschließen.

    Installieren Sie Tesseract mit dem Tesseract OCR-Installationsprogramm.

    • Wählen Sie den Speicherort aus und merken Sie sich den Installationspfad, da dieser später in der Variablen Path verwendet wird.

    Wählen Sie den Zielordner für die Installation von Tesseract auf Ihrem System.

  2. Einrichten von Umgebungsvariablen:

    • Fügen Sie das Tesseract-Installationsverzeichnis zur Umgebungsvariablen PATH des Systems hinzu. Dadurch wird sichergestellt, dass die ausführbare Datei Tesseract von jedem Eingabeaufforderungsfenster aus aufgerufen werden kann.

    Fügen Sie in den Systemeigenschaften den Pfad zum Tesseract-Installationsverzeichnis zu den PATH-Umgebungsvariablen des Systems hinzu. Dadurch wird sichergestellt, dass die ausführbare Datei Tesseract von jedem Eingabeaufforderungsfenster aus aufgerufen werden kann.Klicken Sie auf die Schaltfläche Umgebungsvariablen. Klicken Sie im Fenster Umgebungsvariablen auf Systemvariablen bearbeiten.Klicken Sie auf der Registerkarte Umgebungsvariable bearbeiten auf die Schaltfläche Neu und geben Sie den Pfad zum Tesseract-Verzeichnis ein. Klicken Sie auf OK.

  3. Verwendung der Befehlszeile:

    • Öffnen Sie ein Eingabeaufforderungsfenster und navigieren Sie zu dem Verzeichnis, das Ihre Bilder oder gescannten handschriftlichen Dokumente enthält.

    • Verwenden Sie den folgenden Befehl, um OCR an einem Bild durchzuführen und das Ergebnis in eine Textdatei auszugeben:
    tesseract input_image.png output_text.txt
    tesseract input_image.png output_text.txt
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'tesseract input_image.png output_text.txt
VB   C#

Ersetzen Sie input_image.png durch den Namen Ihrer Bilddatei und output_text.txt durch den gewünschten Namen für die Ausgabetextdatei.

  1. Nachbearbeitung: Je nach den Anforderungen können Nachbearbeitungsschritte erforderlich sein, um den extrahierten Text zu verfeinern, z. B. durch das Entfernen unnötiger Zeichen oder Formatierungen.

    Obwohl Tesseract ein leistungsstarkes Werkzeug ist, suchen Entwickler oft nach Alternativen, die zusätzliche Funktionen, Anpassungsmöglichkeiten und eine einfache Integration in ihre Anwendungen bieten. Dies ist der Ort, an dem IronOCR ins Spiel kommt.

IronOCR: Scan-Schreiben in Text verwandeln

IronOCR verstehen

IronOCR ist eine .NET OCR-Bibliothek, die über die Möglichkeiten von Tesseract hinausgeht und Entwicklern erweiterte Funktionen und Anpassungsmöglichkeiten bietet. Egal, ob Sie mit gescannten Dokumenten, Bildern oder gescannten PDFs arbeiten, IronOCR bietet eine robuste Lösung für die genaue Textextraktion. Sehen wir uns die wichtigsten Funktionen von IronOCR an und wie es den Scan Writing to Text-Prozess verbessern kann.

Hauptmerkmale von IronOCR

  1. Genauigkeit: IronOCR nutzt modernste OCR-Algorithmen, die eine hohe Genauigkeit bei der Texterkennung gewährleisten. Sie eignet sich hervorragend für schwierige Szenarien, wie z. B. Bilder von geringer Qualität oder komplexe Schriftarten.

  2. Vielseitigkeit: IronOCR unterstützt verschiedene Eingabeformate, darunter Bilder und PDF-Dateien, und passt sich so an unterschiedliche Anwendungsfälle an, was es zu einer vielseitigen Wahl für Entwickler macht.

  3. Sprachunterstützung: IronOCR richtet sich an ein globales Publikum, da es mehrere internationale Sprachen unterstützt und so eine effektive OCR-Verarbeitung für Dokumente in verschiedenen Sprachkontexten gewährleistet.

  4. Leichte Integration: Eines der herausragenden Merkmale von IronOCR ist seine nahtlose Integration in .NET-Anwendungen. Entwickler können IronOCR problemlos in ihre Projekte einbinden, was eine effiziente Implementierung von OCR-Funktionen ermöglicht.

IronOCR: Ein Codebeispiel

Lassen Sie uns eine einfache EisenTesserakt 5 codeschnipsel für die Verwendung von IronOCR in einer .NET-Anwendung:

using IronOcr;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();

    // This is done by default and can be omitted:
    // ocrTesseract.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

    using (var ocrInput = new OcrInput(@"images\image.png"))
    {
        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
    }
}
using IronOcr;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();

    // This is done by default and can be omitted:
    // ocrTesseract.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

    using (var ocrInput = new OcrInput(@"images\image.png"))
    {
        var ocrResult = ocrTesseract.Read(ocrInput);
        Console.WriteLine(ocrResult.Text);
    }
    }
}
Imports IronOcr

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()

	' This is done by default and can be omitted:
	' ocrTesseract.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

	Using ocrInput As New OcrInput("images\image.png")
		Dim ocrResult = ocrTesseract.Read(ocrInput)
		Console.WriteLine(ocrResult.Text)
	End Using
	End Sub
End Class
VB   C#

In diesem Beispiel bietet IronOCR einen einfacheren und objektorientierten Ansatz, der es Entwicklern ermöglicht, gedruckten oder handgeschriebenen Text direkt aus dem Bild mit der effizienten IronTesseract 5 OCR-Engine zu lesen. Für weitere Informationen besuchen Sie bitte die dokumentation seite.

Fazit

Tesseract bleibt zwar eine robuste Open-Source-OCR-Engine, IronOCR bietet erweiterte Funktionen, Anpassungsoptionen und eine einfache Integration für Entwickler, die innerhalb des .NET-Ökosystems arbeiten. Die Wahl zwischen Tesseract und IronOCR hängt von den spezifischen Anforderungen des Projekts und dem gewünschten Grad der Kontrolle über den OCR-Prozess ab. Da die Nachfrage nach präziser Textextraktion aus gescannten Dokumenten weiter steigt, spielen OCR-Tools wie IronOCR eine entscheidende Rolle bei der Gestaltung der Zukunft der Informationszugänglichkeit und des digitalen Dokumentenmanagements.

IronOCR bietet eine kostenloser Test für Benutzer, um die fortschrittlichen OCR-Funktionen zu testen, während eine kommerzielle lizenz ist für die berufliche und gewerbliche Nutzung erforderlich. Um das volle Potenzial von IronOCR auszuschöpfen, laden Sie die Softwarebibliothek direkt von der offizielle Website.

< PREVIOUS
Arabische Texterkennung (kostenlos & Online-Tools)
NÄCHSTES >
Wie man eine OCR in Python erstellt

Sind Sie bereit, loszulegen? Version: 2024.10 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 2,561,036 Lizenzen anzeigen >