OCR-WERKZEUGE

OCR Foto (Einsteiger-Tutorial)

Kannaopat Udonpant
Kannapat Udonpant
12. Dezember 2023
Teilen Sie:

Einführung

Die Technologie der optischen Zeichenerkennung (OCR) hat die Art und Weise revolutioniert, wie wir im digitalen Zeitalter mit Texten interagieren. OCR-Photo-Tools ermöglichen die Umwandlung von Bildern in Text, was die Digitalisierung von gedruckten Notizen erleichtert.

In diesem Artikel werden wir vier Online-OCR-Tools - sowohl kostenlose als auch kostenpflichtige - untersuchen und mit einer Einführung in IronOCR abschließen, die zeigt, wie OCR programmatisch in C# implementiert werden kann.

1. Google Vision API

Google Vision API bietet eine leistungsstarke OCR-Lösung, die von Google bereitgestellt wird, um einen Bild-zum-Text-Konverter zu erstellen. Es unterstützt die Extraktion von Bild- und PDF-Text und kann Text in mehreren Sprachen erkennen.

OCR Foto (Einsteiger-Tutorial): Abbildung 1

Profis

  • Hohe Genauigkeit
  • Unterstützung von Sprachen
  • Integration mit anderen Google Cloud-Diensten.

Nachteile

  • Erfordert API-Schlüssel
  • Ab einer bestimmten Nutzungsschwelle nicht mehr völlig kostenlos.

Schritt 1 Beziehen des API-Schlüssels

  • Besuchen Sie die Google Cloud Console.
  • Erstellen Sie ein neues Projekt oder wählen Sie ein bestehendes Projekt aus.
  • Aktivieren Sie die Cloud Vision API und generieren Sie einen API-Schlüssel.

Schritt 2 API-Anfrage stellen

  • Verwenden Sie ein Tool wie cURL oder eine Programmiersprache Ihrer Wahl, um eine HTTP-POST-Anfrage zu stellen.
  • Fügen Sie die Bilddatei oder die URL in die Nutzdaten der Anfrage ein.
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"

Schritt 3 Analysieren der Ergebnisse

  • Extrahieren Sie den erkannten Text aus der API-Antwort.
{
  "responses": [
    {
      "textAnnotations": [
        {
          "description": "Hello World!",
          "boundingPoly": { /* bounding box coordinates */ }
        }
      ]
    }
  ]
}

2. Tesseract OCR

Tesseract ist eine Open-Source-OCR-Engine, die von Google entwickelt wurde. Es unterstützt über 100 Sprachen und wird aufgrund seiner Genauigkeit und Flexibilität häufig verwendet. Es hilft, Bilder aus verschiedenen Dateiformaten zu konvertieren und sogar gescannte Bilder in bearbeitbaren Text umzuwandeln.

OCR Foto (Einsteiger-Tutorial): Abbildung 2

Profis

  • Open-Source
  • Hohe Genauigkeit
  • Unterstützung durch die Gemeinschaft

Nachteile

  • Kann zusätzliche Tools für die Integration erfordern
  • Für optimale Ergebnisse ist möglicherweise eine Bildvorverarbeitung erforderlich.

Schritt 1 Tesseract installieren

  • Laden Sie Tesseract OCR aus dem offiziellen GitHub-Repository herunter und installieren Sie es.
  • Fügen Sie den Tesseract-Ordner zur Umgebungsvariablen Path hinzu, um von jedem beliebigen Punkt des Terminals aus darauf zugreifen zu können.

Schritt 2 OCR auf dem Bild ausführen

  • Öffnen Sie ein Terminal und navigieren Sie zu dem Ordner, der das Bild enthält.
  • Führen Sie den folgenden Befehl aus:
tesseract path/to/your/image.jpg output.txt
tesseract path/to/your/image.jpg output.txt
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'tesseract path/@to/your/image.jpg output.txt
$vbLabelText   $csharpLabel

Schritt 3 Ergebnisse anzeigen

  • Öffnen Sie die generierte Textdatei (output.txt), um den extrahierten Text zu sehen.

3. ABBYY FineReader Online

ABBYY FineReader Online ist ein cloudbasierter OCR-Dienst, der es Nutzern ermöglicht, gescannte Dokumente und Bilder in bearbeitbare Formate zu konvertieren.

Dieses Online-Tool bietet einen kostenlosen OCR-basierten Textkonverter, mit dem Sie problemlos Text aus Bildern extrahieren können.

OCR Foto (Beginner-Tutorial): Abbildung 3

Profis

  • Benutzerfreundliches OCR-Tool für Bilder
  • Unterstützt verschiedene Eingabeformate
  • Behält die Formatierung des Dokuments bei

Nachteile

  • Begrenzte freie Nutzung
  • Internetverbindung erforderlich

Schritt 1 Besuchen Sie ABBYY FineReader Online

  • Gehen Sie zur ABBYY FineReader Online Website.
  • Laden Sie die kostenlose Testversion für Windows oder Mac herunter.
  • Installieren Sie die Software und befolgen Sie die angegebenen Schritte.

Schritt 2 Bild hochladen

  • Klicken Sie auf die Schaltfläche "Datei auswählen" und laden Sie Ihr Bild hoch.

Schritt 3 Bild verarbeiten

  • Warten Sie, bis das Bild verarbeitet ist. Das Tool extrahiert den Text automatisch.

Schritt 4 Text bearbeiten

  • Speichern Sie den extrahierten Text oder verwenden Sie den Editor, um die notwendigen Korrekturen vorzunehmen
  • Speichern in den Formaten Word, Excel und Text.

4. Online-OCR

Online OCR ist ein webbasierter OCR-Dienst, der mehrere Sprachen für die Online-Bild-zu-Text-Konvertierung unterstützt. Die Nutzer können Bilder direkt von ihren Geräten hochladen oder URLs angeben.

Profis

  • Einfache Benutzeroberfläche
  • Unterstützt verschiedene Eingabeformate
  • Kostenlose Nutzung mit Einschränkungen

Nachteile

  • Eingeschränkte kostenlose Funktionen
  • Abhängig von der Internetkonnektivität

Schritt 1 Besuchen Sie Online OCR

Gehen Sie zur Online OCR-Website.

Schritt 2 Bild hochladen

Klicken Sie auf die Schaltfläche "Datei auswählen" und laden Sie Ihr Bild hoch.

OCR Foto (Einsteiger-Tutorial): Abbildung 4

Schritt 3 Sprache und Ausgabeformat wählen

Wählen Sie die Sprache und das Ausgabeformat für den Text im Bild.

OCR Foto (Anfänger-Tutorial): Abbildung 5

Schritt 4 OCR starten

Klicken Sie auf die Schaltfläche "Konvertieren", um den OCR-Prozess zu starten.

Schritt 5 Text herunterladen

Sobald der Vorgang abgeschlossen ist, laden Sie den extrahierten Text über den angegebenen Link herunter.

OCR Foto (Einsteiger-Tutorial): Abbildung 6

Einführung in IronOCR in C#

Jetzt wollen wir uns IronOCR ansehen, eine leistungsstarke OCR-Bibliothek für C#, die Entwicklern die Werkzeuge zur nahtlosen Implementierung von OCR-Funktionen an die Hand gibt. IronOCR ist eine führende OCR-Bibliothek für C#, die vom Iron Software-Team entwickelt wurde.

IronOCR zeichnet sich als eine robuste Optical Character Recognition (OCR) Bibliothek aus, die speziell für C#-Entwickler entwickelt wurde und eine leistungsstarke Suite von Funktionen für die genaue und nahtlose Textextraktion aus Bildern bietet.

IronOCR ist für seine Zuverlässigkeit und Effizienz bekannt und hat unter C#-Entwicklern, die eine umfassende Lösung für die Textextraktion aus Bildern und Dokumenten suchen, an Beliebtheit gewonnen.

IronOCR hat sich mit seinem Schwerpunkt auf Genauigkeit und Vielseitigkeit zu einer ersten Wahl für Projekte entwickelt, die von Dokumentenmanagementsystemen bis zu Datenextraktionsanwendungen reichen.

IronOCR nutzt fortschrittliche OCR-Algorithmen und ist in der Lage, Text aus verschiedenen Bildformaten, einschließlich JPEG, PNG und TIFF, präzise zu entziffern. Seine Vielseitigkeit erstreckt sich auch auf die Unterstützung mehrerer Sprachen, was es zu einem wertvollen Werkzeug für Anwendungen macht, die unterschiedlichen sprachlichen Anforderungen gerecht werden müssen.

Diese Bibliothek lässt sich nahtlos in gängige .NET-Frameworks integrieren und rationalisiert die Implementierung von OCR-Funktionen in C#-Anwendungen.

Egal, ob Sie mit gescannten Dokumenten oder Bildern arbeiten, die umfassenden Funktionen von IronOCR ermöglichen es Entwicklern, OCR-Funktionen mühelos in ihre Projekte einzubinden.

IronOCR-Funktionen im Detail

  1. Erweiterte OCR-Algorithmen: IronOCR verwendet hochentwickelte OCR-Algorithmen, die über die grundlegende Zeichenerkennung hinausgehen und selbst in komplexen Szenarien eine hohe Genauigkeit gewährleisten.

  2. Unterstützung für Bildformate: Entwickler können die Unterstützung von IronOCR für eine Vielzahl von Bildformaten wie JPEG, PNG und TIFF nutzen, um Flexibilität im Umgang mit unterschiedlichsten visuellen Inhalten zu gewährleisten.

  3. Mehrsprachige Unterstützung: In Anerkennung der globalen Natur von Anwendungen ist IronOCR mit mehrsprachiger Unterstützung ausgestattet, die das präzise Extrahieren von Texten in verschiedenen Sprachen ermöglicht.

  4. PDF-Textraktextraktion: Zusätzlich zu Bildern erweitert IronOCR seine Fähigkeiten zur Textextraktion aus PDF-Dokumenten, was seine Anwendbarkeit in Szenarien verbessert, in denen Dokumente in digitalen Formaten gespeichert sind.

  5. Integration mit .NET-Frameworks: IronOCR integriert sich nahtlos in beliebte .NET-Frameworks, was es C#-Entwicklern leicht macht, OCR-Funktionalität in ihre Projekte zu integrieren, ohne dass umfangreiche Konfigurationen erforderlich sind.

Implementierung von OCR mit IronOCR in C#;

Im Folgenden sehen Sie ein einfaches Beispiel für die Verwendung von IronOCR in C#, um Text aus einem Bild zu extrahieren:

using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
Imports IronOcr
Private imageText As String = (New IronTesseract()).Read("images\image.png").Text
$vbLabelText   $csharpLabel

Dieses einfache C#-Codefragment zeigt, wie IronOCR zum Lesen von Text aus einer Bilddatei verwendet werden kann. Die Entwickler können den OCR-Prozess weiter an ihre spezifischen Anforderungen anpassen.

Für detaillierte Informationen über die erweiterte Funktionalität von IronOCR besuchen Sie bitte die Seite der Dokumentation.

Schlussfolgerung

OCR-Fototools spielen eine wichtige Rolle bei der Digitalisierung von Textinhalten aus Bildern. IronOCR bietet Entwicklern eine leistungsstarke und flexible Lösung für die Integration von OCR-Funktionen in ihre C#-Anwendungen, während verschiedene Online-Tools Komfort bieten.

Die Wahl zwischen Online-Tools und programmatisch implementierten Bibliotheken hängt von Faktoren wie Genauigkeitsanforderungen, Anpassungsbedarf und dem Grad der Kontrolle ab, den Entwickler über den OCR-Prozess wünschen.

IronOCR bietet eine kostenlose Testversion an. Laden Sie die Software von hier herunter.

Kannaopat Udonpant
Software-Ingenieur
Bevor er Software-Ingenieur wurde, promovierte Kannapat an der Universität Hokkaido in Japan im Bereich Umweltressourcen. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Abteilung für Bioproduktionstechnik ist. Im Jahr 2022 wechselte er mit seinen C#-Kenntnissen zum Engineering-Team von Iron Software, wo er sich auf IronPDF konzentriert. Kannapat schätzt an seiner Arbeit, dass er direkt von dem Entwickler lernt, der den Großteil des in IronPDF verwendeten Codes schreibt. Neben dem kollegialen Lernen genießt Kannapat auch den sozialen Aspekt der Arbeit bei Iron Software. Wenn er nicht gerade Code oder Dokumentationen schreibt, kann man Kannapat normalerweise beim Spielen auf seiner PS5 oder beim Wiedersehen mit The Last of Us antreffen.
< PREVIOUS
Beste kostenlose OCR-Software für Entwickler
NÄCHSTES >
Arabische Texterkennungs-Tools: Verbesserung der Genauigkeit