Zum Fußzeileninhalt springen
OCR-WERKZEUGE

OCR Foto (Anfängertutorial)

Die Technologie zur optischen Zeichenerkennung (OCR) hat die Art und Weise revolutioniert, wie wir mit Text in der digitalen Welt interagieren. OCR-Fotowerkzeuge ermöglichen die Fähigkeit, Bilder in Text umzuwandeln, was das Digitalisieren gedruckter Notizen erleichtert.

In diesem Artikel werden wir vier Online-OCR-Tools erkunden - sowohl kostenlose als auch kostenpflichtige - und mit einer Einführung in IronOCR abschließen, die zeigt, wie OCR programmatisch in C# implementiert werden kann.

1. Google Vision API

Google Vision API bietet eine leistungsstarke OCR-Lösung, um einen von Google bereitgestellten Bild-zu-Text-Konverter zu erstellen. Es unterstützt die Textextraktion von Bildern und PDF-Dokumenten und kann Texte in mehreren Sprachen erkennen.

OCR Foto (Anfängertutorial): Abbildung 1

Pros

  • Hohe Genauigkeit
  • Sprachunterstützung
  • Integration mit anderen Google Cloud-Diensten.

Kosten

  • Erfordert einen API-Schlüssel
  • Nicht völlig kostenlos über einen bestimmten Nutzungsschwellenwert hinaus.

Schritt 1: API-Schlüssel abrufen

  • Besuchen Sie die Google Cloud Console.
  • Erstellen Sie ein neues Projekt oder wählen Sie ein bestehendes aus.
  • Aktivieren Sie die Cloud Vision API und generieren Sie einen API-Schlüssel.

Schritt 2: API-Anfrage stellen

  • Verwenden Sie ein Tool wie cURL oder eine Programmiersprache Ihrer Wahl, um eine HTTP-POST-Anfrage zu stellen.
  • Fügen Sie die Bilddatei oder URL in die Anfrage ein.
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
SHELL

Schritt 3: Ergebnisse verarbeiten

  • Extrahieren Sie den erkannten Text aus der API-Antwort.
{
  "responses": [
    {
      "textAnnotations": [
        {
          "description": "Hello World!",
          "boundingPoly": { /* bounding box coordinates */ }
        }
      ]
    }
  ]
}

2. Tesseract OCR

Tesseract ist eine von Google entwickelte Open-Source-OCR-Engine. Es unterstützt über 100 Sprachen und wird aufgrund seiner Genauigkeit und Flexibilität häufig verwendet. Es hilft, Bilder aus mehreren Dateiformaten zu konvertieren und sogar gescannte Bilder in bearbeitbaren Text umzuwandeln.

OCR Foto (Anfängertutorial): Abbildung 2

Pros

  • Open-Source
  • Hohe Genauigkeit
  • Community-Support

Kosten

  • Möglicherweise sind zusätzliche Werkzeuge zur Integration erforderlich
  • Möglicherweise ist eine Bildvorverarbeitung für optimale Ergebnisse erforderlich.

Schritt 1: Tesseract installieren

  • Laden Sie Tesseract OCR aus dem offiziellen GitHub-Repository herunter und installieren Sie es.
  • Fügen Sie den Tesseract-Ordner zur PATH-Umgebungsvariable hinzu, um darauf vom Terminal aus zugreifen zu können.

Schritt 2: OCR auf Bild ausführen

  • Öffnen Sie ein Terminal und navigieren Sie zu dem Ordner, der das Bild enthält.
  • Führen Sie den folgenden Befehl aus:
tesseract path/to/your/image.jpg output.txt
tesseract path/to/your/image.jpg output.txt
SHELL

Schritt 3: Ergebnisse ansehen

  • Öffnen Sie die generierte Textdatei (output.txt), um den extrahierten Text zu sehen.

3. ABBYY FineReader Online

ABBYY FineReader Online ist ein cloudbasierter OCR-Service, der es Nutzern ermöglicht, gescannte Dokumente und Bilder in bearbeitbare Formate umzuwandeln.

Dieses Online-Tool bietet einen kostenlosen OCR-basierten Textkonverter an, um Text aus Bildern ohne Aufwand zu extrahieren.

OCR Foto (Anfängertutorial): Abbildung 3

Pros

  • Benutzerfreundliches Bild-OCR-Tool
  • Unterstützt verschiedene Eingabeformate
  • Erhält die Dokumentformatierung

Kosten

  • Begrenzter kostenloser Gebrauch
  • Internetverbindung erforderlich

Schritt 1: ABBYY FineReader Online besuchen

  • Gehen Sie auf die ABBYY FineReader Online-Website.
  • Laden Sie die kostenlose Testversion für Windows oder Mac herunter.
  • Installieren Sie die Software und folgen Sie den angegebenen Schritten.

Schritt 2: Bild hochladen

  • Klicken Sie auf die Schaltfläche "Datei auswählen" und laden Sie Ihr Bild hoch.

Schritt 3: Bild verarbeiten

  • Warten Sie, bis das Bild verarbeitet ist. Das Tool wird automatisch Text extrahieren.

Schritt 4: Text bearbeiten

  • Speichern Sie den extrahierten Text oder verwenden Sie den Editor, um etwaige notwendige Korrekturen vorzunehmen.
  • Speichern Sie im Word-, Excel- und Textformat.

4. Online OCR

Online OCR ist ein webbasierter OCR-Service, der mehrere Sprachen für die Online-Bild-zu-Text-Konvertierung unterstützt. Benutzer können Bilder direkt von ihren Geräten hochladen oder URLs angeben.

Pros

  • Einfache Benutzeroberfläche
  • Unterstützt verschiedene Eingabeformate
  • Kostenlos mit Einschränkungen

Kosten

  • Begrenzte freie Funktionen
  • Abhängig von Internet-Konnektivität

Schritt 1: Online OCR besuchen

Gehen Sie auf die Online OCR-Website.

Schritt 2: Bild hochladen

Klicken Sie auf die Schaltfläche "Datei auswählen" und laden Sie Ihr Bild hoch.

OCR Foto (Anfängertutorial): Abbildung 4

Schritt 3: Sprache und Ausgabeformat wählen

Wählen Sie die Sprache und das Ausgabeformat des Textes im Bild.

OCR Foto (Anfängertutorial): Abbildung 5

Schritt 4: OCR starten

Klicken Sie auf die Schaltfläche "Umwandeln", um den OCR-Prozess zu starten.

Schritt 5: Text herunterladen

Sobald der Prozess abgeschlossen ist, laden Sie den extrahierten Text vom bereitgestellten Link herunter.

OCR Foto (Anfängertutorial): Abbildung 6

Einführung in IronOCR in C#

Nun lassen Sie uns in IronOCR eintauchen, eine leistungsstarke OCR-Bibliothek für C#, die Entwicklern Werkzeuge bietet, um OCR-Funktionalität nahtlos zu implementieren. IronOCR ist eine führende OCR-Bibliothek für C#, entwickelt vom Iron Software-Team.

IronOCR zeichnet sich als leistungsstarke OCR-Bibliothek aus, die speziell für C#-Entwickler konzipiert ist und eine robuste Suite von Funktionen bietet, um Text präzise und nahtlos aus Bildern zu extrahieren.

Bekannt für seine Zuverlässigkeit und Effizienz, hat IronOCR bei C#-Entwicklern Anerkennung gefunden, die eine umfassende Lösung für die Textextraktion aus Bildern und Dokumenten suchen.

Mit einem Schwerpunkt auf Genauigkeit und Vielseitigkeit hat sich IronOCR zu einer bevorzugten Wahl für Projekte entwickelt, die von Dokumentenverwaltungssystemen bis hin zu Datenextraktionsanwendungen reichen.

Dank fortschrittlicher OCR-Algorithmen übertrifft IronOCR bei der genauen Entschlüsselung von Texten aus verschiedenen Bildformaten, einschließlich JPEG, PNG und TIFF. Seine Vielseitigkeit erstreckt sich auf Mehrsprachenunterstützung und macht es zu einem wertvollen Werkzeug für Anwendungen, die unterschiedliche sprachliche Bedürfnisse berücksichtigen.

Diese Bibliothek integriert sich nahtlos in beliebte .NET-Frameworks, wodurch die Implementierung von OCR-Funktionalität in C#-Anwendungen vereinfacht wird.

Ob Sie mit gescannten Dokumenten oder Bildern arbeiten, IronOCRs umfassende Funktionen ermöglichen es Entwicklern, mühelos OCR-Fähigkeiten in ihre Projekte zu integrieren.

IronOCR-Funktionen im Detail

  1. Fortschrittliche OCR-Algorithmen: IronOCR verwendet ausgeklügelte OCR-Algorithmen, die über die grundlegende Zeichenerkennung hinausgehen und eine hohe Genauigkeit auch in komplexen Szenarien gewährleisten.
  2. Unterstützung von Bildformaten: Entwickler können die Unterstützung von IronOCR für verschiedene Bildformate, wie JPEG, PNG und TIFF, nutzen, was Flexibilität im Umgang mit unterschiedlichem visuellen Inhalt bietet.
  3. Mehrsprachenunterstützung: In Anerkennung der globalen Natur von Anwendungen ist IronOCR mit Mehrsprachenunterstützung ausgestattet, die eine präzise Textextraktion in verschiedenen Sprachen ermöglicht.
  4. Textextraktion aus PDFs: Neben Bildern erweitert IronOCR seine Fähigkeiten auf die Textextraktion aus PDF-Dokumenten, was seine Anwendbarkeit in Szenarien erhöht, in denen Dokumente in digitalen Formaten gespeichert sind.
  5. Integration mit .NET-Frameworks: IronOCR integriert sich nahtlos in beliebte .NET-Frameworks, was es C#-Entwicklern erleichtert, OCR-Funktionalität in ihre Projekte zu integrieren, ohne den Aufwand umfangreicher Konfigurationen.

Implementierung von OCR mit IronOCR in C#

Im Folgenden ist ein einfaches Beispiel für die Verwendung von IronOCR in C# zum Extrahieren von Text aus einem Bild:

using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
Imports IronOcr ' Import the IronOcr namespace

' Create an instance of IronTesseract
Private ocr = New IronTesseract()

' Read text from the specified image file
Private imageText As String = ocr.Read("images\image.png").Text

' Output the extracted text
Console.WriteLine(imageText)
$vbLabelText   $csharpLabel

Dieses einfache C#-Codebeispiel zeigt, wie IronOCR verwendet werden kann, um Text aus einer Bilddatei zu lesen. Entwickler können den OCR-Prozess weiter an ihre spezifischen Anforderungen anpassen.

Für detaillierte Informationen zur erweiterten Funktionalität von IronOCR besuchen Sie bitte die Dokumentationsseite.

Abschluss

OCR-Fotowerkzeuge spielen eine entscheidende Rolle bei der Digitalisierung von Textinhalten aus Bildern. Während verschiedene Online-Tools Komfort bieten, stellt IronOCR Entwicklern eine leistungsstarke und flexible Lösung zur Verfügung, um OCR-Funktionen in ihre C#-Anwendungen zu integrieren.

Die Wahl zwischen Online-Tools und programmatisch implementierten Bibliotheken hängt von Faktoren wie Genauigkeitsanforderungen, Anpassungsbedürfnissen und dem Maß an Kontrolle ab, das Entwickler über den OCR-Prozess wünschen.

IronOCR bietet tatsächlich eine kostenlose Testversion an. Laden Sie die Software von hier herunter.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen