OCR-WERKZEUGE

OCR Foto (Einsteiger-Tutorial)

Veröffentlicht 12. Dezember 2023
Teilen Sie:

Einführung

Optische Zeichenerkennung(OCR) die Technologie hat die Art und Weise revolutioniert, wie wir in der digitalen Welt mit Text umgehen. OCR-Fotowerkzeuge ermöglichen die Umwandlung von Bildern in Text und erleichtern so die Digitalisierung von gedruckten oder handschriftlichen Notizen.

In diesem Artikel werden wir vier Online-OCR-Tools - sowohl kostenlose als auch kostenpflichtige - untersuchen und mit einer Einführung in IronOCR abschließen, die zeigt, wie OCR programmatisch in C# implementiert werden kann.

1. Google Vision API

Google Vision API bietet eine leistungsstarke OCR-Lösung zur Erstellung von Bild-zu-Text-Konvertern, die von Google bereitgestellt werden. Es unterstützt die Extraktion von Bild- und PDF-Text und kann Text in mehreren Sprachen erkennen.

OCR-Foto(Einsteiger-Tutorial): Abbildung 1

Profis

  • Hohe Genauigkeit
  • Unterstützung von Sprachen
  • Integration mit anderen Google Cloud-Diensten.

Nachteile

  • Erfordert API-Schlüssel
  • Ab einer bestimmten Nutzungsschwelle nicht mehr völlig kostenlos.

Schritt 1 Beziehen des API-Schlüssels

  • Besuchen Sie dieGoogle Cloud Console.
  • Erstellen Sie ein neues Projekt oder wählen Sie ein bestehendes Projekt aus.
  • Aktivieren Sie die Cloud Vision API und generieren Sie einen API-Schlüssel.

Schritt 2 API-Anfrage stellen

  • Verwenden Sie ein Tool wie cURL oder eine Programmiersprache Ihrer Wahl, um eine HTTP-POST-Anfrage zu stellen.
  • Fügen Sie die Bilddatei oder die URL in die Nutzdaten der Anfrage ein.
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"

Schritt 3 Analysieren der Ergebnisse

  • Extrahieren Sie den erkannten Text aus der API-Antwort.
{
  "responses": [
    {
      "textAnnotations": [
        {
          "description": "Hello World!",
          "boundingPoly": { /* bounding box coordinates */ }
        }
      ]
    }
  ]
}

2. Tesseract OCR

*Tesserakt ist eine von Google entwickelte Open-Source OCR-Engine. Es unterstützt über 100 Sprachen und wird aufgrund seiner Genauigkeit und Flexibilität häufig verwendet. Es hilft bei der Konvertierung von Bildern aus verschiedenen Dateiformaten und konvertiert sogar gescannte handschriftliche Bilder in bearbeitbaren Text.

OCR-Foto(Einsteiger-Tutorial): Abbildung 2

Profis

  • Open-Source
  • Hohe Genauigkeit
  • Unterstützung durch die Gemeinschaft

Nachteile

  • Kann zusätzliche Tools für die Integration erfordern
  • Für optimale Ergebnisse ist möglicherweise eine Bildvorverarbeitung erforderlich.

Schritt 1 Tesseract installieren

  • Laden Sie Tesseract OCR herunter und installieren Sie es von deroffizielles GitHub-Repository.
  • Fügen Sie den Tesseract-Ordner zur Umgebungsvariablen Path hinzu, um von jedem beliebigen Punkt des Terminals aus darauf zugreifen zu können.

Schritt 2 OCR auf dem Bild ausführen

  • Öffnen Sie ein Terminal und navigieren Sie zu dem Ordner, der das Bild enthält.
  • Führen Sie den folgenden Befehl aus:
tesseract path/to/your/image.jpg output.txt
tesseract path/to/your/image.jpg output.txt
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'tesseract path/@to/your/image.jpg output.txt
VB   C#

Schritt 3 Ergebnisse anzeigen

  • Öffnen Sie die erzeugte Textdatei(output.txt) um den extrahierten Text zu sehen.

3. ABBYY FineReader Online

ABBYY FineReader Online ist ein cloudbasierter OCR-Dienst, mit dem Benutzer gescannte Dokumente und Bilder in bearbeitbare Formate umwandeln können.

Dieses Online-Tool bietet einen kostenlosen OCR-basierten Textkonverter, mit dem Sie problemlos Text aus Bildern extrahieren können.

OCR-Foto(Tutorial für Anfänger): Abbildung 3

Profis

  • Benutzerfreundliches OCR-Tool für Bilder
  • Unterstützt verschiedene Eingabeformate
  • Behält die Formatierung des Dokuments bei

Nachteile

  • Begrenzte freie Nutzung
  • Internetverbindung erforderlich

Schritt 1 Besuchen Sie ABBYY FineReader Online

  • Gehen Sie zumABBYY FineReader Online website.
  • Laden Sie die kostenlose Testversion für Windows oder Mac herunter.
  • Installieren Sie die Software und befolgen Sie die angegebenen Schritte.

Schritt 2 Bild hochladen

  • Klicken Sie auf die Schaltfläche "Datei auswählen" und laden Sie Ihr Bild hoch.

Schritt 3 Bild verarbeiten

  • Warten Sie, bis das Bild verarbeitet ist. Das Tool extrahiert den Text automatisch.

Schritt 4 Text bearbeiten

  • Speichern Sie den extrahierten Text oder verwenden Sie den Editor, um die notwendigen Korrekturen vorzunehmen
  • Speichern in den Formaten Word, Excel und Text.

4. Online-OCR

Online OCR ist ein webbasierter OCR-Dienst, der mehrere Sprachen für die Online-Konvertierung von Bildern in Text unterstützt. Die Nutzer können Bilder direkt von ihren Geräten hochladen oder URLs angeben.

Profis

  • Einfache Benutzeroberfläche
  • Unterstützt verschiedene Eingabeformate
  • Kostenlose Nutzung mit Einschränkungen

Nachteile

  • Eingeschränkte kostenlose Funktionen
  • Abhängig von der Internetkonnektivität

Schritt 1 Besuchen Sie Online OCR

Gehen Sie zumOnline-OCR website.

Schritt 2 Bild hochladen

Klicken Sie auf die Schaltfläche "Datei auswählen" und laden Sie Ihr Bild hoch.

OCR-Foto(Einsteiger-Tutorial): Abbildung 4

Schritt 3 Sprache und Ausgabeformat wählen

Wählen Sie die Sprache und das Ausgabeformat für den Text im Bild.

OCR-Foto(Einsteiger-Tutorial): Abbildung 5

Schritt 4 OCR starten

Klicken Sie auf die Schaltfläche "Konvertieren", um den OCR-Prozess zu starten.

Schritt 5 Text herunterladen

Sobald der Vorgang abgeschlossen ist, laden Sie den extrahierten Text über den angegebenen Link herunter.

OCR-Foto(Einsteiger-Tutorial): Abbildung 6

Einführung in IronOCR in C#

Jetzt wollen wir uns IronOCR ansehen, eine leistungsstarke OCR-Bibliothek für C#, die Entwicklern die Werkzeuge zur nahtlosen Implementierung von OCR-Funktionen an die Hand gibt. IronOCR ist eine führende OCR-Bibliothek für C#, die vom Iron Software-Team entwickelt wurde.

IronOCR zeichnet sich als robuste Optical Character Recognition(OCR) bibliothek, die speziell für C#-Entwickler entwickelt wurde und eine Reihe von leistungsstarken Funktionen für die genaue und nahtlose Textextraktion aus Bildern bietet.

IronOCR ist für seine Zuverlässigkeit und Effizienz bekannt und hat unter C#-Entwicklern, die eine umfassende Lösung für die Textextraktion aus Bildern und Dokumenten suchen, an Beliebtheit gewonnen.

IronOCR hat sich mit seinem Schwerpunkt auf Genauigkeit und Vielseitigkeit zu einer ersten Wahl für Projekte entwickelt, die von Dokumentenmanagementsystemen bis zu Datenextraktionsanwendungen reichen.

IronOCR nutzt fortschrittliche OCR-Algorithmen und ist in der Lage, Text aus verschiedenen Bildformaten, einschließlich JPEG, PNG und TIFF, präzise zu entziffern. Seine Vielseitigkeit erstreckt sich auch auf die Unterstützung mehrerer Sprachen, was es zu einem wertvollen Werkzeug für Anwendungen macht, die unterschiedlichen sprachlichen Anforderungen gerecht werden müssen.

Diese Bibliothek lässt sich nahtlos in gängige .NET-Frameworks integrieren und rationalisiert die Implementierung von OCR-Funktionen in C#-Anwendungen.

Egal, ob Sie mit gescannten Dokumenten oder Bildern arbeiten, die umfassenden Funktionen von IronOCR ermöglichen es Entwicklern, OCR-Funktionen mühelos in ihre Projekte einzubinden.

IronOCR-Funktionen im Detail

  1. Erweiterte OCR-Algorithmen: IronOCR verwendet hochentwickelte OCR-Algorithmen, die über die einfache Zeichenerkennung hinausgehen und selbst in komplexen Szenarien eine hohe Genauigkeit gewährleisten.

  2. Unterstützung von Bildformaten: Entwickler können die Vorteile von IronOCRs Unterstützung für eine Vielzahl von Bildformaten wie JPEG, PNG und TIFF nutzen, was Flexibilität bei der Handhabung verschiedener visueller Inhalte bietet.

  3. Mehrsprachenunterstützung: IronOCR ist mit einer Mehrsprachenunterstützung ausgestattet, die es ermöglicht, Text in verschiedenen Sprachen präzise zu extrahieren, da die Anwendungen weltweit eingesetzt werden.

  4. PDF-Text-Extraktion: Zusätzlich zu den Bildern erweitert IronOCR seine Fähigkeiten, Text aus PDF-Dokumenten zu extrahieren, was seine Anwendbarkeit in Szenarien verbessert, in denen Dokumente in digitalen Formaten gespeichert sind.

  5. Integration mit .NET-Frameworks: IronOCR lässt sich nahtlos in gängige .NET-Frameworks integrieren, so dass C#-Entwickler die OCR-Funktionalität problemlos in ihre Projekte einbinden können, ohne dass eine umfangreiche Konfiguration erforderlich ist.

Implementierung von OCR mit IronOCR in C#;

Im Folgenden finden Sie ein einfaches Beispiel für die Verwendung von IronOCR in C#, umText aus einem Bild extrahieren:

using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
Imports IronOcr
Private imageText As String = (New IronTesseract()).Read("images\image.png").Text
VB   C#

Dieses einfache C#-Codefragment zeigt, wie IronOCR zum Lesen von Text aus einer Bilddatei verwendet werden kann. Die Entwickler können den OCR-Prozess weiter an ihre spezifischen Anforderungen anpassen.

Ausführliche Informationen zu den erweiterten Funktionen von IronOCR finden Sie in derDokumentation seite.

Schlussfolgerung

OCR-Fototools spielen eine wichtige Rolle bei der Digitalisierung von Textinhalten aus Bildern. IronOCR bietet Entwicklern eine leistungsstarke und flexible Lösung für die Integration von OCR-Funktionen in ihre C#-Anwendungen, während verschiedene Online-Tools Komfort bieten.

Die Wahl zwischen Online-Tools und programmatisch implementierten Bibliotheken hängt von Faktoren wie Genauigkeitsanforderungen, Anpassungsbedarf und dem Grad der Kontrolle ab, den Entwickler über den OCR-Prozess wünschen.

IronOCR bietet einekostenlos testen erforderlich ist. Laden Sie die Software herunter von*hier.

< PREVIOUS
Beste kostenlose OCR-Software für Entwickler
NÄCHSTES >
Arabische Texterkennungs-Tools: Verbesserung der Genauigkeit

Sind Sie bereit, loszulegen? Version: 2024.11 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 2,791,504 Lizenzen anzeigen >