Wie man Fotos in C# mit IronOCR liest

This article was translated from English: Does it need improvement?
Translated
View the article in English

Die ReadPhoto-Methode von IronOCR extrahiert Text aus komplexen Fotoformaten wie TIFF und GIF und liefert strukturierte Ergebnisse mit Textbereichen und Konfidenzwerten, optimiert für qualitativ hochwertige gescannte Dokumente, die eine genaue OCR-Verarbeitung erfordern.

Bei großen Dokumentenmengen, insbesondere bei gescannten Bildern wie TIFF-Dateien, wird die manuelle Extraktion von Text zeitaufwändig und fehleranfällig. Optical Character Recognition (OCR) automatisiert diesen Prozess und wandelt Text aus Bildern in digitale Daten um. die OCR-Technologie verarbeitet komplexe Bilder wie gescannte Dokumente und Fotos und wandelt sie in durchsuchbaren, bearbeitbaren Text um. Dies beschleunigt die Bearbeitung der Dokumente und gewährleistet eine genaue Datenextraktion.

Die Verwendung von OCR für Formate wie TIFF und GIF ermöglicht die schnelle Digitalisierung riesiger Datenmengen, trotz ihrer Größe, Farbtiefe oder Komprimierungsprobleme. Mit der ReadPhoto-Funktion von IronOCR können Entwickler Text aus Bildern extrahieren und erweiterte Operationen wie die Stichwortsuche oder die Umwandlung gescannter Daten in durchsuchbare PDFs durchführen. Diese Technologie kommt Branchen zugute, die mit juristischen Dokumenten, Archiven oder Quittungen arbeiten, bei denen eine effiziente Datenabfrage entscheidend ist.

Dieses Tutorial demonstriert die Verwendung von ReadPhoto und die Manipulation des results-Objekts. Wir werden besprechen, wann man ReadPhoto anstelle des Standardcodes Read von IronOCR verwenden sollte. Für die allgemeine Bildverarbeitung sollten Sie sich mit Lesen verschiedener Bildformate beschäftigen.

Um diese Funktion zu nutzen, installieren Sie das Paket IronOcr.Extension.AdvancedScan.

Schnellstart: Mit ReadPhoto Text aus komplexen Bildern extrahieren

Schnell loslegen: Verwenden Sie die ReadPhoto-Methode von IronOCR auf einem OcrInput, das mit Ihrem Bildrahmen geladen ist, um den gesamten Text und alle Bereiche zu extrahieren. Sie ist für TIFFs, GIFs und ähnliche Fotoformate optimiert.

  1. Installieren Sie IronOCR mit NuGet Package Manager

    PM > Install-Package IronOcr
  2. Kopieren Sie diesen Codeausschnitt und führen Sie ihn aus.

    var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0));
  3. Bereitstellen zum Testen in Ihrer Live-Umgebung

    Beginnen Sie noch heute, IronOCR in Ihrem Projekt zu verwenden, mit einer kostenlosen Testversion

    arrow pointer

Wie extrahiere ich Text aus TIFF-Bildern mit ReadPhoto?

Das Lesen von hochwertigen Fotoformaten wie TIFF und GIF ist mit IronOCR kein Problem. Zuerst wird eine Variable OcrInput erstellt und das Bild mit LoadImageFrame geladen. Verwenden Sie dann die Methode ReadPhoto, um Ergebnisse zu erhalten. Das multi-page TIFF OCR tutorial bietet zusätzliche Beispiele für mehrseitige Dokumente.

Hinweis:

  • TIFF enthält mehrere Frames; Der Parameter PageNumber ist bei nullbasierter Indizierung erforderlich.
  • Die Methode unterstützt derzeit Englisch, Chinesisch, Japanisch, Koreanisch und das lateinische Alphabet.
  • Die Verwendung von Advanced Scan auf .NET Framework erfordert eine x64-Architektur.

)}]

Welches Eingabeformat sollte ich verwenden?

Da Browser das TIFF-Format nicht von Haus aus unterstützen, können Sie die TIFF-Eingabe hier herunterladen. Die unten angezeigte Version wurde in WEBP konvertiert.

Input

Wie implementiere ich die ReadPhoto-Methode?

Diese Implementierung demonstriert die Extraktion von Text- und Bereichsinformationen aus einem TIFF-Bild. Weitere Beispiele finden Sie in unserem Fotolesecode-Beispiel.

:path=/static-assets/ocr/content-code-examples/how-to/read-photo-read-photo.cs
using IronOcr;
using IronSoftware.Drawing;
using System;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputPhoto = new OcrInput();
inputPhoto.LoadImageFrame("ocr.tiff", 0);

// Read photo
OcrPhotoResult result = ocr.ReadPhoto(inputPhoto);

// Index number refer to region order in the page
int number = result.TextRegions[0].PageNumber;

// Extract the text in the first region
string textinregion = result.TextRegions[0].TextInRegion;

//Extract the co_ordinates of the first text region
Rectangle region = result.TextRegions[0].Region;

var output = $"Text in First Region: {textinregion}\n"
             + $"Text Region:\n"
             + $"Starting X: {region.X}\n"
             + $"Starting Y: {region.Y}\n"
             + $"Region Width: {region.Width}\n"
             + $"Region Height: {region.Height}\n"
             + $"Result Confidence: {result.Confidence}\n\n"
             + $"Full Scnned Photo Text: {result.Text}";

Console.WriteLine(output);
$vbLabelText   $csharpLabel

Welche Eigenschaften stellt OcrPhotoResult zur Verfügung?

Debug-Ausgabe mit OCR-Textextraktion, Telefonnummer, Koordinaten und Konfidenzwert aus dem verarbeiteten Bild

Die Klasse OcrPhotoResult stellt wichtige Eigenschaften für die Analyse extrahierten Textes bereit. Ausführliche Informationen zur Arbeit mit OCR-Ergebnissen finden Sie in unserem Leitfaden zur Datenausgabe und Ergebnismanipulation.

Text : Der aus der OCR-Eingabe extrahierte Text.
Confidence : Statistische Genauigkeit (Skala 0-1, wobei 1 die höchste Genauigkeit darstellt). Erfahren Sie mehr über Ergebniskonfidenzwerte.
TextRegions : Liste der Textbereiche mit Standortdaten. Ähnlich wie bei der Definition von OCR-Regionen für die gezielte Extraktion.


Wann sollte ich ReadPhoto anstelle von Read verwenden?

Der Hauptunterschied zwischen ReadPhoto und dem Standard Read besteht im result-Objekt und den unterstützten Dateiformaten. LoadImageFrame akzeptiert ausdrücklich TIFF und GIF, nicht Formate wie JPEG. ReadPhoto ist für komplexe Bildformate optimiert, während der Standardcode Read für einfachere Bilder und allgemeine Textextraktionsaufgaben geeignet ist.

Warum unterstützt ReadPhoto nur die Formate TIFF und GIF?

TIFF ist ein verlustfreies Format, um mehrere Seiten und Bilder in einer Datei zusammenzufassen. Es wird für die Speicherung mehrerer Bilder in hoher Qualität verwendet, z. B. für juristische Dokumente und medizinische Bilder. Da es komplexer ist als JPEG, sind andere Methoden zur Textextraktion erforderlich. Die spezialisierte Bearbeitung gewährleistet optimale Ergebnisse mit professionellen Bildformaten.

TIFF-Bilder verwenden unterschiedliche Komprimierungsmethoden, so dass IronOCR spezielle Algorithmen zur Entschlüsselung des Textes einsetzt. Die fortschrittlichen Algorithmen in ReadPhoto verarbeiten die TIFF-Komprimierungseigenschaften und gewährleisten so eine genaue Extraktion aus komplexen, mehrschichtigen Dokumenten.

Hier ist ein Vergleich zwischen den Formaten TIFF und JPEG:

Merkmal TIFF (Tagged Image File Format) JPG/JPEG (Gemeinsame Expertengruppe für Fotografie)
Komprimierung Verlustfrei oder unkomprimiert (erhält die Qualität) Verlustbehaftete Komprimierung (reduziert die Qualität für kleinere Dateigröße)
Dateigröße Groß (aufgrund der hohen Qualität und der optionalen fehlenden Kompression) Kleiner, für die Webnutzung optimiert und schnell laden
Bildqualität Hoch (ideal für den professionellen Einsatz, alle Details bleiben erhalten) Geringer (aufgrund verlustbehafteter Kompression wird etwas Qualität geopfert)
Farbtiefe Unterstützt hohe Farbtiefen (bis zu 16 Bit oder 32 Bit pro Kanal) 24-Bit-Farbe (16,7 Millionen Farben)
Anwendungsfall Professionelle Fotografie, Veröffentlichung, Scannen, Archivierung Webbilder, soziale Medien, Alltagsfotos
Transparenz Unterstützt Transparenz- und Alphakanäle Unterstützt **keine** Transparenz
Bearbeitung Gut geeignet für mehrfache Bearbeitungen (kein Qualitätsverlust beim erneuten Speichern) Die Qualität nimmt mit wiederholten Bearbeitungen und Speichervorgängen ab.
Kompatibilität Weitgehend unterstützt von professioneller Software Universell unterstützt auf allen Plattformen und Geräten
Animation Unterstützt keine Animationen Unterstützt keine Animationen
Metadaten Speichert umfangreiche Metadaten (EXIF, Ebenen usw.). Speichert EXIF-Metadaten, ist aber eingeschränkter.

Wie wähle ich zwischen ReadPhoto und Read für meine Anwendung?

Berücksichtigen Sie jeden produktiven Anwendungsfall, um die Anwendungsleistung zu optimieren. Während ReadPhoto für komplexe TIFF-Bilder geeignet ist, ist die Verarbeitung langsamer. JPEG bietet eine schnellere Verarbeitung, aber eine geringere Qualität, was zu einer niedrigen OCR-Konfidenzrate führen kann. Verwenden Sie Bildqualitätskorrekturfilter, um die Ergebnisse bei Bedarf zu verbessern.

Die Eigenschaft confidence in OcrPhotoResults oder einer beliebigen IOcrResult Schnittstellenklasse gibt die Ergebnisgenauigkeit an und ermöglicht Entwicklern Tests und Optimierungen. Für höchste Genauigkeitsanforderungen liefert ReadPhoto mit hochauflösenden TIFF-Bildern die besten Ergebnisse, insbesondere bei der Verarbeitung von Archiv- oder Rechtsdokumenten, wo Präzision entscheidend ist.

Finden Sie das Gleichgewicht zwischen Effizienz und Genauigkeit, indem Sie sicherstellen, dass die Bilder bestimmte Qualitätsschwellenwerte erfüllen. Bei gemischten Dokumenttypen empfiehlt sich ein hybrider Ansatz: Verwenden Sie ReadPhoto für kritische Dokumente, die eine hohe Genauigkeit erfordern, und den Standardcode Read für Routineaufgaben, bei denen die Geschwindigkeit Priorität hat.

Häufig gestellte Fragen

Welche Bildformate unterstützt die ReadPhoto-Methode?

Die ReadPhoto-Methode von IronOCR ist für komplexe Fotoformate wie TIFF und GIF optimiert. Sie wurde speziell für die Extraktion von Text aus hochwertigen gescannten Dokumenten und Fotos entwickelt und liefert strukturierte Ergebnisse mit Textbereichen und Konfidenzwerten.

Wie kann ich Text aus einem TIFF-Bild extrahieren?

Um Text aus TIFF-Bildern mit IronOCR zu extrahieren, erstellen Sie eine OcrInput-Variable, laden Sie das Bild mit LoadImageFrame und wenden Sie dann die ReadPhoto-Methode an. Der Prozess ist einfach: var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0));

Welches zusätzliche Paket ist erforderlich, um die ReadPhoto-Funktion zu nutzen?

Um die ReadPhoto-Funktion in IronOCR zu verwenden, müssen Sie das IronOcr.Extension.AdvancedScan-Paket von NuGet installieren. Diese Erweiterung bietet die erweiterten Scan-Funktionen, die für die ReadPhoto-Methode erforderlich sind.

Wann sollte ich ReadPhoto anstelle der Standard-Lesemethode verwenden?

Verwenden Sie die ReadPhoto-Methode von IronOCR, wenn Sie mit komplexen Fotoformaten wie TIFF und GIF arbeiten, insbesondere bei hochwertigen gescannten Dokumenten, die eine genaue OCR-Verarbeitung erfordern. Die Standard-Lesemethode ist besser für allgemeine Bildverarbeitungsaufgaben geeignet.

Welche Art von Ergebnissen liefert ReadPhoto?

Die ReadPhoto-Methode von IronOCR liefert strukturierte OCR-Ergebnisse, die extrahierte Textbereiche mit Konfidenzwerten enthalten. Sie können auf diese über die Eigenschaft OcrPhotoResult zugreifen, um die extrahierten Daten anzuzeigen und zu bearbeiten.

Kann ReadPhoto mehrseitige Dokumente verarbeiten?

Ja, die ReadPhoto-Methode von IronOCR kann mehrseitige Dokumente verarbeiten, insbesondere TIFF-Dateien, die oft mehrere Bilder enthalten. Mit der LoadImageFrame-Methode können Sie bei mehrseitigen Dokumenten angeben, welcher Rahmen verarbeitet werden soll.

Welche Branchen profitieren vom Einsatz der OCR-Technologie für Fotos?

IronOCR bietet Vorteile für Branchen, die mit juristischen Dokumenten, Archiven, Quittungen und allen Unternehmen zu tun haben, die mit großen Mengen an gescannten Dokumenten arbeiten, bei denen eine effiziente Datenabfrage entscheidend ist. Die ReadPhoto-Methode automatisiert die Textextraktion aus diesen komplexen Bildformaten.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen
Bereit anzufangen?
Nuget Downloads 5,556,263 | Version: 2026.3 gerade veröffentlicht
Still Scrolling Icon

Scrollst du immer noch?

Sie brauchen schnell einen Beweis? PM > Install-Package IronOcr
Führen Sie ein Beispiel aus und beobachten Sie, wie Ihr Bild zu durchsuchbarem Text wird.