Wie man Fotos in C#35; mit IronOCR liest

This article was translated from English: Does it need improvement?
Translated
View the article in English

Die ReadPhoto-Methode von IronOCR extrahiert Text aus komplexen Fotoformaten wie TIFF und GIF und liefert strukturierte Ergebnisse mit Textregionen und Konfidenzwerten, die für hochwertige gescannte Dokumente optimiert sind, die eine genaue OCR-Verarbeitung erfordern.

Bei großen Dokumentenmengen, insbesondere bei gescannten Bildern wie TIFF-Dateien, wird die manuelle Extraktion von Text zeitaufwändig und fehleranfällig. Optical Character Recognition (OCR) automatisiert diesen Prozess und wandelt Text aus Bildern in digitale Daten um. die OCR-Technologie verarbeitet komplexe Bilder wie gescannte Dokumente und Fotos und wandelt sie in durchsuchbaren, bearbeitbaren Text um. Dies beschleunigt die Bearbeitung der Dokumente und gewährleistet eine genaue Datenextraktion.

Die Verwendung von OCR für Formate wie TIFF und GIF ermöglicht die schnelle Digitalisierung riesiger Datenmengen, trotz ihrer Größe, Farbtiefe oder Komprimierungsprobleme. Mit der Funktion ReadPhoto von IronOCR können Entwickler Text aus Bildern extrahieren und erweiterte Operationen wie die Suche nach Schlüsselwörtern oder die Umwandlung gescannter Daten in durchsuchbare PDFs durchführen. Diese Technologie kommt Branchen zugute, die mit juristischen Dokumenten, Archiven oder Quittungen arbeiten, bei denen eine effiziente Datenabfrage entscheidend ist.

Dieses Tutorial demonstriert die Verwendung von ReadPhoto und die Manipulation des results-Objekts. Wir werden besprechen, wann ReadPhoto anstelle des standardmäßigen Read von IronOcr verwendet werden sollte. Für die allgemeine Bildverarbeitung sollten Sie sich mit Lesen verschiedener Bildformate beschäftigen.

Um diese Funktion zu nutzen, installieren Sie das Paket IronOcr.Extension.AdvancedScan.

als-Überschrift:2(Schnellstart: Verwenden Sie ReadPhoto, um Text aus komplexen Bildern zu extrahieren)

Legen Sie schnell los: Verwenden Sie die Methode ReadPhoto von IronOCR auf einem OcrInput, der mit Ihrem Bildrahmen geladen ist, um alle Texte und Regionen zu extrahieren. Sie ist für TIFFs, GIFs und ähnliche Fotoformate optimiert.

Nuget IconLegen Sie jetzt mit NuGet los, um PDFs zu erstellen:

  1. Installieren Sie IronOCR mit dem NuGet-Paketmanager.

    PM > Install-Package IronOcr

  2. Kopieren Sie diesen Codeausschnitt und führen Sie ihn aus.

    var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0));
  3. Bereitstellen zum Testen in Ihrer Live-Umgebung

    Beginnen Sie noch heute mit der Nutzung von IronOCR in Ihrem Projekt – mit einer kostenlosen Testversion.
    arrow pointer

Wie extrahiere ich Text aus TIFF-Bildern mit ReadPhoto?

Das Lesen von hochwertigen Fotoformaten wie TIFF und GIF ist mit IronOCR kein Problem. Erstellen Sie zunächst eine Variable OcrInput und laden Sie das Bild mit LoadImageFrame. Verwenden Sie dann die Methode ReadPhoto, um Ergebnisse zu erhalten. Das multi-page TIFF OCR tutorial bietet zusätzliche Beispiele für mehrseitige Dokumente.

[{i:(

  • TIFF enthält mehrere Frames; der Parameter PageNumber ist bei nullbasierter Indizierung erforderlich.
  • Die Methode unterstützt derzeit Englisch, Chinesisch, Japanisch, Koreanisch und das lateinische Alphabet.
  • Die Verwendung von Advanced Scan auf .NET Framework erfordert eine x64-Architektur.

@@--KLAMMER-SCHLIESSEN--@@

Welches Eingabeformat sollte ich verwenden?

Da Browser das TIFF-Format nicht von Haus aus unterstützen, können Sie die TIFF-Eingabe hier herunterladen. Die unten angezeigte Version wurde in WEBP konvertiert.

Eingabe

Wie implementiere ich die ReadPhoto-Methode?

Diese Implementierung demonstriert die Extraktion von Text- und Bereichsinformationen aus einem TIFF-Bild. Weitere Beispiele finden Sie in unserem Fotolesecode-Beispiel.

:path=/static-assets/ocr/content-code-examples/how-to/read-photo-read-photo.cs
using IronOcr;
using IronSoftware.Drawing;
using System;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputPhoto = new OcrInput();
inputPhoto.LoadImageFrame("ocr.tiff", 0);

// Read photo
OcrPhotoResult result = ocr.ReadPhoto(inputPhoto);

// Index number refer to region order in the page
int number = result.TextRegions[0].PageNumber;

// Extract the text in the first region
string textinregion = result.TextRegions[0].TextInRegion;

//Extract the co_ordinates of the first text region
Rectangle region = result.TextRegions[0].Region;

var output = $"Text in First Region: {textinregion}\n"
             + $"Text Region:\n"
             + $"Starting X: {region.X}\n"
             + $"Starting Y: {region.Y}\n"
             + $"Region Width: {region.Width}\n"
             + $"Region Height: {region.Height}\n"
             + $"Result Confidence: {result.Confidence}\n\n"
             + $"Full Scnned Photo Text: {result.Text}";

Console.WriteLine(output);
Imports Microsoft.VisualBasic
Imports IronOcr
Imports IronSoftware.Drawing
Imports System

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private inputPhoto = New OcrInput()
inputPhoto.LoadImageFrame("ocr.tiff", 0)

' Read photo
Dim result As OcrPhotoResult = ocr.ReadPhoto(inputPhoto)

' Index number refer to region order in the page
Dim number As Integer = result.TextRegions(0).PageNumber

' Extract the text in the first region
Dim textinregion As String = result.TextRegions(0).TextInRegion

'Extract the co_ordinates of the first text region
Dim region As Rectangle = result.TextRegions(0).Region

Dim output = $"Text in First Region: {textinregion}" & vbLf & $"Text Region:" & vbLf & $"Starting X: {region.X}" & vbLf & $"Starting Y: {region.Y}" & vbLf & $"Region Width: {region.Width}" & vbLf & $"Region Height: {region.Height}" & vbLf & $"Result Confidence: {result.Confidence}" & vbLf & vbLf & $"Full Scnned Photo Text: {result.Text}"

Console.WriteLine(output)
$vbLabelText   $csharpLabel

Welche Eigenschaften stellt OcrPhotoResult zur Verfügung?

Debug-Ausgabe, die die OCR-Textextraktion mit Telefonnummer, Koordinaten und Konfidenzwert aus dem verarbeiteten Bild zeigt

Die Klasse OcrPhotoResult bietet Schlüsseleigenschaften für die Analyse von extrahiertem Text. Ausführliche Informationen zur Arbeit mit OCR-Ergebnissen finden Sie in unserem Leitfaden zur Datenausgabe und Ergebnismanipulation.

Text: Der aus OCR-Eingaben extrahierte Text.
Vertrauen: Statistisches Vertrauen in die Genauigkeit (Skala 0-1, wobei 1 der höchste Wert ist). Erfahren Sie mehr über Ergebniskonfidenzwerte.
TextRegionen: Liste von Textregionen mit Standortdaten. Ähnlich wie bei der Definition von OCR-Regionen für die gezielte Extraktion.


Wann sollte ich ReadPhoto anstelle von Read verwenden?

Der Hauptunterschied zwischen ReadPhoto und Standard Read ist das result Objekt und die unterstützten Dateiformate. LoadImageFrame akzeptiert speziell TIFF und GIF, nicht aber Formate wie JPEG. ReadPhoto ist für komplexe Bildformate optimiert, während Standard-Read für einfachere Bilder und allgemeine Textextraktionsaufgaben geeignet ist.

Warum unterstützt ReadPhoto nur die Formate TIFF und GIF?

TIFF ist ein verlustfreies Format, um mehrere Seiten und Bilder in einer Datei zusammenzufassen. Es wird für die Speicherung mehrerer Bilder in hoher Qualität verwendet, z. B. für juristische Dokumente und medizinische Bilder. Da es komplexer ist als JPEG, sind andere Methoden zur Textextraktion erforderlich. Die spezialisierte Bearbeitung gewährleistet optimale Ergebnisse mit professionellen Bildformaten.

TIFF-Bilder verwenden unterschiedliche Komprimierungsmethoden, so dass IronOCR spezielle Algorithmen zur Entschlüsselung des Textes einsetzt. Die fortschrittlichen Algorithmen in ReadPhoto verarbeiten die TIFF-Komprimierungsmerkmale und gewährleisten eine genaue Extraktion aus komplexen, mehrschichtigen Dokumenten.

Hier ist ein Vergleich zwischen den Formaten TIFF und JPEG:

Merkmal TIFF (Tagged Image File Format) JPG/JPEG (Gemeinsame Expertengruppe für Fotografie)
Komprimierung Verlustfrei oder unkomprimiert (erhält die Qualität) Verlustbehaftete Komprimierung (reduziert die Qualität für kleinere Dateigröße)
Dateigröße Groß (aufgrund der hohen Qualität und der optionalen fehlenden Kompression) Kleiner, für die Webnutzung optimiert und schnell laden
Bildqualität Hoch (ideal für den professionellen Einsatz, alle Details bleiben erhalten) Geringer (aufgrund verlustbehafteter Kompression wird etwas Qualität geopfert)
Farbtiefe Unterstützt hohe Farbtiefen (bis zu 16 Bit oder 32 Bit pro Kanal) 24-Bit-Farbe (16,7 Millionen Farben)
Anwendungsfall Professionelle Fotografie, Veröffentlichung, Scannen, Archivierung Webbilder, soziale Medien, Alltagsfotos
Transparenz Unterstützt Transparenz- und Alphakanäle Unterstützt keine Transparenz
Bearbeitung Gut geeignet für mehrfache Bearbeitungen (kein Qualitätsverlust beim erneuten Speichern) Die Qualität nimmt mit wiederholten Bearbeitungen und Speichervorgängen ab.
Kompatibilität Weitgehend unterstützt von professioneller Software Universell unterstützt auf allen Plattformen und Geräten
Animation Unterstützt keine Animationen Unterstützt keine Animationen
Metadaten Speichert umfangreiche Metadaten (EXIF, Ebenen usw.). Speichert EXIF-Metadaten, ist aber eingeschränkter.

Wie wähle ich zwischen ReadPhoto und Read für meine Anwendung?

Berücksichtigen Sie jeden produktiven Anwendungsfall, um die Anwendungsleistung zu optimieren. ReadPhoto eignet sich zwar für komplexe TIFF-Bilder, ist aber langsamer in der Verarbeitung. JPEG bietet eine schnellere Verarbeitung, aber eine geringere Qualität, was zu einer niedrigen OCR-Konfidenzrate führen kann. Verwenden Sie Bildqualitätskorrekturfilter, um die Ergebnisse bei Bedarf zu verbessern.

Die confidence-Eigenschaft in OcrPhotoResults oder jeder IOcrResult-Schnittstellenklasse gibt die Genauigkeit der Ergebnisse an, so dass Entwickler diese testen und optimieren können. Für höchste Genauigkeitsanforderungen liefert ReadPhoto mit qualitativ hochwertigen TIFF-Bildern die besten Ergebnisse, insbesondere für die Verarbeitung von Archivierungs- oder Rechtsdokumenten, bei denen es auf Präzision ankommt.

Finden Sie das Gleichgewicht zwischen Effizienz und Genauigkeit, indem Sie sicherstellen, dass die Bilder bestimmte Qualitätsschwellenwerte erfüllen. Bei gemischten Dokumenttypen sollten Sie einen hybriden Ansatz verfolgen: Verwenden Sie ReadPhoto für kritische Dokumente, die eine hohe Genauigkeit erfordern, und Standard-Read für Routineaufgaben, bei denen die Geschwindigkeit im Vordergrund steht.

Häufig gestellte Fragen

Welche Bildformate unterstützt die ReadPhoto-Methode?

Die ReadPhoto-Methode von IronOCR ist für komplexe Fotoformate wie TIFF und GIF optimiert. Sie wurde speziell für die Extraktion von Text aus hochwertigen gescannten Dokumenten und Fotos entwickelt und liefert strukturierte Ergebnisse mit Textbereichen und Konfidenzwerten.

Wie kann ich Text aus einem TIFF-Bild extrahieren?

Um Text aus TIFF-Bildern mit IronOCR zu extrahieren, erstellen Sie eine OcrInput-Variable, laden Sie das Bild mit LoadImageFrame und wenden Sie dann die ReadPhoto-Methode an. Der Prozess ist einfach: var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0));

Welches zusätzliche Paket ist erforderlich, um die ReadPhoto-Funktion zu nutzen?

Um die ReadPhoto-Funktion in IronOCR zu verwenden, müssen Sie das IronOcr.Extension.AdvancedScan-Paket von NuGet installieren. Diese Erweiterung bietet die erweiterten Scan-Funktionen, die für die ReadPhoto-Methode erforderlich sind.

Wann sollte ich ReadPhoto anstelle der Standard-Lesemethode verwenden?

Verwenden Sie die ReadPhoto-Methode von IronOCR, wenn Sie mit komplexen Fotoformaten wie TIFF und GIF arbeiten, insbesondere bei hochwertigen gescannten Dokumenten, die eine genaue OCR-Verarbeitung erfordern. Die Standard-Lesemethode ist besser für allgemeine Bildverarbeitungsaufgaben geeignet.

Welche Art von Ergebnissen liefert ReadPhoto?

Die ReadPhoto-Methode von IronOCR liefert strukturierte OCR-Ergebnisse, die extrahierte Textbereiche mit Konfidenzwerten enthalten. Sie können auf diese über die Eigenschaft OcrPhotoResult zugreifen, um die extrahierten Daten anzuzeigen und zu bearbeiten.

Kann ReadPhoto mehrseitige Dokumente verarbeiten?

Ja, die ReadPhoto-Methode von IronOCR kann mehrseitige Dokumente verarbeiten, insbesondere TIFF-Dateien, die oft mehrere Bilder enthalten. Mit der LoadImageFrame-Methode können Sie bei mehrseitigen Dokumenten angeben, welcher Rahmen verarbeitet werden soll.

Welche Branchen profitieren vom Einsatz der OCR-Technologie für Fotos?

IronOCR bietet Vorteile für Branchen, die mit juristischen Dokumenten, Archiven, Quittungen und allen Unternehmen zu tun haben, die mit großen Mengen an gescannten Dokumenten arbeiten, bei denen eine effiziente Datenabfrage entscheidend ist. Die ReadPhoto-Methode automatisiert die Textextraktion aus diesen komplexen Bildformaten.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen
Bereit anzufangen?
Nuget Downloads 5,246,844 | Version: 2025.12 gerade veröffentlicht