How to Read Screenshots using IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

Screenshots sind eine schnelle und einfache Möglichkeit, Informationen zu teilen und wichtige Informationen schnell zu erfassen, um sie an Kollegen und Gleichaltrige zu senden. Das Extrahieren von Text aus Screenshots hat sich jedoch oft als schwierig erwiesen, aufgrund der Dimensionen und des Rauschens, die beim Aufnehmen entstehen. Dadurch sind Screenshots ein weniger effektives Medium bei der Veröffentlichung von OCR.

IronOCR löst dieses Problem jedoch, indem es spezialisierte Methoden wie ReadScreenshot bereitstellt, um dies zu bekämpfen. ReadScreenshot ist optimiert, um Screenshots zu lesen und Informationen daraus zu extrahieren; es akzeptiert auch gängige Dateiformate.

Um diese Funktion zu verwenden, müssen Sie auch das IronOcr.Extension.AdvancedScan-Paket installieren.

als-Überschrift:2(Schnellstart: Text von einem Screenshot lesen)

Beginnen Sie in Sekundenschnelle mit IronOCR's ReadScreenshot – laden Sie einfach Ihren Screenshot in ein OcrInput, rufen Sie ReadScreenShot auf und greifen Sie sofort auf den extrahierten Text, den Vertrauenswert und die Textregionen über das OcrPhotoResult zu. Es ist der schnellste Weg, um Bilder mit minimalem Aufwand in verwertbaren Text zu verwandeln.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    OcrPhotoResult result = new IronTesseract().ReadScreenShot(new OcrInput().LoadImage("screenshot.png"));
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer

In diesem Leitfaden werden wir schnell demonstrieren, wie IronOCR zur Erkennung von Screenshot-Text verwendet werden kann, und Beispiele und die Eigenschaften des Ergebnissesobjekts durchgehen.

class="hsg-featured-snippet">

Minimaler Workflow (5 Schritte)

  1. Laden Sie die C#-Bibliothek zum Lesen von Screenshots herunter
  2. Importieren Sie die Screenshot-Bilder zur Verarbeitung
  3. Verwenden Sie die ReadScreenshot-Methode, um Text aus dem Bild zu extrahieren
  4. Rufen Sie die extrahierten Daten über die OcrPhotoResult-Eigenschaft für die Weiterverarbeitung ab
  5. Speichern oder exportieren Sie den extrahierten Text nach Bedarf

Screenshot-Lesebeispiel

Um einen Screenshot in IronOCR zu lesen, müssen wir die folgenden Schritte anwenden. Wir nutzen die ReadScreenshot-Methode, die ein OcrInput als Parameter für die Eingabe verwendet. Diese Methode ist mehr für Screenshots optimiert als das standardmäßige Read-Gegenstück der Bibliothek.

Hinweis:

  • Die Methode funktioniert derzeit für Sprachen wie Englisch, Chinesisch, Japanisch, Koreanisch und Latein-basierte Alphabete.
  • Die Verwendung eines erweiterten Scans auf .NET Framework erfordert, dass das Projekt auf x64-Architektur läuft.

Eingabe

Unten ist unser Input für das Codebeispiel; wir werden die Vielseitigkeit dieser Methode demonstrieren, indem wir verschiedene Schriftarten und -größen mischen.

Input

Code

:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");

// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);

// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")

' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)

' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
$vbLabelText   $csharpLabel

Ausgabe

Output

Wie Sie aus der Konsolenausgabe oben sehen können, wurden alle Textinstanzen aus dem Screenshot extrahiert. Lassen Sie uns tiefer in die Eigenschaften von OcrPhotoResult eintauchen.

  • Text: Der extrahierte Text aus dem OCR Input.
  • Confidence: Eine doppelte Eigenschaft, die das statistische Genauigkeitsvertrauen anzeigt, mit einer Skala von 0 bis 1, wobei 1 das höchste Vertrauensniveau ist.
  • TextRegion: Ein Array von TextRegion-Objekten, die Eigenschaften halten, die die Bereiche zurückgeben, in denen Text auf dem Screenshot gefunden wird. Standardmäßig ist alle TextRegion eine abgeleitete Rectangle-Klasse aus den IronOCR-Modellen. Es enthält die x- und y-Koordinaten sowie die Höhe und Breite des Rechtecks.

Häufig gestellte Fragen

Wie kann ich Text aus einem Bildschirmfoto mit C# extrahieren?

Sie können Text aus einem Bildschirmfoto mit der ReadScreenshot-Methode von IronOCR extrahieren. Diese Methode ist für Bildschirmfotos optimiert und unterstützt mehrere Sprachen. Beginnen Sie mit dem Download der IronOCR-Bibliothek von NuGet, importieren Sie dann Ihre Bildschirmfotos und verwenden Sie die ReadScreenshot-Funktion, um Text abzurufen.

Welche Dateiformate sind mit der ReadScreenshot-Methode kompatibel?

Die ReadScreenshot-Methode in IronOCR ist darauf ausgelegt, gängige Bilddateiformate zu akzeptieren, was sie vielseitig für die Textextraktion aus verschiedenen Arten von Bildschirmdateien macht.

Warum ist die ReadScreenshot-Methode für Bildschirmfotos vorzuziehen?

Die ReadScreenshot-Methode ist speziell für die Dimensionen und das typischerweise in Bildschirmfotos vorhandene Rauschen optimiert und bietet eine genauere Textextraktion im Vergleich zu standardmäßigen OCR-Methoden.

Welche Sprachen unterstützt IronOCR für die OCR-Textextraktion?

IronOCR unterstützt eine Vielzahl von Sprachen für die OCR-Textextraktion, darunter Englisch, Chinesisch, Japanisch, Koreanisch und auf Latein basierende Alphabete, was es für diverse Anwendungen geeignet macht.

Wie funktioniert die Confidence-Eigenschaft in IronOCR?

In IronOCR ist die Confidence-Eigenschaft ein Doppelwert, der von 0 bis 1 reicht und angibt, wie wahrscheinlich die Genauigkeit des extrahierten Textes ist. Ein Wert näher an 1 deutet auf ein höheres Vertrauensniveau hin.

Was sind TextRegion-Objekte in IronOCR?

TextRegion-Objekte in IronOCR repräsentieren die spezifischen Bereiche auf einem Bildschirmfoto, in denen Text erkannt wird. Diese Objekte enthalten Koordinaten und Dimensionen, um den Benutzern das Layout des extrahierten Textes zu verdeutlichen.

Benötige ich zusätzliche Pakete, um die Fähigkeiten von IronOCR zu verbessern?

Ja, um erweiterte Scan-Funktionen in IronOCR zu nutzen, sollten Sie das Paket IronOcr.Extension.AdvancedScan von NuGet installieren, das die Leistung und Fähigkeiten der Bibliothek verbessert.

Wie kann ich IronOCR in meinem C#-Projekt zum Lesen von Bildschirmfotos implementieren?

Um IronOCR in Ihrem C#-Projekt zum Lesen von Bildschirmfotos zu implementieren, laden Sie zunächst die Bibliothek von NuGet herunter, importieren Sie Ihre Bildschirmfotos und verwenden Sie dann die ReadScreenshot-Methode, um Text zu extrahieren. Verarbeiten Sie schließlich die extrahierten Daten mit der OcrPhotoResult-Eigenschaft.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen
Bereit anzufangen?
Nuget Downloads 5,044,537 | Version: 2025.11 gerade veröffentlicht