Zum Fußzeileninhalt springen
VERWENDUNG VON IRONOCR

Wie man Text aus einem Screenshot in C# mit OCR erhält

Viele Menschen da draußen fragen sich vielleicht: "Was ist ein OCR-Screenshot?" Andere könnten sich fragen, wie man einen Screenshot eines beliebigen Textes in ein digitales, textbearbeitbares Format oder in .txt oder .doc umwandelt. Wenn Sie einer dieser Menschen sind, brauchen Sie sich keine Sorgen mehr zu machen, denn wir haben die perfekten Lösungen für Sie.

In diesem Artikel werden wir verschiedene Tools besprechen, mit denen Sie OCR, die optische Zeichenerkennung, auf Screenshots durchführen können.

Es gibt viele OCR-Tools, aber heute werden wir IronOCR verwenden, um Text aus Screenshots zu extrahieren.

1. IronOCR

IronOCR ist eine Softwarebibliothek für die Programmiersprachen C# und VB.NET, die Entwicklern ermöglicht, OCR-Funktionalitäten (Optical Character Recognition) in ihre Anwendungen zu integrieren. Die Bibliothek kann verwendet werden, um Text in Bildern zu erkennen und in maschinenlesbaren Text umzuwandeln. Die Bibliothek basiert auf der Tesseract OCR-Engine, die als eine der genauesten OCR-Engines gilt.

IronOCR kann verwendet werden, um Text aus Bildern in vielen verschiedenen Dateiformaten zu lesen, einschließlich PNG, JPG, TIFF und PDF. Es bietet auch eine Reihe fortschrittlicher Funktionen für die Arbeit mit Texterkennung, wie die Fähigkeit, mehrere Sprachen zu erkennen, sowie die Fähigkeit, Text aus Bildern zu erkennen, die gedreht oder verzerrt wurden. Darüber hinaus können Entwickler IronOCR verwenden, um schnell OCR-Funktionen in ihre Anwendungen zu integrieren, da es eine einfache, benutzerfreundliche API bereitstellt, die aus C#- oder VB.NET-Code aufgerufen werden kann. Mit IronOCR können Sie Ihre OCR-Sprache auswählen und OCR auf Bildern, digitalen PDF-Dateien und gescannten PDF-Dateien durchführen.

IronOCR wird als gute Option für Entwickler angesehen, die OCR-Funktionalität zu ihren Anwendungen hinzufügen möchten. Es ist Open-Source, einfach zu verwenden und zu integrieren, schnell, präzise und auf dem neuesten Stand mit den neuesten OCR-Technologien.

2. IronOCR Features

IronOCR bietet eine breite Palette von Funktionen, um Entwicklern zu helfen, OCR-Funktionalität in ihre Anwendungen zu integrieren. Zu den Hauptfunktionen von IronOCR gehören:

  1. Mehrsprachige Unterstützung: IronOCR kann Texte in über 60 Sprachen erkennen, darunter Englisch, Spanisch, Deutsch, Französisch, Italienisch und Chinesisch.
  2. Automatische Erkennung der Textausrichtung: IronOCR kann die Ausrichtung von Text in einem Bild automatisch erkennen, auch wenn das Bild gedreht oder verzerrt wurde.
  3. Support for a wide range of image formats: IronOCR can read text from images in many different file formats, including PNG, JPG, TIFF, and PDF.
  4. Anpassbare Erkennungseinstellungen: Entwickler können die Erkennungseinstellungen anpassen, um die Erkennungsgenauigkeit für spezifische Bildtypen oder Anwendungsfälle zu verbessern.
  5. Fähigkeit, Text aus gescannten Dokumenten und PDFs mit mehreren Seiten zu erkennen.
  6. Schnelle Erkennung und hohe Genauigkeit: IronOCR verwendet die Tesseract OCR-Engine, eine der genauesten und am weitesten verbreiteten OCR-Engines.
  7. Einfach zu bedienende API: IronOCR bietet eine einfache, benutzerfreundliche API, die aus C#- oder VB.NET-Code aufgerufen werden kann, was es einfach macht, OCR-Funktionalität in jede Anwendung zu integrieren.

Insgesamt ist IronOCR ein leistungsstarkes Tool, das eine breite Palette von Funktionen bietet, um Entwicklern dabei zu helfen, OCR-Funktionalität in ihre Anwendungen zu integrieren.

3. Erstellen eines neuen Projekts in Visual Studio

Öffnen Sie Visual Studio und gehen Sie zum Datei-Menü. Wählen Sie "Neues Projekt" und dann Konsolenanwendung.

Geben Sie den Projektname ein und wählen Sie den Pfad im entsprechenden Textfeld. Klicken Sie dann auf die Schaltfläche Erstellen. Wählen Sie das erforderliche .NET-Framework, wie im folgenden Screenshot:

Wie man Text aus einem Screenshot in C# mit OCR erhält, Abbildung 1: Erstellen eines neuen Projekts in Visual Studio Erstellen eines neuen Projekts in Visual Studio

Das Visual Studio-Projekt wird nun die Struktur für die Konsolenanwendung generieren. Nach Fertigstellung wird die program.cs Datei geöffnet, in die Sie Quellcode schreiben und ausführen können.

Wie man Text aus einem Screenshot in C# mit OCR erhält, Abbildung 2: Die Datei program.cs, generiert vom Visual Studio-Assistent für neue Projekte Die Datei program.cs, generiert vom Visual Studio-Assistent für neue Projekte

Jetzt können wir die IronOCR-Bibliothek hinzufügen und das Programm testen.

4. Installieren von IronOCR

In Visual Studio können Sie IronOCR ganz einfach in Ihr C#-Projekt integrieren.

IronOCR bietet mehrere Prozesse, um sich in ein C# .NET-Projekt zu integrieren. Hier werden wir eine davon besprechen: die Installation von IronOCR über den NuGet-Paket-Manager.

Gehen Sie in Visual Studio zu Tools > NuGet-Paket-Manager > Paket-Manager-Konsole

Wie man Text aus einem Screenshot in C# mit OCR erhält, Abbildung 3: Die NuGet-Paket-Manager-Benutzeroberfläche Die NuGet-Paket-Manager-Benutzeroberfläche

Nach dem Klicken wird eine neue Konsole am unteren Rand des Visual Studio-Fensters erscheinen. Geben Sie den untenstehenden Befehl in die Konsole ein und drücken Sie die Eingabetaste.

Install-Package IronOcr

IronOCR wird in nur wenigen Sekunden installiert.

5. Verwendung von IronOCR, um OCR auf einem Screenshot auszuführen

IronOCR ist eine leistungsstarke OCR-Bibliothek, die verwendet werden kann, um Text aus Screenshots zu erkennen. Mit IronOCR können Sie einen Screenshot von Text machen und dann die OCR-Funktionalitäten der Bibliothek verwenden, um den Text im Screenshot in ein digitales, bearbeitbares Format zu konvertieren. Hier ist ein Beispiel, wie Sie IronOCR verwenden könnten, um OCR auf einem Screenshot in C# auszuführen. Um Screenshot-OCR auszuführen, erfassen Sie einfach einen Screenshot und führen Sie den untenstehenden Code aus, um den Text in jedes gewünschte Ausgabeformat zu extrahieren.

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        // Create an instance of IronTesseract, the core OCR engine
        var ocr = new IronTesseract();

        // Perform OCR on the specified image file
        var result = ocr.Read("ocr.png");

        // Output the recognized text to the console
        Console.WriteLine(result.Text);
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        // Create an instance of IronTesseract, the core OCR engine
        var ocr = new IronTesseract();

        // Perform OCR on the specified image file
        var result = ocr.Read("ocr.png");

        // Output the recognized text to the console
        Console.WriteLine(result.Text);
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		' Create an instance of IronTesseract, the core OCR engine
		Dim ocr = New IronTesseract()

		' Perform OCR on the specified image file
		Dim result = ocr.Read("ocr.png")

		' Output the recognized text to the console
		Console.WriteLine(result.Text)
	End Sub
End Class
$vbLabelText   $csharpLabel

Eingabebilddatei

Wie man Text aus einem Screenshot in C# mit OCR erhält, Abbildung 4: Beispiel-Screenshot, der als Eingabe verwendet wird Beispiel-Screenshot, der als Eingabe verwendet wird

Textausgabe

- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 125+ global language packs
- Output as text, structured data, or searchable PDFs
- Supports NET 6, 5, Core, Standard, Framework

6. Nutzung von IronOCR, um OCR auf einer spezifischen Zone auszuführen

IronOCR erlaubt es Ihnen, OCR auf spezifischen Zonen innerhalb eines Bildes auszuführen. Dies kann nützlich sein, wenn das Bild mehrere Textbereiche enthält und Sie nur den Text innerhalb einer bestimmten Region erkennen möchten. Ein Beispielcode für diesen Fall wird unten gezeigt.

using IronOcr;
using IronSoftware.Drawing;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();

        using (var ocrInput = new OcrInput())
        {
            // Define the rectangle to crop the image for OCR
            var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);

            // Add the image with the specified cropping area
            ocrInput.AddImage("ocr.png", contentArea);

            // Perform the OCR operation on the defined area
            var ocrResult = ocrTesseract.Read(ocrInput);

            // Output the recognized text
            Console.WriteLine(ocrResult.Text);
        }
    }
}
using IronOcr;
using IronSoftware.Drawing;
using System;

class Program
{
    static void Main()
    {
        var ocrTesseract = new IronTesseract();

        using (var ocrInput = new OcrInput())
        {
            // Define the rectangle to crop the image for OCR
            var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);

            // Add the image with the specified cropping area
            ocrInput.AddImage("ocr.png", contentArea);

            // Perform the OCR operation on the defined area
            var ocrResult = ocrTesseract.Read(ocrInput);

            // Output the recognized text
            Console.WriteLine(ocrResult.Text);
        }
    }
}
Imports IronOcr
Imports IronSoftware.Drawing
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocrTesseract = New IronTesseract()

		Using ocrInput As New OcrInput()
			' Define the rectangle to crop the image for OCR
			Dim contentArea = New CropRectangle(x:= 0, y:= 0, width:= 350, height:= 150)

			' Add the image with the specified cropping area
			ocrInput.AddImage("ocr.png", contentArea)

			' Perform the OCR operation on the defined area
			Dim ocrResult = ocrTesseract.Read(ocrInput)

			' Output the recognized text
			Console.WriteLine(ocrResult.Text)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Ausgabe

- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 125+ global language packs

7. Nutzung von IronOCR, um OCR auf einem Bild auszuführen

Um OCR auf einem Bild auszuführen und den erkannten Text in einer .txt-Datei zu speichern, können Sie den folgenden Code verwenden.

using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using (var input = new OcrInput("ocr.png"))
        {
            // Perform OCR on the image
            var result = ocr.Read(input);

            // Save the recognized text to a .txt file
            result.SaveAsTextFile("output.txt");
        }
    }
}
using IronOcr;
using System;

class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using (var input = new OcrInput("ocr.png"))
        {
            // Perform OCR on the image
            var result = ocr.Read(input);

            // Save the recognized text to a .txt file
            result.SaveAsTextFile("output.txt");
        }
    }
}
Imports IronOcr
Imports System

Friend Class Program
	Shared Sub Main()
		Dim ocr = New IronTesseract()
		Using input = New OcrInput("ocr.png")
			' Perform OCR on the image
			Dim result = ocr.Read(input)

			' Save the recognized text to a .txt file
			result.SaveAsTextFile("output.txt")
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Der Inhalt der Ausgabedatei wird unten angezeigt:

Wie man Text aus einem Screenshot in C# mit OCR erhält, Abbildung 5: Inhalt der generierten output.txt-Datei Inhalt der generierten output.txt-Datei

8. Mehr erfahren

Lesen Sie das Tutorial zur Textextraktion aus Bildern, um mehr Informationen darüber zu erhalten, wie OCR auf Bildern ausgeführt wird.

IronOCR ist Teil eines Paket von fünf .NET-Bibliotheken, die für den Umgang mit verschiedenen Dokumenttypen konzipiert wurden. Sie können alle fünf Bibliotheken zum Preis von nur zwei Lizenzen erwerben.

Häufig gestellte Fragen

Wie kann ich mit OCR in C# Text aus einem Screenshot extrahieren?

Sie können IronOCR in C# verwenden, um Text aus einem Screenshot zu extrahieren, indem Sie dessen einfache API nutzen, um den Screenshot in ein digital bearbeitbares Textformat zu konvertieren. Installieren Sie zuerst IronOCR über NuGet in Visual Studio und verwenden Sie dann die von IronOCR bereitgestellten Codebeispiele, um die OCR auf Ihrem Screenshot durchzuführen.

Was ist optische Zeichenerkennung (OCR)?

Optische Zeichenerkennung (OCR) ist eine Technologie, die verschiedene Arten von Dokumenten, wie gescannte Papierdokumente, PDF-Dateien oder Bilder einer Digitalkamera, in bearbeitbare und durchsuchbare Daten umwandelt. IronOCR ist eine C#-Bibliothek, die die OCR-Anwendung in Anwendungen erleichtert.

Kann IronOCR mehrere Sprachen für die OCR verarbeiten?

Ja, IronOCR unterstützt die Texterkennung in über 60 Sprachen, was es für internationale Anwendungen vielseitig macht. Es bietet Optionen, um die Spracheinstellungen festzulegen, um eine genaue Texterkennung zu gewährleisten.

Welche Bildformate unterstützt IronOCR für die OCR?

IronOCR unterstützt verschiedene Bildformate für OCR, einschließlich PNG, JPG, TIFF und PDF. Diese Flexibilität ermöglicht es Entwicklern, mit einer breiten Palette von Bildquellen zu arbeiten, ohne die Formate manuell konvertieren zu müssen.

Wie kann die Textausrichtung die OCR-Genauigkeit beeinflussen?

Die Textausrichtung kann die OCR-Genauigkeit erheblich beeinflussen. IronOCR erkennt und korrigiert automatisch die Textausrichtung in Bildern, um sicherzustellen, dass gedrehter oder geneigter Text genau erkannt und in ein digitales Format umgewandelt wird.

Wie installiere ich IronOCR in einem C#-Projekt?

Um IronOCR in einem C#-Projekt zu installieren, verwenden Sie den NuGet-Paket-Manager in Visual Studio. Suchen Sie nach IronOCR und installieren Sie es in Ihrem Projekt, um mit der Nutzung seiner OCR-Funktionen zur Textextraktion aus Bildern zu beginnen.

Was sind die Vorteile der Verwendung von IronOCR für die Texterkennung?

IronOCR bietet mehrere Vorteile, darunter robuste Mehrsprachunterstützung, automatische Textausrichtungskorrektur, Unterstützung mehrerer Bildformate und anpassbare Einstellungen zur Verbesserung der Erkennungsgenauigkeit. Seine einfache API erleichtert die Integration in C#-Anwendungen.

Ist IronOCR geeignet, um Text in bestimmten Bereichen eines Bildes zu erkennen?

Ja, IronOCR ermöglicht es Entwicklern, bestimmte Bereiche innerhalb eines Bildes zu definieren, um OCR durchzuführen, was eine gezielte Textextraktion ermöglicht. Diese Funktion ist nützlich in Szenarien, in denen nur ein Teil des Bildes den relevanten Text enthält.

Was sind einige häufige Tipps zur Fehlerbehebung bei OCR-Problemen?

Häufige Tipps zur Fehlerbehebung bei OCR-Problemen umfassen die Sicherstellung, dass das Bild klar und hochauflösend ist, die Überprüfung der Textausrichtung, die Gewährleistung, dass die richtige Sprache eingestellt ist und das Aktualisieren auf die neueste Version von IronOCR für optimale Leistung.

Wie kann ich OCR-Ergebnisse in eine .txt- oder .doc-Datei konvertieren?

Mit IronOCR können Sie OCR-Ergebnisse in eine .txt- oder .doc-Datei konvertieren, indem Sie den Text aus dem Bild extrahieren und ihn mithilfe von Standard-Dateiein-/ausgabe-Operationen in C# speichern. Dadurch können Sie bearbeitbare Dokumente aus textbasierten Bildern erstellen.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen