Wie man Text aus einem Screenshot in C# mit OCR erhält
Viele Menschen da draußen fragen sich vielleicht: "Was ist ein OCR-Screenshot?" Andere könnten sich fragen, wie man einen Screenshot eines beliebigen Textes in ein digitales, textbearbeitbares Format oder in .txt oder .doc umwandelt. Wenn Sie einer dieser Menschen sind, brauchen Sie sich keine Sorgen mehr zu machen, denn wir haben die perfekten Lösungen für Sie.
In diesem Artikel werden wir verschiedene Tools besprechen, mit denen Sie OCR, die optische Zeichenerkennung, auf Screenshots durchführen können.
Es gibt viele OCR-Tools, aber heute werden wir IronOCR verwenden, um Text aus Screenshots zu extrahieren.
1. IronOCR
IronOCR ist eine Softwarebibliothek für die Programmiersprachen C# und VB.NET, die Entwicklern ermöglicht, OCR-Funktionalitäten (Optical Character Recognition) in ihre Anwendungen zu integrieren. Die Bibliothek kann verwendet werden, um Text in Bildern zu erkennen und in maschinenlesbaren Text umzuwandeln. Die Bibliothek basiert auf der Tesseract OCR-Engine, die als eine der genauesten OCR-Engines gilt.
IronOCR kann verwendet werden, um Text aus Bildern in vielen verschiedenen Dateiformaten zu lesen, einschließlich PNG, JPG, TIFF und PDF. Es bietet auch eine Reihe fortschrittlicher Funktionen für die Arbeit mit Texterkennung, wie die Fähigkeit, mehrere Sprachen zu erkennen, sowie die Fähigkeit, Text aus Bildern zu erkennen, die gedreht oder verzerrt wurden. Darüber hinaus können Entwickler IronOCR verwenden, um schnell OCR-Funktionen in ihre Anwendungen zu integrieren, da es eine einfache, benutzerfreundliche API bereitstellt, die aus C#- oder VB.NET-Code aufgerufen werden kann. Mit IronOCR können Sie Ihre OCR-Sprache auswählen und OCR auf Bildern, digitalen PDF-Dateien und gescannten PDF-Dateien durchführen.
IronOCR wird als gute Option für Entwickler angesehen, die OCR-Funktionalität zu ihren Anwendungen hinzufügen möchten. Es ist Open-Source, einfach zu verwenden und zu integrieren, schnell, präzise und auf dem neuesten Stand mit den neuesten OCR-Technologien.
2. IronOCR Features
IronOCR bietet eine breite Palette von Funktionen, um Entwicklern zu helfen, OCR-Funktionalität in ihre Anwendungen zu integrieren. Zu den Hauptfunktionen von IronOCR gehören:
- Mehrsprachige Unterstützung: IronOCR kann Texte in über 60 Sprachen erkennen, darunter Englisch, Spanisch, Deutsch, Französisch, Italienisch und Chinesisch.
- Automatische Erkennung der Textausrichtung: IronOCR kann die Ausrichtung von Text in einem Bild automatisch erkennen, auch wenn das Bild gedreht oder verzerrt wurde.
- Unterstützung für eine breite Palette von Bildformaten: IronOCR kann Text aus Bildern in vielen verschiedenen Dateiformaten lesen, darunter PNG, JPG, TIFF und PDF .
- Anpassbare Erkennungseinstellungen: Entwickler können die Erkennungseinstellungen anpassen, um die Erkennungsgenauigkeit für bestimmte Bildtypen oder Anwendungsfälle zu verbessern.
- Fähigkeit, Text aus gescannten Dokumenten und PDFs mit mehreren Seiten zu erkennen.
- Schnelle Erkennung und hohe Genauigkeit: IronOCR verwendet die Tesseract OCR-Engine, eine der genauesten und am weitesten verbreiteten OCR-Engines auf dem Markt.
- Benutzerfreundliche API: IronOCR bietet eine einfache, benutzerfreundliche API, die aus C#- oder VB .NET -Code aufgerufen werden kann, wodurch die Integration der OCR-Funktionalität in jede beliebige Anwendung vereinfacht wird.
Insgesamt ist IronOCR ein leistungsstarkes Tool, das eine breite Palette von Funktionen bietet, um Entwicklern dabei zu helfen, OCR-Funktionalität in ihre Anwendungen zu integrieren.
3. Erstellen eines neuen Projekts in Visual Studio
Öffnen Sie Visual Studio und gehen Sie zum Datei-Menü. Wählen Sie "Neues Projekt" und dann Konsolenanwendung.
Geben Sie den Projektname ein und wählen Sie den Pfad im entsprechenden Textfeld. Klicken Sie auf die Schaltfläche Erstellen. Wählen Sie das erforderliche .NET-Framework, wie im folgenden Screenshot:
Erstellen eines neuen Projekts in Visual Studio
Das Visual Studio-Projekt wird nun die Struktur für die Konsolenanwendung generieren. Nach Abschluss des Vorgangs wird die Datei program.cs geöffnet, in der Sie Quellcode schreiben und ausführen können.
Die Datei program.cs, generiert vom Visual Studio-Assistent für neue Projekte
Jetzt können wir die IronOCR-Bibliothek hinzufügen und das Programm testen.
4. Installieren von IronOCR
In Visual Studio können Sie IronOCR ganz einfach in Ihr C#-Projekt integrieren.
IronOCR bietet mehrere Prozesse, um sich in ein C# .NET-Projekt zu integrieren. Hier werden wir eine davon besprechen: die Installation von IronOCR über den NuGet-Paket-Manager.
Gehen Sie in Visual Studio zu Tools > NuGet-Paket-Manager > Paket-Manager-Konsole
Die NuGet-Paket-Manager-Benutzeroberfläche
Nach dem Klicken wird eine neue Konsole am unteren Rand des Visual Studio-Fensters erscheinen. Geben Sie den Befehl in die Konsole ein und drücken Sie Enter.
Install-Package IronOcr
IronOCR wird in nur wenigen Sekunden installiert.
5. Verwendung von IronOCR, um OCR auf einem Screenshot auszuführen
IronOCR ist eine leistungsstarke OCR-Bibliothek, die verwendet werden kann, um Text aus Screenshots zu erkennen. Mit IronOCR können Sie einen Screenshot von Text machen und dann die OCR-Funktionalitäten der Bibliothek verwenden, um den Text im Screenshot in ein digitales, bearbeitbares Format zu konvertieren. Hier ist ein Beispiel, wie Sie IronOCR verwenden könnten, um OCR auf einem Screenshot in C# auszuführen. Um Screenshot-OCR auszuführen, erfassen Sie einfach einen Screenshot und führen Sie den untenstehenden Code aus, um den Text in jedes gewünschte Ausgabeformat zu extrahieren.
using IronOcr;
using System;
class Program
{
static void Main()
{
// Create an instance of IronTesseract, the core OCR engine
var ocr = new IronTesseract();
// Perform OCR on the specified image file
var result = ocr.Read("ocr.png");
// Output the recognized text to the console
Console.WriteLine(result.Text);
}
}
using IronOcr;
using System;
class Program
{
static void Main()
{
// Create an instance of IronTesseract, the core OCR engine
var ocr = new IronTesseract();
// Perform OCR on the specified image file
var result = ocr.Read("ocr.png");
// Output the recognized text to the console
Console.WriteLine(result.Text);
}
}
Imports IronOcr
Imports System
Friend Class Program
Shared Sub Main()
' Create an instance of IronTesseract, the core OCR engine
Dim ocr = New IronTesseract()
' Perform OCR on the specified image file
Dim result = ocr.Read("ocr.png")
' Output the recognized text to the console
Console.WriteLine(result.Text)
End Sub
End Class
Eingabebilddatei
Beispiel-Screenshot, der als Eingabe verwendet wird
Textausgabe
- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 125+ global language packs
- Output as text, structured data, or searchable PDFs
- Supports NET 6, 5, Core, Standard, Framework
6. Verwendung von IronOCR zur Durchführung von OCR in einem bestimmten Bereich
IronOCR erlaubt es Ihnen, OCR auf spezifischen Zonen innerhalb eines Bildes auszuführen. Dies kann nützlich sein, wenn das Bild mehrere Textbereiche enthält und Sie nur den Text innerhalb einer bestimmten Region erkennen möchten. Ein Beispielcode für diesen Fall wird unten gezeigt.
using IronOcr;
using IronSoftware.Drawing;
using System;
class Program
{
static void Main()
{
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
// Define the rectangle to crop the image for OCR
var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
// Add the image with the specified cropping area
ocrInput.AddImage("ocr.png", contentArea);
// Perform the OCR operation on the defined area
var ocrResult = ocrTesseract.Read(ocrInput);
// Output the recognized text
Console.WriteLine(ocrResult.Text);
}
}
}
using IronOcr;
using IronSoftware.Drawing;
using System;
class Program
{
static void Main()
{
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
// Define the rectangle to crop the image for OCR
var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
// Add the image with the specified cropping area
ocrInput.AddImage("ocr.png", contentArea);
// Perform the OCR operation on the defined area
var ocrResult = ocrTesseract.Read(ocrInput);
// Output the recognized text
Console.WriteLine(ocrResult.Text);
}
}
}
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
Friend Class Program
Shared Sub Main()
Dim ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput()
' Define the rectangle to crop the image for OCR
Dim contentArea = New CropRectangle(x:= 0, y:= 0, width:= 350, height:= 150)
' Add the image with the specified cropping area
ocrInput.AddImage("ocr.png", contentArea)
' Perform the OCR operation on the defined area
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Output the recognized text
Console.WriteLine(ocrResult.Text)
End Using
End Sub
End Class
Ausgabe
- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 125+ global language packs
7. Nutzung von IronOCR, um OCR auf einem Bild auszuführen
Um OCR auf einem Bild auszuführen und den erkannten Text in einer .txt-Datei zu speichern, können Sie den folgenden Code verwenden.
using IronOcr;
using System;
class Program
{
static void Main()
{
var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
// Perform OCR on the image
var result = ocr.Read(input);
// Save the recognized text to a .txt file
result.SaveAsTextFile("output.txt");
}
}
}
using IronOcr;
using System;
class Program
{
static void Main()
{
var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
// Perform OCR on the image
var result = ocr.Read(input);
// Save the recognized text to a .txt file
result.SaveAsTextFile("output.txt");
}
}
}
Imports IronOcr
Imports System
Friend Class Program
Shared Sub Main()
Dim ocr = New IronTesseract()
Using input = New OcrInput("ocr.png")
' Perform OCR on the image
Dim result = ocr.Read(input)
' Save the recognized text to a .txt file
result.SaveAsTextFile("output.txt")
End Using
End Sub
End Class
Der Inhalt der Ausgabedatei wird unten angezeigt:
Inhalt der generierten output.txt-Datei
8. Mehr erfahren
Lesen Sie das Tutorial zur Textextraktion aus Bildern, um mehr Informationen darüber zu erhalten, wie OCR auf Bildern ausgeführt wird.
IronOCR ist Teil eines Paket von fünf .NET-Bibliotheken, die für den Umgang mit verschiedenen Dokumenttypen konzipiert wurden. Sie können alle fünf Bibliotheken zum Preis von nur zwei Lizenzen erwerben.
Häufig gestellte Fragen
Wie kann ich mit OCR in C# Text aus einem Screenshot extrahieren?
Sie können IronOCR in C# verwenden, um Text aus einem Screenshot zu extrahieren, indem Sie dessen einfache API nutzen, um den Screenshot in ein digital bearbeitbares Textformat zu konvertieren. Installieren Sie zuerst IronOCR über NuGet in Visual Studio und verwenden Sie dann die von IronOCR bereitgestellten Codebeispiele, um die OCR auf Ihrem Screenshot durchzuführen.
Was ist optische Zeichenerkennung (OCR)?
Optische Zeichenerkennung (OCR) ist eine Technologie, die verschiedene Arten von Dokumenten, wie gescannte Papierdokumente, PDF-Dateien oder Bilder einer Digitalkamera, in bearbeitbare und durchsuchbare Daten umwandelt. IronOCR ist eine C#-Bibliothek, die die OCR-Anwendung in Anwendungen erleichtert.
Kann IronOCR mehrere Sprachen für die OCR verarbeiten?
Ja, IronOCR unterstützt die Texterkennung in über 60 Sprachen, was es für internationale Anwendungen vielseitig macht. Es bietet Optionen, um die Spracheinstellungen festzulegen, um eine genaue Texterkennung zu gewährleisten.
Welche Bildformate unterstützt IronOCR für die OCR?
IronOCR unterstützt verschiedene Bildformate für OCR, einschließlich PNG, JPG, TIFF und PDF. Diese Flexibilität ermöglicht es Entwicklern, mit einer Vielzahl von Bildquellen zu arbeiten, ohne die Formate manuell konvertieren zu müssen.
Wie kann die Textausrichtung die OCR-Genauigkeit beeinflussen?
Die Textausrichtung kann die OCR-Genauigkeit erheblich beeinflussen. IronOCR erkennt und korrigiert automatisch die Textausrichtung in Bildern, um sicherzustellen, dass gedrehter oder geneigter Text genau erkannt und in ein digitales Format umgewandelt wird.
Wie installiere ich IronOCR in einem C#-Projekt?
Um IronOCR in einem C#-Projekt zu installieren, verwenden Sie den NuGet-Paket-Manager in Visual Studio. Suchen Sie nach IronOCR und installieren Sie es in Ihrem Projekt, um mit der Nutzung seiner OCR-Funktionen zur Textextraktion aus Bildern zu beginnen.
Was sind die Vorteile der Verwendung von IronOCR für die Texterkennung?
IronOCR bietet mehrere Vorteile, darunter robuste Mehrsprachunterstützung, automatische Textausrichtungskorrektur, Unterstützung mehrerer Bildformate und anpassbare Einstellungen zur Verbesserung der Erkennungsgenauigkeit. Seine einfache API erleichtert die Integration in C#-Anwendungen.
Ist IronOCR geeignet, um Text in bestimmten Bereichen eines Bildes zu erkennen?
Ja, IronOCR ermöglicht es Entwicklern, bestimmte Bereiche innerhalb eines Bildes zu definieren, um OCR durchzuführen, was eine gezielte Textextraktion ermöglicht. Diese Funktion ist nützlich in Szenarien, in denen nur ein Teil des Bildes den relevanten Text enthält.
Was sind einige häufige Tipps zur Fehlerbehebung bei OCR-Problemen?
Häufige Tipps zur Fehlerbehebung bei OCR-Problemen umfassen die Sicherstellung, dass das Bild klar und hochauflösend ist, die Überprüfung der Textausrichtung, die Gewährleistung, dass die richtige Sprache eingestellt ist und das Aktualisieren auf die neueste Version von IronOCR für optimale Leistung.
Wie kann ich OCR-Ergebnisse in eine .txt- oder .doc-Datei konvertieren?
Mit IronOCR können Sie OCR-Ergebnisse in eine .txt- oder .doc-Datei konvertieren, indem Sie den Text aus dem Bild extrahieren und ihn mithilfe von Standard-Dateiein-/ausgabe-Operationen in C# speichern. Dadurch können Sie bearbeitbare Dokumente aus textbasierten Bildern erstellen.



