IRONOCR VERWENDEN

Wie OCR Text aus einem Screenshot in C# abrufen kann

Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

Kannapat Udonpant

22. Februar 2023

Aktualisiert 18. Dezember 2023

Teilen Sie:

Viele Menschen fragen sich vielleicht: "Was ist ein OCR-Screenshot?" Andere fragen sich vielleicht, wie man einen Screenshot eines beliebigen Textes in ein digitales, textverarbeitbares Format oder in das .txt- oder .doc-Format umwandelt. Wenn Sie zu diesen Menschen gehören, brauchen Sie sich keine Sorgen mehr zu machen, denn wir haben die perfekten Lösungen für Sie.

In diesem Artikel werden wir verschiedene Tools besprechen, mit denen Sie OCR (Optical Character Recognition) an Screenshots durchführen können.

Es gibt viele OCR-Tools, aber heute werden wir IronOCR verwenden, um Text aus Screenshots zu extrahieren.

1. IronOCR

IronOCR ist eine Softwarebibliothek für die Programmiersprachen C# und VB.NET, die Entwicklern ermöglicht, OCR-Funktionen (Optische Zeichenerkennung) in ihre Anwendungen zu integrieren. Die Bibliothek kann verwendet werden, um Text in Bildern zu erkennen und in maschinenlesbaren Text zu konvertieren. Die Bibliothek basiert auf der Tesseract OCR-Engine, die als eine der genauesten verfügbaren OCR-Engines gilt.

IronOCR kann zum Lesen von Text aus Bildern in vielen verschiedenen Dateiformaten verwendet werden, darunter PNG, JPG, TIFF und PDF. Es bietet auch eine Reihe von erweiterten Funktionen für die Arbeit mit der Texterkennung, wie z. B. die Fähigkeit, mehrere Sprachen zu erkennen, sowie die Fähigkeit, Text aus Bildern zu erkennen, die gedreht oder schräg gestellt wurden. Darüber hinaus können Entwickler IronOCR verwenden, um OCR-Funktionen schnell in ihre Anwendungen zu integrieren, da es eine einfache, benutzerfreundliche API bietet, die von C#- oder VB.NET-Code aus aufgerufen werden kann. Mit IronOCR können Sie Ihre OCR-Sprache auswählen und OCR für Bilder, digitale PDF-Dateien und gescannte PDF-Dateien durchführen.

IronOCR ist eine gute Option für Entwickler, die ihren Anwendungen OCR-Funktionen hinzufügen möchten. Sie ist quelloffen, einfach zu verwenden und zu integrieren, schnell, genau und mit den neuesten OCR-Technologien ausgestattet.

2. IronOCR Merkmale

IronOCR bietet eine breite Palette von Funktionen, die Entwicklern helfen, OCR-Funktionen in ihre Anwendungen zu integrieren. Einige der wichtigsten Merkmale von IronOCR sind:

Unterstützung mehrerer Sprachen: IronOCR kann Text in über 60 Sprachen erkennen, einschließlich Englisch, Spanisch, Deutsch, Französisch, Italienisch und Chinesisch.
Automatische Erkennung der Textorientierung: IronOCR kann die Orientierung von Text in einem Bild automatisch erkennen, selbst wenn das Bild gedreht oder verzerrt wurde.
Unterstützung für eine Vielzahl von Bildformaten: IronOCR kann Text aus Bildern in vielen verschiedenen Dateiformaten lesen, einschließlich PNG, JPG, TIFF und PDF.
Anpassbare Erkennungseinstellungen: Entwickler können die Erkennungseinstellungen anpassen, um die Erkennungsgenauigkeit für bestimmte Bildtypen oder Anwendungsfälle zu verbessern.
Erkennung von Text aus gescannten Dokumenten und PDF-Dateien mit mehreren Seiten.
Schnelle Erkennung und hohe Genauigkeit: IronOCR verwendet die Tesseract OCR-Engine, die eine der genauesten und am weitesten verbreiteten OCR-Engines ist.
Einfache API: IronOCR bietet eine einfache, benutzerfreundliche API, die aus C# oder VB.NET-Code aufgerufen werden kann, wodurch es leicht ist, OCR-Funktionalität in jede Anwendung zu integrieren.
Insgesamt ist IronOCR ein leistungsfähiges Tool, das Entwicklern dabei hilft, ihre Anwendungen um OCR-Funktionen zu erweitern.

3. Erstellen eines neuen Projekts in Visual Studio

Öffnen Sie Visual Studio und rufen Sie das Menü Datei auf. Wählen Sie "Neues Projekt" und dann "Konsolenanwendung".

Geben Sie den Projektnamen ein und wählen Sie den Pfad in dem entsprechenden Textfeld aus. Klicken Sie dann auf die Schaltfläche Erstellen. Wählen Sie das gewünschte .NET-Framework, wie in der folgenden Abbildung dargestellt:

Wie man in C# Text per OCR aus einem Screenshot erhält, Abbildung 1: Ein neues Projekt in Visual Studio erstellen

Erstellen eines neuen Projekts in Visual Studio

Das Visual Studio-Projekt wird nun die Struktur für die Konsolenanwendung generieren. Sobald es fertig ist, wird die Datei program.cs geöffnet, in der Sie Quellcode schreiben und ausführen können.

So extrahieren Sie Text aus einem Screenshot in C#, Abbildung 2: Die Datei program.cs, erstellt mit dem neuen Projekt-Assistenten von Visual Studio

Die Datei program.cs, erstellt vom Neuen Projekt-Assistenten von Visual Studio

Jetzt können wir die IronOCR-Bibliothek hinzufügen und das Programm testen.

4. IronOCR installieren

In Visual Studio können Sie IronOCR problemlos in Ihr C#-Projekt integrieren.

IronOCR bietet mehrere Prozesse zur Integration in ein C# .NET-Projekt. Hier werden wir eine davon besprechen: die Installation von IronOCR mit dem NuGet Package Manager.

Wechseln Sie in Visual Studio zu Extras > NuGet-Paket-Manager > Paket-Manager-Konsole

Wie man mit OCR Text aus einem Screenshot in C# extrahiert, Abbildung 3: Die NuGet-Paket-Manager-Benutzeroberfläche

Die NuGet-Paket-Manager-Benutzeroberfläche

Nach dem Klicken erscheint eine neue Konsole am unteren Rand des Visual Studio-Fensters. Geben Sie den folgenden Befehl in die Konsole ein und drücken Sie die Eingabetaste.

Install-Package IronOcr

IronOCR wird in nur wenigen Sekunden installiert sein.

5. Verwendung von IronOCR zur Durchführung von OCR auf einem Screenshot

IronOCR ist eine leistungsstarke OCR-Bibliothek, die zur Erkennung von Text aus Bildschirmfotos verwendet werden kann. Mit IronOCR können Sie einen Screenshot von Text machen und dann die OCR-Funktionen der Bibliothek nutzen, um den Text im Screenshot in ein digitales, bearbeitbares Format zu konvertieren. Hier ein Beispiel für die Verwendung von IronOCR zur Durchführung von OCR auf einem Screenshot in C#. Um die OCR von Screenshots durchzuführen, nehmen Sie einfach einen Screenshot auf und führen Sie den folgenden Code aus, um den Text in ein beliebiges Ausgabeformat zu extrahieren.

using IronOcr;
using System;

string imageText = new IronTesseract().Read("ocr.png").Text;
Console.WriteLine(imageText);

using IronOcr;
using System;

string imageText = new IronTesseract().Read("ocr.png").Text;
Console.WriteLine(imageText);

Imports IronOcr
Imports System

Private imageText As String = (New IronTesseract()).Read("ocr.png").Text
Console.WriteLine(imageText)

$vbLabelText $csharpLabel

Eingabe Bilddatei

Wie man OCR verwendet, um Text aus einem Screenshot in C# zu extrahieren, Abbildung 4: Beispiel-Screenshot für die Eingabe

Beispiel-Screenshot, der für die Eingabe verwendet wird

Textausgabe

- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 127+ global language packs
- Output as text, structured data, or searchable PDFs
- Supports NET 6, 5, Core, Standard, Framework

6. Verwendung von IronOCR zur Durchführung von OCR in einer bestimmten Zone

IronOCR ermöglicht es Ihnen, OCR an bestimmten Bereichen eines Bildes durchzuführen. Dies kann nützlich sein, wenn das Bild mehrere Textbereiche enthält und Sie nur den Text innerhalb eines bestimmten Bereichs erkennen möchten. Ein Beispielcode hierfür ist unten dargestellt.

using IronOcr;
using IronSoftware.Drawing;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
    var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
    ocrInput.AddImage("ocr.png", contentArea);
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}

using IronOcr;
using IronSoftware.Drawing;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
    var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
    ocrInput.AddImage("ocr.png", contentArea);
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}

Imports IronOcr
Imports IronSoftware.Drawing
Imports System

Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput()
	Dim contentArea = New CropRectangle(x:= 0, y:= 0, width:= 350, height:= 150)
	ocrInput.AddImage("ocr.png", contentArea)
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using

$vbLabelText $csharpLabel

Ausgabe

IRONOCR for .NET
Die C# OCR-Bibliothek
OCR für C# zum Scannen und Lesen von Bildern und PDFs
NET OCR-Bibliothek mit über 127 globalen Sprachpaketen

7. Verwendung von IronOCR zur Durchführung von OCR auf einem Bild

Um OCR an einem Bild durchzuführen und den erkannten Text in einer .txt-Datei zu speichern, können Sie den folgenden Code verwenden.

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
    var result = ocr.Read(input);
    result.SaveAsTextFile("output.txt");
}

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
    var result = ocr.Read(input);
    result.SaveAsTextFile("output.txt");
}

Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using input = New OcrInput("ocr.png")
	Dim result = ocr.Read(input)
	result.SaveAsTextFile("output.txt")
End Using

$vbLabelText $csharpLabel

Der Inhalt der Ausgabedatei ist unten dargestellt:

So führen Sie OCR aus, um Text aus einem Screenshot in C# zu extrahieren, Abbildung 5: Inhalt der generierten output.txt-Datei

Inhalt der generierten output.txt-Datei

8. Mehr erfahren

Lesen Sie das Tutorial zur Textextraktion aus Bildern für weitere Informationen darüber, wie Sie OCR auf Bildern durchführen können.

IronOCR ist Teil einer Suite von fünf .NET-Bibliotheken, die für die Arbeit mit verschiedenen Dokumenttypen entwickelt wurden. Sie können alle fünf Bibliotheken zum Preis von nur zwei Lizenzen erwerben.

Kannapat Udonpant

Jetzt mit dem Ingenieurteam chatten

Software-Ingenieur

Bevor er Software-Ingenieur wurde, promovierte Kannapat an der Universität Hokkaido in Japan im Bereich Umweltressourcen. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Abteilung für Bioproduktionstechnik ist. Im Jahr 2022 wechselte er mit seinen C#-Kenntnissen zum Engineering-Team von Iron Software, wo er sich auf IronPDF konzentriert. Kannapat schätzt an seiner Arbeit, dass er direkt von dem Entwickler lernt, der den Großteil des in IronPDF verwendeten Codes schreibt. Neben dem kollegialen Lernen genießt Kannapat auch den sozialen Aspekt der Arbeit bei Iron Software. Wenn er nicht gerade Code oder Dokumentationen schreibt, kann man Kannapat normalerweise beim Spielen auf seiner PS5 oder beim Wiedersehen mit The Last of Us antreffen.

< PREVIOUS
Wie man Text aus einer Rechnung in C# Tutorial

NÄCHSTES >
OCR von Untertiteln in C# (Anleitung)