Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
Viele Menschen fragen sich vielleicht: "Was ist ein OCR-Screenshot?" Andere fragen sich vielleicht, wie man einen Screenshot eines beliebigen Textes in ein digitales, textverarbeitbares Format oder in das .txt- oder .doc-Format umwandelt. Wenn Sie zu diesen Menschen gehören, brauchen Sie sich keine Sorgen mehr zu machen, denn wir haben die perfekten Lösungen für Sie.
In diesem Artikel werden wir verschiedene Tools besprechen, mit denen Sie OCR (Optical Character Recognition) an Screenshots durchführen können.
Es gibt viele OCR-Tools, aber heute werden wir uns mit IronOCR um Text aus Bildschirmfotos zu extrahieren.
IronOCR ist eine Softwarebibliothek für die Programmiersprachen C# und VB.NET, mit der Entwickler OCR hinzufügen können (Optische Zeichenerkennung) fähigkeiten für ihre Anwendungen. Die Bibliothek kann verwendet werden, um Text in Bildern zu erkennen und in maschinenlesbaren Text zu konvertieren. Die Bibliothek basiert auf der Tesseract OCR-Engine, die als eine der genauesten verfügbaren OCR-Engines gilt.
IronOCR kann zum Lesen von Text aus Bildern in vielen verschiedenen Dateiformaten verwendet werden, darunter PNG, JPG, TIFF und PDF. Es bietet auch eine Reihe von erweiterten Funktionen für die Arbeit mit der Texterkennung, wie z. B. die Fähigkeit, mehrere Sprachen zu erkennen, sowie die Fähigkeit, Text aus Bildern zu erkennen, die gedreht oder schräg gestellt wurden. Darüber hinaus können Entwickler IronOCR verwenden, um OCR-Funktionen schnell in ihre Anwendungen zu integrieren, da es eine einfache, benutzerfreundliche API bietet, die von C#- oder VB.NET-Code aus aufgerufen werden kann. Mit IronOCR können Sie Ihre OCR-Sprache auswählen und OCR für Bilder, digitale PDF-Dateien und gescannte PDF-Dateien durchführen.
IronOCR ist eine gute Option für Entwickler, die ihren Anwendungen OCR-Funktionen hinzufügen möchten. Sie ist quelloffen, einfach zu verwenden und zu integrieren, schnell, genau und mit den neuesten OCR-Technologien ausgestattet.
IronOCR bietet eine breite Palette von Funktionen, die Entwicklern helfen, OCR-Funktionen in ihre Anwendungen zu integrieren. Einige der wichtigsten Merkmale von IronOCR sind:
Mehrsprachige Unterstützung: IronOCR kann Text in über 60 Sprachen erkennen, darunter Englisch, Spanisch, Deutsch, Französisch, Italienisch und Chinesisch.
Automatische Erkennung der Textausrichtung: IronOCR kann die Ausrichtung von Text in einem Bild automatisch erkennen, selbst wenn das Bild gedreht oder schräg gestellt wurde.
Unterstützung für eine breite Palette von Bildformaten: IronOCR kann Text aus Bildern in vielen verschiedenen Dateiformaten lesen, darunter PNG, JPG, TIFFund PDF.
Anpassbare Erkennungseinstellungen: Entwickler können die Erkennungseinstellungen anpassen, um die Erkennungsgenauigkeit für bestimmte Bildtypen oder Anwendungsfälle zu verbessern.
Erkennung von Text aus gescannten Dokumenten und PDF-Dateien mit mehreren Seiten.
Schnelle Erkennung und hohe Genauigkeit: IronOCR verwendet die Tesseract OCR-Engine, eine der genauesten und am weitesten verbreiteten OCR-Engines auf dem Markt.
Einfach zu verwendende API: IronOCR bietet ein einfaches, benutzerfreundliches API, das von C#- oder VB.NET-Code aus aufgerufen werden kann und die Integration der OCR-Funktionalität in jede Anwendung erleichtert.
Insgesamt ist IronOCR ein leistungsfähiges Tool, das Entwicklern dabei hilft, ihre Anwendungen um OCR-Funktionen zu erweitern.
Öffnen Sie Visual Studio und rufen Sie das Menü Datei auf. Wählen Sie "Neues Projekt" und dann "Konsolenanwendung".
Geben Sie den Projektnamen ein und wählen Sie den Pfad in dem entsprechenden Textfeld aus. Klicken Sie dann auf die Schaltfläche Erstellen. Wählen Sie das gewünschte .NET-Framework, wie in der folgenden Abbildung dargestellt:
Erstellen eines neuen Projekts in Visual Studio
Das Visual Studio-Projekt wird nun die Struktur für die Konsolenanwendung generieren. Danach wird die Datei "program.cs" geöffnet, in der Sie den Quellcode schreiben und ausführen können.
Die Datei program.cs, die mit dem Assistenten für neue Projekte von Visual Studio erstellt wurde
Jetzt können wir die IronOCR-Bibliothek hinzufügen und das Programm testen.
In Visual Studio können Sie IronOCR problemlos in Ihr C#-Projekt integrieren.
IronOCR bietet mehrere Prozesse zur Integration in ein C# .NET-Projekt. Hier werden wir eine davon besprechen: die Installation von IronOCR mit dem NuGet Package Manager.
Gehen Sie in Visual Studio zu Tools > NuGet Package Manager > Package Manager Console
Die NuGet-Paketmanager-Benutzeroberfläche
Nach dem Klicken erscheint eine neue Konsole am unteren Rand des Visual Studio-Fensters. Geben Sie den folgenden Befehl in die Konsole ein und drücken Sie die Eingabetaste.
Install-Package IronOcr
IronOCR wird in nur wenigen Sekunden installiert sein.
IronOCR ist eine leistungsstarke OCR-Bibliothek, die zur Erkennung von Text aus Bildschirmfotos verwendet werden kann. Mit IronOCR können Sie einen Screenshot von Text machen und dann die OCR-Funktionen der Bibliothek nutzen, um den Text im Screenshot in ein digitales, bearbeitbares Format zu konvertieren. Hier ein Beispiel für die Verwendung von IronOCR zur Durchführung von OCR auf einem Screenshot in C#. Um die OCR von Screenshots durchzuführen, nehmen Sie einfach einen Screenshot auf und führen Sie den folgenden Code aus, um den Text in ein beliebiges Ausgabeformat zu extrahieren.
using IronOcr;
using System;
string imageText = new IronTesseract().Read("ocr.png").Text;
Console.WriteLine(imageText);
using IronOcr;
using System;
string imageText = new IronTesseract().Read("ocr.png").Text;
Console.WriteLine(imageText);
Imports IronOcr
Imports System
Private imageText As String = (New IronTesseract()).Read("ocr.png").Text
Console.WriteLine(imageText)
Muster-Screenshot für die Eingabe verwendet
- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 127+ global language packs
- Output as text, structured data, or searchable PDFs
- Supports NET 6, 5, Core, Standard, Framework
IronOCR ermöglicht es Ihnen, OCR an bestimmten Bereichen eines Bildes durchzuführen. Dies kann nützlich sein, wenn das Bild mehrere Textbereiche enthält und Sie nur den Text innerhalb eines bestimmten Bereichs erkennen möchten. Ein Beispielcode hierfür ist unten dargestellt.
using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
ocrInput.AddImage("ocr.png", contentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
ocrInput.AddImage("ocr.png", contentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput()
Dim contentArea = New CropRectangle(x:= 0, y:= 0, width:= 350, height:= 150)
ocrInput.AddImage("ocr.png", contentArea)
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
End Using
Um OCR an einem Bild durchzuführen und den erkannten Text in einer .txt-Datei zu speichern, können Sie den folgenden Code verwenden.
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
var result = ocr.Read(input);
result.SaveAsTextFile("output.txt");
}
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
var result = ocr.Read(input);
result.SaveAsTextFile("output.txt");
}
Imports IronOcr
Imports System
Private ocr = New IronTesseract()
Using input = New OcrInput("ocr.png")
Dim result = ocr.Read(input)
result.SaveAsTextFile("output.txt")
End Using
Der Inhalt der Ausgabedatei ist unten dargestellt:
Inhalt der erzeugten Datei output.txt
Lesen Sie die Bild-Text-Extraktion tutorial für weitere Informationen über die OCR von Bildern.
IronOCR ist Teil eines suite von fünf .NET-Bibliotheken, die für die Arbeit mit verschiedenen Arten von Dokumenten entwickelt wurden. Sie können alle fünf Bibliotheken zum Preis von nur zwei erwerben lizenzen.
9 .NET API-Produkte für Ihre Bürodokumente