Wie man Eingabebilder für die OCR-Verarbeitung in C# verwendet

How to Read Images

This article was translated from English: Does it need improvement?
Translated
View the article in English

OCR, oder optische Zeichenerkennung, ist eine Technologie, die verwendet wird, um Text aus Bildern zu erkennen und zu extrahieren. Diese Technologie ist besonders nützlich zur Digitalisierung gedruckter Dokumente, da sie es Ihnen ermöglicht, den Textinhalt von gescannten Seiten, Fotografien oder anderen Bilddateien zu extrahieren und damit zu arbeiten.

IronOCR unterstützt verschiedene Bildformate, darunter jpg, png, gif, tiff und bmp. Bildfilter sind ebenfalls verfügbar, um die Lesefähigkeit zu verbessern.

als-Überschrift:2(Schnellstart: Eine Bilddatei mit IronOCR lesen)

Verwenden Sie IronOCR in nur einer Zeile, um Text aus einem Bild zu extrahieren. Dieses Beispiel zeigt, wie Sie in wenigen einfachen Schritten ein Bild laden und seinen Text mit der Read-Methode auf IronTesseract für eine schnelle OCR-Einrichtung lesen können.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    var result = new IronTesseract().Read(new OcrImageInput("Potter.png"));
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer
class="hsg-featured-snippet">

Minimaler Workflow (5 Schritte)

  1. Laden Sie eine C#-Bibliothek zum Lesen von Bildern herunter
  2. Unterstützt Bilder in verschiedenen Formaten, darunter jpg, png, gif, tiff und bmp
  3. Instanziieren Sie die OcrImageInput-Klasse, um ein Bild einzufügen
  4. Verwenden Sie die Read-Methode, um OCR auf dem Eingabebild durchzuführen
  5. Geben Sie das Zuschneidegebiet an, um den Lesebereich zu definieren


Beispiel zum Lesen von Bildern

Beginnen Sie mit der Instanziierung der IronTesseract-Klasse, um OCR zu aktivieren. Verwenden Sie die 'using'-Anweisung, um ein OcrImageInput-Objekt zu erstellen und den Bilddateipfad anzugeben. Dies gewährleistet die ordnungsgemäße Freigabe von Ressourcen, wenn sie nicht mehr benötigt werden. IronOCR unterstützt Eingabebilder in verschiedenen Formaten, darunter jpg, png, gif, tiff und bmp. Verwenden Sie schließlich die Read-Methode, um OCR durchzuführen.

Hinweis: Ab Version 2025.6:

  • Das Laden von TIFF-Bildern liefert jetzt konsistent schnellere Leistung.
  • Das Lesen von TIFF-Bildern zeigt Leistungsverbesserungen, die von der GPU des Rechners abhängen. Einige Benutzer erleben bis zu doppelte Geschwindigkeit, während andere möglicherweise eine Leistung ähnlich wie bei früheren Versionen sehen
:path=/static-assets/ocr/content-code-examples/how-to/input-images-read.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.png");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.png")

' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
$vbLabelText   $csharpLabel
class="content-img-align-center">
class="center-image-wrapper"> PNG-Bild lesen

Besuchen Sie den Artikel Wie man mehrseitige GIFs und TIFFs liest, um mehr über das Lesen von TIFF- und GIF-Bildern zu erfahren.

Bilder als Bytes importieren

Neben dem normalen Dateipfad akzeptiert die OcrImageInput-Klasse auch Bildinformationen in Form von Bytes, AnyBitmap, Stream sowie Image. Das AnyBitmap ist ein Bitmap-Objekt von IronSoftware.Drawing.AnyBitmap.

:path=/static-assets/ocr/content-code-examples/how-to/input-images-import-byte.cs
using IronOcr;
using System.IO;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Read byte from file
byte[] data = File.ReadAllBytes("Potter.tiff");

// Import image byte
using var imageInput = new OcrImageInput(data);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr
Imports System.IO

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Read byte from file
Private data() As Byte = File.ReadAllBytes("Potter.tiff")

' Import image byte
Private imageInput = New OcrImageInput(data)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
$vbLabelText   $csharpLabel

Scanbereich angeben

Ein CropRectangle wird beim Instanziieren der OcrImageInput-Klasse ebenfalls akzeptiert. Dies erlaubt Ihnen, anzugeben, welcher Bereich des Bilddokuments einer OCR unterzogen werden soll. Je nach Bilddokument kann die Angabe des zu scannenden Bereichs die Leistung erheblich verbessern. Im folgenden Codebeispiel geben Sie an, dass nur die Kapitelnummer und der Titel gelesen werden sollen.

:path=/static-assets/ocr/content-code-examples/how-to/input-images-read-specific-region.cs
using IronOcr;
using IronSoftware.Drawing;
using System;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Specify crop region
Rectangle scanRegion = new Rectangle(800, 200, 900, 400);

// Add image
using var imageInput = new OcrImageInput("Potter.tiff", ContentArea: scanRegion);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Output the result to console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports IronSoftware.Drawing
Imports System

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Specify crop region
Private scanRegion As New Rectangle(800, 200, 900, 400)

' Add image
Private imageInput = New OcrImageInput("Potter.tiff", ContentArea:= scanRegion)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Output the result to console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

OCR-Ergebnis

class="content-img-align-center">
class="center-image-wrapper"> Speziellen Bereich lesen

Häufig gestellte Fragen

Wie kann ich OCR auf einem Bild in .NET C# durchführen?

Sie können OCR auf einem Bild in .NET C# mithilfe der IronOCR-Bibliothek durchführen. Beginnen Sie mit dem Herunterladen von IronOCR aus NuGet, instanziieren Sie die IronTesseract-Klasse und verwenden Sie die OcrImageInput-Klasse, um ein Bild einzufügen. Wenden Sie dann die Read-Methode an, um Text aus dem Bild zu extrahieren.

Welche Bildformate können für die OCR-Verarbeitung in .NET verwendet werden?

IronOCR unterstützt verschiedene Bildformate zur OCR-Verarbeitung, einschließlich jpg, png, gif, tiff und bmp. Dies ermöglicht eine flexible Integration mit verschiedenen Arten von Bilddateien.

Wie kann ich einen bestimmten Bereich eines Bildes für OCR in C# angeben?

In IronOCR können Sie einen bestimmten Bereich eines Bildes zur Verarbeitung definieren, indem Sie beim Instanziieren der OcrImageInput-Klasse ein CropRectangle verwenden. Dies kann die Leistung verbessern, indem der OCR-Vorgang auf einen bestimmten Bereich fokussiert wird.

Ist es möglich, Bilder aus einem Byte-Array für OCR in C# zu lesen?

Ja, IronOCR ermöglicht es Ihnen, Bilder als Byte-Arrays, AnyBitmap, Stream oder Image einzufügen. Diese Flexibilität ermöglicht es Ihnen, OCR auf Bilddaten in verschiedenen Formaten durchzuführen.

Wie kann ich während der OCR-Operationen in C# ein effizientes Speichermanagement sicherstellen?

Um den Speicher während der OCR-Operationen mit IronOCR effizient zu verwalten, verwenden Sie die 'using'-Anweisung beim Erstellen eines OcrImageInput-Objekts. Dies stellt sicher, dass Ressourcen ordnungsgemäß freigegeben werden, wenn sie nicht mehr benötigt werden.

Kann ich mehrseitige oder mehrframed Bilder für OCR in C# verarbeiten?

Ja, IronOCR unterstützt das Lesen von mehrseitigen oder mehrframed Bildern, wie GIFs und TIFFs. Diese Fähigkeit ermöglicht es Ihnen, OCR auf komplexe Bilddateien mit mehreren Frames oder Seiten durchzuführen.

Wie kann ich die Texterkennung in OCR mit Bildfiltern verbessern?

IronOCR bietet Bildfilter, die verwendet werden können, um die Texterkennungskapazitäten zu verbessern. Durch das Anwenden dieser Filter können Sie die Genauigkeit und Zuverlässigkeit des OCR-Prozesses bei verschiedenen Bildformaten erhöhen.

Welche Vorteile bietet IronOCR für das Lesen von Bildern in C#?

IronOCR bietet mehrere Vorteile für das Lesen von Bildern in C#, einschließlich Unterstützung für mehrere Bildformate, die Möglichkeit, Scanbereiche anzugeben, und die Fähigkeit, Bilder als Bytes oder Streams einzuführen. Diese Funktionen ermöglichen eine effiziente und flexible OCR-Verarbeitung in .NET-Anwendungen.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen
Rezensiert von
Jeff Fritz
Jeffrey T. Fritz
Principal Program Manager - .NET Community Team
Jeff ist außerdem Principal Program Manager für das .NET- und Visual Studio-Team. Er ist der ausführende Produzent der .NET Conf Virtual Conference Series und moderiert ‚Fritz and Friends‘, einen Livestream für Entwickler, der zweimal wöchentlich ausgestrahlt wird. Dort spricht er über Technik und schreibt gemeinsam mit den Zuschauern Code. Jeff schreibt Workshops, Präsentationen und plant Inhalte für die größten Microsoft-Entwicklerveranstaltungen, einschließlich Microsoft Build, Microsoft Ignite, .NET Conf und dem Microsoft MVP Summit.
Bereit anzufangen?
Nuget Downloads 5,044,537 | Version: 2025.11 gerade veröffentlicht