Gescannte Dokument lesen

Dieses Codebeispiel zeigt, wie die IronTesseract OCR (Optical Character Recognition)-Engine verwendet wird, um Text aus einem Bild zu extrahieren.

Zuerst wird eine Instanz der IronTesseract OCR-Engine erstellt.

Als nächstes wird ein OcrInput-Objekt initialisiert, um das Bild (in diesem Fall "potter.tiff") zu laden, das den zu erkennenden Text enthält.

Die OCR-Engine führt den Erkennungsprozess mit der ReadDocument-Methode durch, die das geladene Bild verarbeitet und den erkannten Text als ein OcrResult-Objekt zurückgibt.

Schließlich wird der erkannte Text mithilfe von Console.WriteLine(result.Text) auf der Konsole ausgegeben.

Dieser Prozess ermöglicht die Extraktion von lesbarem Text aus Bilddateien auf programmatische Weise, unter Verwendung von OCR-Technologie.