スキャンされた文書を読む

このコード例は、IronTesseract OCRの使用方法を示しています。(光学文字認識)画像からテキストを抽出するエンジン。

まず、IronTesseract OCRエンジンのインスタンスが作成されます。

次に、OcrInputオブジェクトが初期化され、画像が読み込まれます。(この場合、「potter.tiff」)認識されるテキストを含む。

OCRエンジンは、ReadDocumentメソッドを使用して認識プロセスを実行します。このメソッドは、読み込まれた画像を処理し、認識されたテキストをOcrResultオブジェクトとして返します。

最後に、認識されたテキストは Console.WriteLine を使用してコンソールに出力されます。(result.Text).

このプロセスは、OCR技術を使用して、プログラム的に画像ファイルから読み取り可能なテキストを抽出することを可能にします。