スキャンされた文書を読む
このコード例は、IronTesseract OCR(光学式文字認識)エンジンを使用して画像からテキストを抽出する方法を示しています。
まず、IronTesseract OCRエンジンのインスタンスが作成されます。
次に、OcrInputオブジェクトを初期化して、認識するテキストを含む画像(この場合は「potter.tiff」)を読み込みます。
OCRエンジンは、ReadDocumentメソッドを使用して認識プロセスを実行します。このメソッドは、読み込まれた画像を処理し、認識されたテキストをOcrResultオブジェクトとして返します。
最後に、認識されたテキストは、Console.WriteLine(result.Text)を使用してコンソールに出力されます。
このプロセスは、OCR技術を使用して、プログラム的に画像ファイルから読み取り可能なテキストを抽出することを可能にします。