写真を読む

このコード例は、IronTesseract OCRエンジンを使用して写真からテキストを抽出し、特定の領域を分析する方法を示しています。

IronTesseract OCR エンジンのインスタンスが作成されます。

OcrInputオブジェクトが初期化され、LoadImageFrameメソッドを使用して画像フレーム("ocr.tiff")が読み込まれます。 0は画像の最初のフレームが処理されていることを示しています。

OCRエンジンは、写真をReadPhotoメソッドを使用して読み取り、認識されたテキストと領域を含むOCR結果を含むOcrPhotoResultオブジェクトを返します。

認識されたテキストの最初の領域が識別されました。

領域のFrameNumberはnumber変数に格納されています。

TextInRegion プロパティは、最初の領域で見つかったテキストを取得します。

テキスト領域(バウンディングボックス)の座標は、Regionプロパティを使用してregion変数に保存されます。

出力は読みやすい文字列としてフォーマットされており、次の要素が含まれています:

最初の領域のテキスト(textinregion)。

テキスト領域の座標と寸法(X, Y, 幅, 高さ)。

OCRの信頼度スコア(result.Confidence)。

スキャンした写真からの全文(result.Text)。

その後、出力文字列がコンソールに印刷され、最初に認識された領域および全体的なOCR結果に関する詳細な情報が提供されます。

このアプローチにより、画像内のテキスト領域を詳細に分析でき、構造化された文書や異なる領域を持つ写真から情報を抽出するのに役立ちます。