カスタム言語ファイルの使用
Iron Tesseract OCRは、Tesseractの.traineddataファイル形式標準(バージョン4以上)に従って、カスタムまたはダウンロードした言語やフォントを完全にサポートしています。 このようなファイルは通常、[Github.com]()で見つけることができます。
独自のカスタムフォントサポートや言語パックをトレーニングしたい場合は、カスタムテッセラクト言語パックの作成に関するチュートリアルを読むことをお勧めします。
OCR用のTesseract言語の使用方法
- Tesseract 言語オプションを選択するために OCR ライブラリをインストールします。
- カスタム言語ファイルを使用する際には、
UseCustomTesseractLanguageFile
を提供してください。 - 画像パスをパラメーターとして、
OcrInput
オブジェクトを作成します。 OcrInput
オブジェクトをRead
メソッドに渡して、言語のテキストを読み取ります。