PDFのOCRテキスト抽出

Tesseract は多くの画像フォーマットやPDFドキュメントを読み取ることができます。 この機能は、従来の無料のTesseractエンジンでは不可能です。

OcrInputは、スキャンの品質が悪い場合にPDFの特性を自動的に補正するオプションを提供します。

開発者は、PDF全体、ページの選択、または単一の切り取り領域を読むように指定することができます。

準備はいいですか?
Nuget ダウンロード 5,044,537 | バージョン: 2025.11 ただ今リリースされました