ドキュメント内のテーブルを読む このコード例は、IronTesseract OCR エンジンを使用して PDF ドキュメントからテキストと表のデータを抽出する方法を示しています。 IronTesseract OCR エンジンのインスタンスが作成されます。 OcrInput オブジェクトが初期化され、LoadPdf メソッドを使用して PDF ファイル ("table.pdf") が読み込まれます。 OCR エンジンは、ReadDocumentAdvanced メソッドを使用してドキュメントを処理し、より詳細な OcrResult オブジェクトを返します。 ドキュメント内で見つかった最初のテーブルは、result.Tables.First() を使用してアクセスされ、そのテーブルのセルの情報は、CellInfos を使用して抽出されます。 セル データのリスト (cellList) には、テキストの内容やその他の詳細 (セルの位置、サイズなど) を含む表のセルが含まれるようになりました。 この方法は、PDF から表などの構造化データを抽出し、各表セル内のテキストにプログラムでアクセスして処理するのに便利です。 IronOCR を使用して PDF 内の表を読み取る方法を説明します。 関連ドキュメントリンク Githubで見る 関連チュートリアル 関連ハウツーガイド クラスドキュメンテーション OCR言語パック IronOCR DLLをダウンロード このページの問題を報告する 準備はできましたか? Nuget ダウンロード 5,525,971 | バージョン: 2026.3 リリース 無料トライアル NuGet 無料版 総ダウンロード数: 5,525,971 ライセンスを見る まだスクロールしていますか? すぐに証拠が欲しいですか? PM > Install-Package IronOcr サンプルを実行 あなたの画像が検索可能なテキストになるのをご覧ください。 NuGet 無料版 総ダウンロード数: 5,525,971 ライセンスを見る