讀取文件中的表格 此程式碼範例演示如何使用 IronTesseract OCR 引擎從 PDF 文件中提取文本和表格資料。 創建了一個 IronTesseract OCR 引擎的實例。 初始化了 OcrInput 物件,並使用 LoadPdf 方法載入了一個 PDF 檔案("table.pdf")。 OCR 引擎使用 ReadDocumentAdvanced 方法處理文件,返回更詳細的 OcrResult 物件。 使用 result.Tables.First() 訪問文檔中找到的第一個表,並使用 CellInfos 提取該表的單元格資訊。 單元格資料清單 (cellList) 現在包含表的單元格,包括文本內容和其他細節(例如,單元格的位置、大小)。 該方法對於從 PDF 中提取表格等結構化數據非常有用,允許程式化地訪問和處理每個表格單元格內的文本。 瞭解如何使用 IronOCR 在 PDF 中讀取表格。 相關文件連結 在 GitHub 上查看 相關教學 相關操作指南 類別文檔 OCR語言包 下載 IronOCR DLL 回報此頁面的問題 準備好開始了嗎? Nuget 下載 5,044,537 | 版本: 2025.11 剛剛發布 免費 NuGet 下載 總下載量:5,044,537 查看許可證