在文件中讀取表格
本代碼範例示範如何使用 IronTesseract OCR 引擎從 PDF 文件中擷取文字和表格資料。
1.建立一個 IronTesseract OCR 引擎的實例。
- 初始化
OcrInput對象,並使用LoadPdf方法載入 PDF 檔案("table.pdf")。 - OCR 引擎使用
ReadDocumentAdvanced方法處理文檔,該方法傳回更詳細的OcrResult物件。 - 使用
result.Tables.First()存取文件中找到的第一個表格,並使用CellInfos提取該表格的儲存格資訊。 - 儲存格資料清單(
cellList)現在包含表格的儲存格,包括文字內容和其他詳細資訊(例如,儲存格位置、大小)。 - 此方法可用於從 PDF 中提取結構化資料(如表格),允許以程式設計方式存取和處理每個表格單元格中的文字。
準備好開始了嗎?
Nuget 下載 5,246,844 | 版本: 2025.12 剛發表





