在文件中讀取表格

本代碼範例示範如何使用 IronTesseract OCR 引擎從 PDF 文件中擷取文字和表格資料。

1.建立一個 IronTesseract OCR 引擎的實例。

  1. 初始化OcrInput對象,並使用LoadPdf方法載入 PDF 檔案("table.pdf")。
  2. OCR 引擎使用ReadDocumentAdvanced方法處理文檔,該方法傳回更詳細的OcrResult物件。
  3. 使用result.Tables.First()存取文件中找到的第一個表格,並使用CellInfos提取該表格的儲存格資訊。
  4. 儲存格資料清單( cellList )現在包含表格的儲存格,包括文字內容和其他詳細資訊(例如,儲存格位置、大小)。
  5. 此方法可用於從 PDF 中提取結構化資料(如表格),允許以程式設計方式存取和處理每個表格單元格中的文字。

探索如何使用 IronOCR 讀取 PDF 中的表格。

準備好開始了嗎?
Nuget 下載 5,246,844 | 版本: 2025.12 剛發表