在文件中讀取表格

此程式碼範例示範如何使用 IronTesseract OCR 引擎從 PDF 文件中提取文字和表格資料。

  1. 建立 IronTesseract OCR 引擎的一個實例。
  2. 初始化OcrInput對象,並使用LoadPdf方法載入 PDF 檔案("table.pdf")。
  3. OCR 引擎使用ReadDocumentAdvanced方法處理文檔,該方法傳回更詳細的OcrResult物件。
  4. 使用result.Tables.First()存取文件中找到的第一個表格,並使用CellInfos提取該表格的儲存格資訊。
  5. 儲存格資料清單( cellList )現在包含表格的儲存格,包括文字內容和其他詳細資訊(例如,儲存格位置、大小)。
  6. 此方法可用於從 PDF 中提取結構化資料(如表格),允許以程式設計方式存取和處理每個表格單元格中的文字。

探索如何使用 IronOCR 讀取 PDF 中的表格。

準備好開始了嗎?
Nuget 下載 5,167,857 | Version: 2025.11 剛發表