在文件中讀取表格

此程式碼範例示範如何使用 IronTesseract OCR 引擎從 PDF 文件中提取文字和表格資料。

  1. 建立 IronTesseract OCR 引擎的一個實例。
  2. 初始化一個 OcrInput 對象,並使用 LoadPdf 方法載入 PDF 檔案("table.pdf")。
  3. OCR 引擎使用 ReadDocumentAdvanced 方法處理文檔,該方法傳回一個更詳細的 OcrResult 物件。
  4. 使用 result.Tables.First() 存取文件中找到的第一個表格,並使用 CellInfos 提取該表格的儲存格資訊。
  5. 儲存格資料清單(cellList)現在包含表格的儲存格,包括文字內容和其他詳細資料(例如,儲存格位置、大小)。
  6. 此方法可用於從 PDF 中提取結構化資料(如表格),允許以程式設計方式存取和處理每個表格單元格中的文字。

探索如何使用IronOCR讀取 PDF 中的表格。

準備好開始了嗎?
Nuget 下載 5,556,263 | 版本: 2026.3 剛剛發布
Still Scrolling Icon

還在捲動嗎?

想要快速證明? PM > Install-Package IronOcr
執行範例 觀看您的圖片變成可搜尋的文字。