使用 IRONOCR 使用 IronOCR 從掃描影像中提取表格數據:現場演示回顧 Kannapat Udonpant 更新:6月 22, 2025 下載 IronOCR NuGet 下載 DLL 下載 Windows 安裝程式 開始免費試用 法學碩士副本 法學碩士副本 將頁面複製為 Markdown 格式,用於 LLMs 在 ChatGPT 中打開 請向 ChatGPT 諮詢此頁面 在雙子座打開 請向 Gemini 詢問此頁面 在雙子座打開 請向 Gemini 詢問此頁面 打開困惑 向 Perplexity 詢問有關此頁面的信息 分享 在 Facebook 上分享 分享到 X(Twitter) 在 LinkedIn 上分享 複製連結 電子郵件文章 從掃描影像中提取資料是一個常見的挑戰,尤其是在涉及表格等結構化資料時。 借助 IronOCR 的先進機器學習功能,您現在可以無縫提取表格數據,包括單元格值及其位置。 在本示範中,軟體銷售工程師 Shadman Majid將逐步解說程式碼實現,而銷售和市場總監 Anne Lazarakis將分享 Iron Software 客戶的真實用例。 實際應用案例 由銷售和市場總監 Anne Lazarakis 講解* 保險理賠處理(Opyn市場) 在美國監管嚴格的醫療保險行業,像Opyn Market這樣的公司仍然透過傳真接收許多文件。 這些掃描文件通常包含表格數據,必須準確地提取這些數據並輸入到內部系統中。 借助 IronOCR,他們能夠實現這一過程的自動化,減少人工操作,並消除人為錯誤的可能性。 物流與食品配送(iPAP) 美國最大的乳酪分銷商iPAP使用 IronOCR 管理 200 多個客戶訂單。 他們的發票格式各異,表格佈局也不統一。 IronOCR 可以幫助他們有效率地從掃描文件中提取採購訂單號碼、出貨日期和商品詳情,即使文件格式各異。 這項自動化措施每年為他們節省了 4 萬至 4.5 萬美元。 技術概述 與軟體銷售工程師Shadman Majid進行線上程式設計展示* IronOCR 使用專有的機器學習模型來偵測和擷取掃描文件中的表格資料。 此功能支援: 提取表格單元格及其座標 對掃描影像和多幀PDF進行OCR識別 相容於 C#、VB.NET、.NET Standard、.NET Framework 和 .NET Core 要使用此功能,您需要: IronOCR NuGet 包 -IronOcr.Extensions.AdvancedScanning NuGet 套件,用於透過機器學習模型進行表格檢測 這些軟體包包含用於表格結構檢測和精確 OCR 的訓練好的 ML 模型。 提取表格的範例程式碼 以下是一個 C# 程式碼範例片段,示範如何使用 IronOCR 從影像中擷取表格資料: // Import the necessary IronOCR namespaces using IronOcr; // Initialize the IronTesseract to handle OCR processes var Ocr = new IronTesseract(); // Load the image containing the table using (var input = new OcrInput("invoice.jpg")) { // Perform OCR and extract text data including tables var result = Ocr.Read(input); // Iterate through each page in the document foreach (var page in result.Pages) { // Iterate through each table found on the page foreach (var table in page.Tables) { Console.WriteLine("Table found:"); // Iterate through each row in the table foreach (var row in table.Rows) { // Convert the row of cells to a comma-separated string var cells = string.Join(", ", row.Cells.Select(cell => cell.Text)); Console.WriteLine(cells); } } } } // Import the necessary IronOCR namespaces using IronOcr; // Initialize the IronTesseract to handle OCR processes var Ocr = new IronTesseract(); // Load the image containing the table using (var input = new OcrInput("invoice.jpg")) { // Perform OCR and extract text data including tables var result = Ocr.Read(input); // Iterate through each page in the document foreach (var page in result.Pages) { // Iterate through each table found on the page foreach (var table in page.Tables) { Console.WriteLine("Table found:"); // Iterate through each row in the table foreach (var row in table.Rows) { // Convert the row of cells to a comma-separated string var cells = string.Join(", ", row.Cells.Select(cell => cell.Text)); Console.WriteLine(cells); } } } } ' Import the necessary IronOCR namespaces Imports IronOcr ' Initialize the IronTesseract to handle OCR processes Private Ocr = New IronTesseract() ' Load the image containing the table Using input = New OcrInput("invoice.jpg") ' Perform OCR and extract text data including tables Dim result = Ocr.Read(input) ' Iterate through each page in the document For Each page In result.Pages ' Iterate through each table found on the page For Each table In page.Tables Console.WriteLine("Table found:") ' Iterate through each row in the table For Each row In table.Rows ' Convert the row of cells to a comma-separated string Dim cells = String.Join(", ", row.Cells.Select(Function(cell) cell.Text)) Console.WriteLine(cells) Next row Next table Next page End Using $vbLabelText $csharpLabel -載入圖片:腳本先初始化 IronTesseract 引擎,然後載入要處理的圖片檔案invoice.jpg 。 OCR 執行:對輸入執行 OCR 以提取文字數據,尤其側重於任何表格。 -表格擷取:此腳本遍歷偵測到的每個表格及其行,以結構化的方式輸出儲存格內容。 請確保在執行此腳本之前已安裝IronOCR所需的 NuGet 套件。 結論 IronOCR 可以輕鬆地從掃描文件中自動提取複雜的表格資料。 無論你身處醫療保健、物流、金融或製造業,解決方案都能提供可靠性、準確性和節省成本的效率。 只需幾行程式碼,即可消除手動資料輸入並減少人為錯誤。 想看看它的實際效果嗎? 點擊這裡預約與我們工程師的線上演示。 常見問題解答 如何使用 C# 從掃描的影像中擷取表格資料? 您可以使用 IronOCR 先進的機器學習功能,從掃描的影像中抽取表格資料。此過程會使用 IronTesseract 引擎在影像上執行 OCR 並擷取資訊,包括儲存格數值及其座標。 從掃描文件中抽取表格資料有哪些實際應用? 現實世界中的應用包括透過從傳真文件中抽取表格資料來自動化保險理賠程序,以及在物流業中管理客戶訂單,在物流業中,發票格式各異,表格佈局也不一致,如 Opyn Market 和 iPAP 等公司所展示的情況。 IronOCR 在表格資料擷取方面提供哪些技術能力? IronOCR 提供的功能包括提取表格單元格和坐標、掃描影像和多格 PDF 的 OCR,以及與 C#、VB.NET、.NET Standard、.NET Framework 和 .NET Core 相容。 使用 IronOCR 擷取表格資料的程式碼涉及哪些步驟? 過程包括初始化 IronTesseract 引擎、載入影像、執行 OCR 以擷取文字資料,以及反覆檢驗每個偵測到的表格及其行以輸出儲存格內容。 使用 IronOCR 擷取表格資料需要哪些套件? 您需要 IronOCR NuGet 套件以及 IronOcr.Extensions.AdvancedScanning 套件,以利用表格檢測和精確 OCR 所需的經過訓練的 ML 模型。 IronOCR 如何提高醫療保健和物流業的效率? IronOCR 可從掃描文件中自動擷取複雜的表格資料,減少人工勞動和人為錯誤,為醫療照護和物流等產業提供大幅的效率和成本節省。 我可以看到 IronOCR 功能的現場示範嗎? 是的,您可以預約 Iron Software 的工程師進行現場示範,觀看 IronOCR 的實際運作,並進一步瞭解其提取表格資料的功能。 Kannapat Udonpant 立即與工程團隊聊天 軟體工程師 在成為软件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人实验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因为他直接向编写大部分 IronPDF 使用的代码的开发者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代码或文档时,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。 相關文章 發表日期 12月 18, 2025 C# 讀取 PDF 表單欄位:以程式設計方式擷取表單數據 學習如何在C#中使用IronPDF讀取PDF表單字段。從可填寫PDF中提取文本、複選框、下拉列表等的簡單代碼示例。 閱讀更多 發表日期 12月 18, 2025 C# 從 PDF 擷取影像:完整開發者指南 學習如何使用IronPDF強大的方法從C#中的PDF文檔中提取圖像。完整指南中包含了.NET開發人員的代碼示例。 閱讀更多 發表日期 12月 18, 2025 C# 將 PDF 轉換為圖像:完整開發者指南 學習如何使用IronPDF將PDF文檔轉換為C#中的圖像。詳盡指南中提供了JPG、PNG和TIFF轉換的代碼示例。 閱讀更多 為什麼 IronOCR 是比 LLMs 更優越的 OCR 選擇優化性能以提供更快、更...
發表日期 12月 18, 2025 C# 讀取 PDF 表單欄位:以程式設計方式擷取表單數據 學習如何在C#中使用IronPDF讀取PDF表單字段。從可填寫PDF中提取文本、複選框、下拉列表等的簡單代碼示例。 閱讀更多
發表日期 12月 18, 2025 C# 從 PDF 擷取影像:完整開發者指南 學習如何使用IronPDF強大的方法從C#中的PDF文檔中提取圖像。完整指南中包含了.NET開發人員的代碼示例。 閱讀更多
發表日期 12月 18, 2025 C# 將 PDF 轉換為圖像:完整開發者指南 學習如何使用IronPDF將PDF文檔轉換為C#中的圖像。詳盡指南中提供了JPG、PNG和TIFF轉換的代碼示例。 閱讀更多