IronOCR 操作指南 閱讀掃描文檔 How to Read Scanned Documents Using IronOCR Curtis Chau 更新日期:6月 11, 2025 Download IronOCR NuGet 下載 DLL 下載 Windows 安裝程式 Start Free Trial Copy for LLMs Copy for LLMs Copy page as Markdown for LLMs Open in ChatGPT Ask ChatGPT about this page Open in Gemini Ask Gemini about this page Open in Grok Ask Grok about this page Open in Perplexity Ask Perplexity about this page Share Share on Facebook Share on X (Twitter) Share on LinkedIn Copy URL Email article This article was translated from English: Does it need improvement? Translated View the article in English 許多 PDF 包含不可搜索的、基於圖像的文本。 IronOCR 可以將其轉換為可搜索的內容,使特定信息更易查找,並提高文檔可訪問性,尤其對視障人士。 自動提取可確保準確性和效率,無需手動複製或重建文本和圖像。 這對於研究、法律文件和內容創作特別有用,因為重用 PDF 的特定部分很常見。 企業可以從 PDF 中提取關鍵數據進行分析或系統集成,簡化工作流程。 設計人員和營銷人員還可以提取圖像以進行增強和在各個項目中重用。 在本教程中,我們將探索 OcrPdfInput 方法,涵蓋可用的選項和參數,展示 IronOCR 如何簡化 PDF 文本和圖像提取以用於各種應用。 要使用此功能,您還必須安裝 IronOcr.Extensions.AdvancedScan 包。 作為標題:2(快速開始:從掃描的 PDF 或圖像中提取文本) 幾秒鐘即可開始——您只需一行代碼便可使用 IronOCR 的 OcrInput.LoadPdf 或 LoadImage 加載掃描的 PDF 或圖像,並通過 ReadDocument 即時提取文本。 非常適合希望快速啟動並運行 OCR 的開發人員。 Get started making PDFs with NuGet now: Install IronOCR with NuGet Package Manager PM > Install-Package IronOcr Copy and run this code snippet. var text = new IronOcr.IronTesseract().ReadDocument(new IronOcr.OcrInput().LoadPdf("scanned.pdf")).Text; Deploy to test on your live environment Start using IronOCR in your project today with a free trial Free 30 day Trial class="hsg-featured-snippet">最小工作流程(5 步)下載用於讀取掃描文檔的 C# 庫導入掃描文檔以便處理使用 LoadImage 方法處理圖像或使用 LoadPdf 處理掃描的 PDF使用 ReadDocument 方法提取文本根據需要保存或導出提取的文本以供進一步使用 閱讀掃描文檔示例 要從文檔中的所有圖像中提取文本,請使用 ReadDocument 方法。 此方法處理文檔並返回包含提取文本的對象,可以通過 Text 屬性訪問。 下例演示如何使用範例 TIFF 文件來使用此方法。 請注意 該方法目前僅適用於英語、中文、日文、韓文以及拉丁字母。 在 .NET Framework 上使用高級掃描需要項目在 x64 架構上運行。 輸入 代碼 :path=/static-assets/ocr/content-code-examples/how-to/read-scanned-document-read-scanned-document.cs using IronOcr; using System; // Instantiate OCR engine var ocr = new IronTesseract(); // Configure OCR engine using var input = new OcrInput(); input.LoadImage("potter.tiff"); // Perform OCR OcrResult result = ocr.ReadDocument(input); Console.WriteLine(result.Text); Imports IronOcr Imports System ' Instantiate OCR engine Private ocr = New IronTesseract() ' Configure OCR engine Private input = New OcrInput() input.LoadImage("potter.tiff") ' Perform OCR Dim result As OcrResult = ocr.ReadDocument(input) Console.WriteLine(result.Text) $vbLabelText $csharpLabel 輸出 如果您需要對 PDF 文件執行 OCR,只需將 LoadImage 方法替換為 LoadPdf。 這樣 IronOCR 就能夠以相同的方式處理和提取掃描 PDF 的文本。 常見問題解答 如何使用 C# 讀取掃描文件? 您可以使用 IronOCR 在 C# 中讀取掃描文件。首先,從 NuGet 下載 C# 庫,然後使用LoadImage方法匯入映像文件,或使用LoadPdf匯入 PDF 文件。最後,使用ReadDocument方法提取文字。 將 PDF 中的圖像文字轉換為可搜尋內容的目的是什麼? 使用 IronOCR 將 PDF 中的圖像文字轉換為可搜尋的內容,可以增強可訪問性,使查找特定資訊更加容易,並幫助有視覺障礙的人士。 我可以使用 IronOCR 從圖像和 PDF 中提取文字嗎? 是的,IronOCR 允許您從圖像和 PDF 文件中提取文字。對於影像,請使用LoadImage方法;對於 PDF 文件,請使用LoadPdf方法,然後使用ReadDocument方法執行提取操作。 IronOCR支援哪些語言? IronOCR 支援英文、中文、日文、韓文和拉丁文字母的文字擷取,使其能夠靈活地處理多語言文件。 要在 IronOCR 中使用進階掃描功能,需要什麼樣的架構? 若要在 .NET Framework 上使用 IronOCR 的進階掃描功能,您的專案必須在 x64 架構上執行。 如何在商業應用中使用 IronOCR 進行自動文字擷取? IronOCR 可用於商業應用,透過匯入掃描文件(使用LoadPdf或LoadImage方法)並使用ReadDocument方法提取文本,實現自動化文本提取。這有助於企業有效率地分析和整合關鍵數據,從而簡化工作流程。 使用 IronOCR 從掃描的 PDF 檔案中提取文字需要哪些步驟? 若要使用 IronOCR 從掃描的 PDF 文件中提取文本,請下載庫文件,使用LoadPdf方法匯入 PDF 文件,然後使用ReadDocument方法提取文本。提取的文字可以根據需要保存或匯出。 IronOCR 能為設計師和行銷人員帶來哪些好處? IronOCR 可以幫助設計師和行銷人員從 PDF 中提取圖像和文本,以便在各種項目中進行增強和重複使用,從而提高效率和創造可能性。 要使用IronOCR的進階功能,需要安裝哪個軟體套件? 要使用 IronOCR 的進階功能,您需要從 NuGet 安裝IronOcr.Extensions.AdvancedScan套件。 Curtis Chau 立即與工程團隊聊天 技術作家 Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。 準備好開始了嗎? Nuget 下載 5,044,537 | 版本: 2025.11 剛剛發布 免費 NuGet 下載 總下載量:5,044,537 查看許可證