OCR 工具 C# 開源的 OCR(開發者列表) Kannapat Udonpant 更新日期:7月 2, 2025 Download IronOCR NuGet 下載 DLL 下載 Windows 安裝程式 Start Free Trial Copy for LLMs Copy for LLMs Copy page as Markdown for LLMs Open in ChatGPT Ask ChatGPT about this page Open in Gemini Ask Gemini about this page Open in Grok Ask Grok about this page Open in Perplexity Ask Perplexity about this page Share Share on Facebook Share on X (Twitter) Share on LinkedIn Copy URL Email article OCR(光學字元識別)是一項改變遊戲規則的技術,徹底改變了在當今數位世界中如何使用掃描的文件。 它使計算機能夠識別並從各種來源提取文本,包括掃描的 PDF 文件,讓我們能夠有效地編輯和互動 PDF 文件。 其中一個光學字符識別(OCR)程式是 Adobe Acrobat,允許你快速從掃描的文件中提取文本並將其轉換為可編輯的 PDF 和可搜索的圖像 PDF。 開發者可以通過使用如 Tesseract 和 IronOCR 的 OCR 庫來訪問利用最新演算法和機器學習方法的強大工具和 API。 這些庫能夠進行精確的文本識別,使從舊有掃描文件和新創文件中管理和檢索有用信息變得更加簡單。 OCR 能夠無縫進行內容分析,幫助企業和個人最大化其掃描文件和頁面圖像的生產力。 OCR 是現今科技中的一個重要工具,無論是用於數位化紙本紀錄、從發票中提取數據,還是簡單地提高文件可訪問性。 Tesseract 最著名的開源 OCR 引擎被稱為 Tesseract,它最初由 Hewlett-Packard 創建。 自 2006 年以來,Google 一直支持該免費軟體專案,並以 Apache 許可證發布。 Tesseract OCR 引擎是當前最準確的開源和免費系統之一。Tesseract 現在支援 116 種語言,其最新穩定版本 4.1.1 是基於 LSTM。 Tesseract 從命令行界面運行時需要單獨的 GUI(圖形用户界面)支持,因為它沒有自己的內置界面。 它可以利用其神經網路學習新信息,並具有先進的圖像預處理流水線。將 OCR 能力添加到 .NET 應用程序的最有效方法是使用 Tesseract .NET SDK,這是提供文本識別能力的最佳解決方案之一。 即便 Tesseract 是當前市場上最好的OCR庫。 GOCR GNU Public License 被用於創建稱為 GOCR 的 OCR(光學字符識別)程式。 它將文本文件轉換回文件的掃描圖像。 在 SF 上啟動程式並管理開發團隊後,Joerg Schulenburg 今天仍在用(非常)少的時間管理這個包。 由於 GOCR 可以與多個前端一起使用,因此非常簡單地將其移植到其他操作系統、網路應用和架構。 它可以讀取多種圖片文件類型,並且在 2010 年之前,其質量不斷提高。 根據 GOCR,它可以處理高度在 20-60 像素的單欄無襯線字體。 它報告了用拉丁字母以外的字母寫的文本、襯線字體、重疊字母、各種字體、噪點照片和過度的傾斜角度的困難。 GOCR 也能夠轉換條碼。 CuneiForm CuneiForm,是一種免費和開源技術,現在也被稱為“Cognitive OpenOCR”。它具有內建的輸出和數據庫。 它涵蓋了 23 種不同的語言,還會執行文本格式掃描、文件佈局分析和識別等任務。 Cognitive Technologies 開發了 OpenOCR 的許可證,這些都是免費軟體和 BSD。 雖然它支援跨平臺使用,但 Linux 使用者不能獲得圖形界面。 為了簡化在任何 Dot NET Framework 2.0 或更高版本的程式中進行字符識別工作,使用了封裝庫 Puma Dot NET。 它在處理數據時運行字典檢查,以改善識別質量。 CuneiForm 是設計用來自動或半自動將紙本文件和圖像文件的電子副本轉換為可編輯的形式而不影響文件結構和原字體的技術。 該系統由兩部分組成,用於批次和一次處理一份的電子文件。除此之外,該系統還支援俄語和英語的組合。 只有 2009 年由 Andrei Borovsky 創建的分支支持其他混合語言的識別。 由於每種語言都與 dat 文件相關聯,且其結構和創建過程未被開發者公開,因此教導系統識別其他語言具有挑戰性。 Kraken Kraken 是為了解決 Ocropus 的問題而開發的,且不影響其其他功能。 它使用其 CLSTM 神經網路庫並利用來自先前專案的寶貴經驗與新數據相結合。 有效功能於不同平台時需要使用某些外部庫。 藉助存儲的資訊,它可以更準確地預測潛在數據驗證問題。 此外,其工作方法促進了新模型的輕鬆部署和訓練。 A9T9 A9T9 是一項免費的 OCR 軟體,可以用於從圖片文件中提取文本並轉換圖像和 PDF 文件。 它為 Tesseract OCR 引擎提供圖形使用者界面 (GUI)。 這個程式易於設定。最重要的是,它是完全免費和開源的。 它沒有間諜軟體和廣告軟體。 你可以打開 PDF 文件或圖像,然後源文件的內容將顯示在左側窗口中。 如果你的文件有多頁或是一個多頁文件,你可以用頁腳的箭頭在頁面間移動。 要啟動 OCR 過程,只需點擊綠色的 OCR 按鈕,輸出將顯示在第二個右側窗格中。 你可以選擇將輸出文本保存為文本文件和 Word 文件。 IronOCR 與標準的 Tesseract 庫相比,IronOCR 擴展了 Tesseract 並提供了更高準度的本地 C# OCR 庫,提升了性能並提高了穩定性。 IronOCR 可以在 .NET 程式和網站中使用,以從 PDF 和圖像中提取文本。 它支援多種外語,並能生成純文本或結構化數據輸出。 它能夠掃描條碼和嵌入文本的圖像。 此庫可以用於開發 .NET 的應用中,無論是控制台、網頁、MVC,還是桌面應用。開發團隊提供直接協助,以進行商業部署的授權過程。 IronOCR兼容Visual Studio的最新版本。 IronOCR的優勢 使用最新的 Tesseract 5 引擎,IronOCR 能夠讀取來自各種圖片或 PDF 文件的紙質文件、條碼和 QR 代碼。 此套件簡化了在桌面、控制台和 Web 應用程序中集成 OCR。 IronOCR 讓我們能夠進行 OCR,從而將掃描的 PDF 文件轉換為可搜索的 PDF 文件。 除了詞彙表和自定義語言,IronOCR 支持 125 種不同語言。 IronOCR 可以掃描超過 20 種不同類型的條碼和 QR 代碼。 IronOCR 可以提供純文本及條碼數據的輸出。 開發人員可以使用替代的結構化數據物件範式檢索所有内容以便直接輸入到系統中。 這包括網頁應用程序中的結構化標題、段落、行、單詞和字符。 以下是我們將用來識別所提供圖像中的文本內容並將其轉換為文本的示例代碼。 using IronOcr; // Instantiate an IronTesseract object to utilize its OCR capabilities var Ocr = new IronTesseract(); // Set the language to English for better accuracy Ocr.Language = OcrLanguage.EnglishBest; // Optionally specify the Tesseract version to ensure compatibility Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5; // Create an OcrInput object to add images for OCR processing using (var Input = new OcrInput()) { // Add the image to be processed; specify the image's path Input.AddImage(@"Demo.png"); // Perform the OCR and store the result var Result = Ocr.Read(Input); // Output the extracted text to the console Console.WriteLine(Result.Text); // Pause the console to keep it open Console.ReadKey(); } using IronOcr; // Instantiate an IronTesseract object to utilize its OCR capabilities var Ocr = new IronTesseract(); // Set the language to English for better accuracy Ocr.Language = OcrLanguage.EnglishBest; // Optionally specify the Tesseract version to ensure compatibility Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5; // Create an OcrInput object to add images for OCR processing using (var Input = new OcrInput()) { // Add the image to be processed; specify the image's path Input.AddImage(@"Demo.png"); // Perform the OCR and store the result var Result = Ocr.Read(Input); // Output the extracted text to the console Console.WriteLine(Result.Text); // Pause the console to keep it open Console.ReadKey(); } Imports IronOcr ' Instantiate an IronTesseract object to utilize its OCR capabilities Private Ocr = New IronTesseract() ' Set the language to English for better accuracy Ocr.Language = OcrLanguage.EnglishBest ' Optionally specify the Tesseract version to ensure compatibility Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5 ' Create an OcrInput object to add images for OCR processing Using Input = New OcrInput() ' Add the image to be processed; specify the image's path Input.AddImage("Demo.png") ' Perform the OCR and store the result Dim Result = Ocr.Read(Input) ' Output the extracted text to the console Console.WriteLine(Result.Text) ' Pause the console to keep it open Console.ReadKey() End Using $vbLabelText $csharpLabel 在上面的代碼片段中,我們使用 IronTesseract 開發一個功能。 首先,我們實例化一個新的 OcrInput 物件,以便添加一個或多個圖像文件。 你可以使用 AddImage 方法通過指定每個圖像的路徑來添加任意數量的圖像。 添加圖像後,調用 IronTesseract 物件上的 Read 方法,對提供的輸入進行 OCR。 結果文本然後通過控制台提取並顯示。 下面的輸出顯示了從先前提供的圖像中提取的文本,顯示了文本成功從圖像中提取出來。 查閱此 文章,以獲取詳細的 IronOCR 說明。 結論 OCR 開源工具允許我們使用其源代碼構建自己的程序。 然而,一些工具沒有官方庫或專門的團隊在出現編碼問題時提供支持。 Tesseract 的文檔也缺少常用情境的代碼範例或教程,讓初學者難於理解代碼和庫。 IronOCR 支援各種 .NET 專案,如 .NET Framework Standard 2、.NET Framework 4.5、.NET Core 2、3 和 5。它還適用於更新的技術,如 Mono、Xamarin 和 Azure。 通過利用 IronOCR 技術,我們可以增強 Tesseract 的結果,並校正誤掃的文件或圖片。 複雜的 Tesseract 字典系統是由 NuGet 套件管理的。 我們利用 Iron OCR 庫開發了一個 OCR 工具。 有了 IronOCR,我們可以無需額外的配置使用計畫,同時它支持 PDF 文件、多幀 TIFF 和所有常見圖像格式。 它還提供條碼識別功能,允許我們提取條碼數據並從圖像中讀取條碼值。 IronOCR 提供了一個具有免費試用版的成本效益開發版,終身許可證包括在 IronOCR 捆綁包中,不會額外收費。IronOCR 捆綁包提供跨多個平台的單一付款覆蓋。 有關 IronOCR 價格的更多信息,請參閱此 頁面。 Kannapat Udonpant 立即與工程團隊聊天 軟體工程師 在成為软件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人实验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因为他直接向编写大部分 IronPDF 使用的代码的开发者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代码或文档时,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。 相關文章 更新日期 6月 22, 2025 Power Automate OCR 開發者教學 這項光學字符識別技術應用於文件數字化、自動化 PDF 數據提取和輸入、發票處理和使掃描的 PDF 可搜尋。 閱讀更多 更新日期 6月 22, 2025 Easyocr vs Tesseract(OCR 功能比較) 流行的 OCR 工具和函式庫,像 EasyOCR,Tesseract OCR,Keras-OCR 和 IronOCR,被普遍用於將此功能集成到現代應用中。 閱讀更多 更新日期 6月 22, 2025 如何將圖片轉換為文本 在當前的數位時代,將基於影像的內容轉換為易於閱讀的可編輯、可搜尋的文本 閱讀更多 開發者適合的最佳日文 OCR 更新列表如何使用 Tesseract 從影像中...
更新日期 6月 22, 2025 Easyocr vs Tesseract(OCR 功能比較) 流行的 OCR 工具和函式庫,像 EasyOCR,Tesseract OCR,Keras-OCR 和 IronOCR,被普遍用於將此功能集成到現代應用中。 閱讀更多