OCR 工具

C# 開源的 OCR（開發者列表）

Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

更新:2025年11月10日

OCR（光學字元辨識）是一項顛覆性的技術，它徹底改變了當今數位世界中掃描文件的使用方式。它使電腦能夠識別和提取各種來源（包括掃描的 PDF 文件）中的文本，從而使我們能夠有效地編輯 PDF 文件並與之互動。 Adobe Acrobat 是一款光學字元辨識 (OCR) 程序，它可以快速從掃描文件中提取文本，並將其轉換為可編輯的 PDF 和可搜尋的圖像 PDF。

開發者可以透過使用 Tesseract 和IronOCR等 OCR 函式庫，存取利用尖端演算法和機器學習方法的強大工具和 API。這些函式庫能夠實現精確的文字識別，從而更輕鬆地管理和檢索先前掃描的文件和全新文件中的有用資訊。 OCR技術能夠實現無縫的內容分析，幫助企業和個人充分利用掃描的文件和頁面影像，從而最大限度地提高工作效率。 OCR 是當前技術中至關重要的工具，無論是用於將紙本記錄數位化、從發票中提取數據，還是僅僅增強文件的可訪問性。

超立方體

最著名的開源 OCR 引擎名為 Tesseract，它最初是由惠普公司開發的。自 2006 年以來，Google一直支援這個以 Apache 授權發布的自由軟體專案。

Tesseract OCR引擎是目前最精準的開源免費系統之一。 Tesseract最新穩定版本4.1.1基於LSTM，支援116種語言。

Tesseract 在命令列介面運行時需要單獨的 GUI（圖形使用者介面）支持，因為它沒有自己的內建介面。它能夠利用神經網路學習新訊息，並擁有先進的影像預處理流程。將 OCR 功能新增至.NET應用程式最有效的方法是使用 Tesseract .NET SDK，它是提供文字辨識功能的最佳解決方案之一。儘管 Tesseract 無疑是目前市場上最好的 OCR 庫。

GOCR

GNU 通用公共授權被用於建立名為 GOCR 的 OCR（光學字元辨識）程式。它可以將文字檔案轉換回文件的掃描影像。在啟動該專案並管理 SF 開發團隊之後，Joerg Schulenburg 如今仍以（非常）低的開發進度處理該專案。

由於 GOCR 可以與多個前端一起使用，因此將其移植到其他作業系統、網路應用程式和架構相對簡單。它可以讀取多種圖片檔案類型，直到 2010 年，其品質一直在不斷提高。

根據 GOCR 的說法，它可以處理高度為 20-60 像素的單列無襯線字體。它報告稱，對於非拉丁字母書寫的文字、襯線字體、重疊字母、各種字體、雜訊照片以及過大的傾斜角度，都會出現閱讀困難。 GOCR 也能夠翻譯條碼。

楔形體

CuneiForm 是一種免費開源技術，現在也稱為"認知開放式 OCR"。它具有內建輸出功能和資料庫。它涵蓋 23 種不同的語言，還可以執行文字格式掃描、文件佈局分析和識別等任務。

Cognitive Technologies 開發了 OpenOCR 的許可證，該許可證是免費軟體和 BSD 許可證。雖然它支援跨平台使用，但 Linux 用戶無法使用圖形介面。

為了簡化任何 Dot NET Framework 2.0 或更高版本應用程式中的字元辨識工作，使用了包裝庫 Puma Dot NET。它在處理資料時運行字典檢查，以提高識別品質。

CuneiForm 是一種旨在自動或半自動地將紙本文件和影像檔案的電子副本轉換為可編輯形式的技術，而不會影響文件的結構和原始字體。該系統由兩部分組成，分別用於批次處理電子文檔和逐個處理文件。此外，該系統支援俄語和英語混合使用。只有 Andrei Borovsky 在 2009 年創建的分支支援識別其他混合語言。教會系統識別其他語言是一項挑戰，因為每種語言都與一個資料檔案相關聯，而開發人員並未公開資料檔案的結構和創建過程。

海怪

Kraken 的開發是為了解決 Ocropus 的問題，同時又不影響其其他功能。它利用其 CLSTM 神經網路庫，並藉鑒以往專案中累積的寶貴經驗，處理最新數據。它需要使用某些外部程式庫才能在不同平台上有效運作。借助儲存的信息，它可以對潛在的數據驗證問題做出更準確的預測。此外，其工作方法便於新模型的部署和培訓。

AT9

A9T9 是一款免費的 OCR 軟體，可用於從圖片檔案中提取文字以及轉換圖像和 PDF 文件。它為 Tesseract OCR 引擎提供圖形使用者介面 (GUI)。

該程式設定簡單。最重要的是，它是完全免費且開源的。它不含間諜軟體和廣告軟體。

您可以開啟 PDF 檔案或影像，來源檔案的內容將顯示在左側視窗中。如果您的文檔有多頁或本身就是多頁文檔，您可以使用頁面底部的箭頭在頁面之間導航。

若要啟動 OCR 流程，只需按一下綠色的 OCR 按鈕，輸出結果將顯示在右側第二個窗格中。您可以選擇將輸出文字儲存為文字檔案或 Word 文件。

IronOCR

與標準的 Tesseract 函式庫相比， IronOCR擴展了 Tesseract，並提供了一個具有更高精度、更佳效能和更強穩定性的原生 C# OCR 函式庫。 IronOCR可用於.NET程式和網站，從 PDF 和圖像中提取文字。它支援多種外語，並可產生純文字或結構化資料輸出。它可以掃描條碼和帶有嵌入式文字的圖像。此程式庫可用於使用.NET開發的控制台、Web、MVC 和桌面應用程式。開發團隊可為商業部署提供許可流程的直接協助。 IronOCR與最新版本的 Visual Studio 相容。

IronOCR的優勢

IronOCR使用最新的 Tesseract 5 引擎，能夠讀取各種圖片或 PDF 文件中的紙本文件、條碼和二維碼。該軟體包簡化了將 OCR 整合到桌面、控制台和 Web 應用程式中的過程。 IronOCR使我們能夠執行 OCR 功能，從而可以將掃描的 PDF 文件轉換為可搜尋的 PDF 文件。除了單字表和自訂語言外， IronOCR還支援全球 125 種不同的語言。 IronOCR可以掃描 20 多種不同類型的條碼和二維碼。 IronOCR可以提供純文字和條碼資料兩種輸出格式。開發人員可以使用另一種結構化資料物件範式，檢索所有內容並直接將其輸入系統。這包括 Web 應用程式中的結構化標題、段落、行、單字和字元。

下面的範例程式碼將用於識別給定圖像中的文字內容並將其轉換為文字。

using IronOcr;

// Instantiate an IronTesseract object to utilize its OCR capabilities
var Ocr = new IronTesseract();

// Set the language to English for better accuracy
Ocr.Language = OcrLanguage.EnglishBest;

// Optionally specify the Tesseract version to ensure compatibility
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

// Create an OcrInput object to add images for OCR processing
using (var Input = new OcrInput())
{
    // Add the image to be processed; specify the image's path
    Input.AddImage(@"Demo.png");

    // Perform the OCR and store the result
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);

    // Pause the console to keep it open
    Console.ReadKey();
}

using IronOcr;

// Instantiate an IronTesseract object to utilize its OCR capabilities
var Ocr = new IronTesseract();

// Set the language to English for better accuracy
Ocr.Language = OcrLanguage.EnglishBest;

// Optionally specify the Tesseract version to ensure compatibility
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

// Create an OcrInput object to add images for OCR processing
using (var Input = new OcrInput())
{
    // Add the image to be processed; specify the image's path
    Input.AddImage(@"Demo.png");

    // Perform the OCR and store the result
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);

    // Pause the console to keep it open
    Console.ReadKey();
}

$vbLabelText $csharpLabel

在上面的程式碼片段中，我們正在使用 IronTesseract 開發一個功能。首先，我們實例化一個新的 OcrInput 對象，以便新增一個或多個影像檔案。您可以使用 AddImage 方法指定每個影像的路徑，從而新增任意數量的影像。新增影像後，將對 Read 物件呼叫 IronTesseract 方法，以對提供的輸入執行 OCR。然後提取生成的文字並通過控制台顯示。

下面的輸出顯示了從先前提供的圖像中提取的文本，證明已成功從圖像中提取文本。

OCR C# 開源（開發者清單）圖 1 - 輸出

請參閱此帖子以獲取完整的IronOCR使用說明。

結論

OCR開源工具允許我們使用其原始碼來建立我們自己的程式。然而，有些工具沒有官方庫或專門的團隊來提供支持，以解決編碼問題。 Tesseract 的文檔也缺乏常見使用場景的範例程式碼或教程，這使得初學者很難理解程式碼和程式庫。

IronOCR支援各種.NET項目，例如.NET Framework Standard 2、 .NET Framework 4.5 和.NET Core 2、3 和 5。它還可以與 Mono、Xamarin 和 Azure 等較新的技術一起使用。透過利用IronOCR技術，我們可以增強 Tesseract 的掃描結果，並修正掃描不準確的文件或影像。複雜的 Tesseract 字典系統是透過NuGet套件進行管理的。我們利用 Iron OCR 庫開發 OCR 工具。

使用IronOCR，無需任何額外配置即可使用該程序，它支援 PDF 文件、多幀 TIFF 和所有常見圖像格式。它還具備條碼識別功能，使我們能夠從圖像中提取條碼資料並讀取條碼值。 IronOCR提供經濟實惠的開發版本，並提供免費試用；終身許可證包含在IronOCR套裝中，無需額外付費。 IronOCRIronOCR只需一次付款即可覆蓋多個平台。有關 IronOCR 定價的更多信息，請參閱此頁面。

Kannapat Udonpant

立即與工程團隊聊天

軟體工程師

在成為軟件工程師之前，Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间，Kannapat 還成為了生產工程系一部份——汽車机器人實验室的成員。2022 年，他利用他的 C# 技能加入 Iron Software 的工程團隊，專注於 IronPDF。Kannapat 珍惜他的工作，因為他直接向编写大部分 IronPDF 使用的代碼的開發者学习。除了同行学习，Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代碼或文檔時，Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。