與其他組件的比較 IronOCR 和 Nanonets OCR 之間的比較 Kannapat Udonpant 更新日期:7月 28, 2025 Download IronOCR NuGet 下載 DLL 下載 Windows 安裝程式 Start Free Trial Copy for LLMs Copy for LLMs Copy page as Markdown for LLMs Open in ChatGPT Ask ChatGPT about this page Open in Gemini Ask Gemini about this page Open in Grok Ask Grok about this page Open in Perplexity Ask Perplexity about this page Share Share on Facebook Share on X (Twitter) Share on LinkedIn Copy URL Email article 光學字符識別(OCR)提供將圖像文件轉換為機器編碼文本的能力。 考慮到掃描的文件被保存為圖像文件,而這些圖像文件中的數據不能用普通的文本編輯器或甚至是文字處理應用程序進行搜索、編輯或以文本格式保存,這非常有用。 OCR 處理有助於將這些圖像轉換為機器可讀的文本,以供用戶進一步處理。 在這個現代時代,通過互聯網共享的文件通常是數字格式,主要是以 PDF 或圖像的形式。 有許多線上資源可以將圖像轉換為文本。 然而,大多數企業需要在其軟件應用程序中具備此功能。 考慮到這一點,有許多提供嵌入在軟體應用程式中的OCR處理技術的庫。 在本文中,我們將討論兩個最流行的 C# 的 OCR 庫。 它們是: IronPDF Nanonets OCR API IronOCR - C# 庫 IronOCR for .NET 是一個 C# 庫,允許用戶掃描、搜索和閱讀圖像和 PDF。 它將圖像或 PDF 文件作為輸入,並使用最新的 Tesseract 5 自定義構建 .NET OCR 引擎輸出文本、結構化數據或可搜索的 PDF 文檔。 Tesseract 支援超過125種語言,IronOCR在.NET Core,Standard,版本從2.0到7中提供跨平台支援。 IronOCR 是一個使用者友好的 API,允許 C# 開發人員使用 IronTesseract 類自動將圖像轉換為文本。 該庫優先考慮速度、準確性和易用性。 IronOCR 的另一個強大功能是能夠從所有圖像文件中掃描條形碼和 QR 碼並讀取它們的文本。 IronOCR 的其他重要功能如下所示。 功能特點 國際語言:支援125種以上的語言和自定義語言。 文本及條形碼讀取:一次從多種語言中讀取文本和數字。 專業文件:從專業文件(如收據、支票和發票)中讀取文本。 從多種格式中閱讀:從圖像(PNG、JPG、GIF、TIFF、BMP)、System.Drawing Objects、流、PDF 文檔等中閱讀。 預處理功能:包含預處理功能,如過濾器向導、圖像校正、定向校正和顏色校正。 簡單數據輸出:輸出為 .NET 文本字符串、條形碼、QR 和圖片格式。 現在,讓我們看看 Nanonets OCR API。 Nanonets OCR API Nanonets OCR API 是一個 REST API,提供實時數據提取,針對自動化工作流程的業務需求進行定制。 OCR API 由 AI 驅動,可以在幾秒鐘內安全地捕獲、分類和提取非結構化文檔中的數據。 使用 Nanonets,您可以自動化手動數據輸入,減少所需的手動工作。 Nanonets 透過機器學習理解文檔,即使是那些不遵循標準模板的文檔。 您可以上傳任何非結構化文件,並根據不同的字段只捕獲所需的信息。 與傳統的 OCR 不同,Nanonets OCR 模型可以進行訓練以獲得更好的結果。 隨著您的業務增長,Nanonets 的智能文檔處理 OCR 模型也會隨著每個新的文檔進行增長和學習,提供快速且準確的結果。 此外,Nanonets 提供了一個 Python 包,允許在不需要 API 請求的情況下輕鬆集成和數據捕獲於 Python 應用程式中。 其他特點包括: GDPR 合規 自動數據捕獲 提取數據的驗證 模型訓練和再訓練能力 快速 API 響應時間 支援多語言的內部部署 持續的 AI 學習模型 無需模板設置 提供多種匯出選項 本文其餘部分如下: 創建 Visual Studio 專案 安裝 AWS OCR Textract 安裝 Nanonets OCR API 圖像到文本 條碼和 QR 轉換為文本 PDF 到文本 結論 1. 創建 Visual Studio 項目 1. 創建 Visual Studio 專案 在本教程中,我們將使用最新版本的 Visual Studio 2022。如果您尚未下載和安裝,您可以從 Visual Studio 網站下載。 現在,我們需要創建一個控制台專案以便開始使用這兩個庫。 按照步驟創建專案: 打開您的 Visual Studio 2022。 點擊創建新專案。 從給定選項中選擇 C# 控制台應用程式。 使用名稱和位置配置新專案。 例如,將其命名為 "OCRProject"。 點擊下一步。 在其他信息下,選擇 .NET 6.0 框架,因為它是最穩定的版本。 現在,點擊創建,專案將在您指定的位置創建。 接下來,我們將在專案中安裝庫以便進行比較。 3. 安裝 AWS OCR Textract 有多種方法可以安裝 IronOCR 庫。 讓我們一一查看它們。 2.1. 使用 Visual Studio NuGet 包管理器 NuGet 是一個包管理器,用於在您的專案中下載和安裝依賴項。 其包中包含已編譯的代碼和 (DLLs) 以及清單文件。通過以下方法訪問它: 點擊工具選項卡。 擴展 NuGet 包管理選項。 點擊管理解決方案的 NuGet 包。 或者: 右鍵點擊解決方案資源管理器。 點擊管理 NuGet 套件。 現在,將打開 NuGet 包管理器窗口。 搜索 IronOCR 並點擊安裝。 2.2. 從 NuGet 網站下載 IronOCR 也可以直接從 NuGet 官方網站下載。按照以下步驟進行: 訪問 NuGet 網站。 點擊頁面右側的“下載包”選項。 打開下載的包以開始安裝。 最後,重新加載解決方案即可完成。 2.3. 使用 IronOCR 網頁下載 訪問 Iron Software 網站,並導航到 IronOCR for .NET 頁面。 滾動到底部並單擊下載 DLL 或下載 Windows 安裝程序。 將下載一個 zip 文件。 提取專案文件或運行 Windows 安裝程序。 按照以下步驟將它添加到您的專案。 在 Visual Studio 的解決方案資源管理器中右鍵單擊專案的依賴項。 選擇添加項目引用選項。 瀏覽到下載的 DLL 文件位置。 最後,單擊確定以添加專案引用。 2.4. 在 Visual Studio 中使用命令提示符 在 Visual Studio 中導航到工具選項卡。 展開 NuGet 包管理器選項。 選擇包管理器控制台,並輸入以下命令: Install-Package IronOcr 這將自動在您的項目中下載並安裝 IronOCR。 現在,我們已經准備好在項目中使用 IronOCR。 2.5. 添加必要的 IronOCR 命名空間 只需在需要訪問 IronOCR 的函數的源代碼文件的頂部添加一個命名空間。 using IronOcr; using IronOcr; Imports IronOcr $vbLabelText $csharpLabel 現在,讓我們安裝 Nanonets OCR API。 3. 安裝 Nanonets OCR Nanonets 可以通過多種方式用於捕獲數據。 它提供了一個在線 OCR 設施,可用於即時提取數據,減少周轉時間。 作為 REST API,它可以集成到多種編程語言中。 在這裡,我們將展示如何將它集成到 C# 編程語言中。 要在 C# 中使用 Nanonets OCR API 自動化數據捕獲,您將需要以下內容: 註冊 Nanonets - 您可以使用您的 Gmail 帳戶或在 Nanonets 中註冊的電子郵件免費試用。 創建OCR模型 - 這將生成一個模型 ID,稍後在進行 API 調用時將使用該 ID。 獲取免費 API 金鑰 - 前往帳戶信息標籤,並單擊 API 金鑰。 在這裡,您可以添加新金鑰或使用現有的金鑰。 3.1. 添加 RestSharp 命名空間 RestSharp 是一個簡單的 .NET Rest 和 HTTP 客戶端庫。 它用於發送和接收 API 請求並處理響應。 由於 Nanonets API 也是一個 REST API,因此需要這個庫來執行其代碼。 要安裝 RestSharp,請為您的解決方案打開 NuGet 包管理器,瀏覽到 RestSharp,然後安裝它。 或者,您可以打開包管理器控制台並輸入以下命令: Install-Package RestSharp 現在所有的設置都完成,可以使用了。 4. 圖像到文本 從圖像中讀取數據可能是相當繁瑣的任務。 圖像的分辨率和質量在提取內容時起著重要作用。 IronOCR 和 Nanonets 都提供光學字符識別功能,以從圖像中提取文本。 IronOCR 允許使用先進的 Tesseract 從 PDF 文件格式中識別和讀取文本。 IronOCR 通過其強大的 IronTesseract 類使開發人員能夠非常輕鬆地閱讀圖像文件的內容。 我們將使用以下代碼從 PNG 圖像文件中讀取文本: var Ocr = new IronTesseract(); using (var Input = new OcrInput()){ Input.AddImage("test-files/employmentapp.png"); var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } var Ocr = new IronTesseract(); using (var Input = new OcrInput()){ Input.AddImage("test-files/employmentapp.png"); var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } Dim Ocr = New IronTesseract() Using Input = New OcrInput() Input.AddImage("test-files/employmentapp.png") Dim Result = Ocr.Read(Input) Console.WriteLine(Result.Text) End Using $vbLabelText $csharpLabel 輸入圖像 輸出 IronOCR 的輸出與給定的原始圖像一致。 代碼簡潔且易於理解,沒有任何技術問題。 4.2. 使用 Nanonets OCR Nanonets 也提供從圖像中提取文本的功能。 要做到這一點,需要進行 API 調用,並使用身份驗證金鑰上傳圖像到 Nanonets 服務器。 快速 OCR 工具隨後將返回提取的文本作為應用程式的響應。 這是一個代碼示例: var client = new RestClient("https://app.nanonets.com/api/v2/OCR/FullText"); client.Timeout = -1; var request = new RestRequest(Method.POST); request.AddHeader("Authorization", "Basic " + Convert.ToBase64String(Encoding.Default.GetBytes("REPLACE_YOUR_API_KEY:"))); request.AddFile("file", "FILE_PATH"); RestResponse response = client.Execute(request); Console.WriteLine(response.Content); var client = new RestClient("https://app.nanonets.com/api/v2/OCR/FullText"); client.Timeout = -1; var request = new RestRequest(Method.POST); request.AddHeader("Authorization", "Basic " + Convert.ToBase64String(Encoding.Default.GetBytes("REPLACE_YOUR_API_KEY:"))); request.AddFile("file", "FILE_PATH"); RestResponse response = client.Execute(request); Console.WriteLine(response.Content); Dim client = New RestClient("https://app.nanonets.com/api/v2/OCR/FullText") client.Timeout = -1 Dim request = New RestRequest(Method.POST) request.AddHeader("Authorization", "Basic " & Convert.ToBase64String(Encoding.Default.GetBytes("REPLACE_YOUR_API_KEY:"))) request.AddFile("file", "FILE_PATH") Dim response As RestResponse = client.Execute(request) Console.WriteLine(response.Content) $vbLabelText $csharpLabel 輸出並不完美。 圖像包含結構化的數據,只有一部分被正常提取。 對於其他簡單的文本圖像,輸出正常。請注意,可以對模型進行訓練以獲得更準確的結果。 5. 條碼和 QR 碼到文本 代碼幾乎與之前的相似。 IronOCR 提供了一個用於閱讀圖像的有用功能,其中包括檢測和讀取條形碼和 QR 碼的能力。 要啟用此功能,請在處理圖像之前將 ReadBarcodes 配置屬性設置為 true。 完成 OCR 處理後,遍歷 OCR 結果以提取每個檢測到的條形碼的值。 下面是一個使用 IronOCR 讀取條形碼的代碼片段示例: var Ocr = new IronTesseract(); Ocr.Configuration.ReadBarCodes = true; using (var input = new OcrInput()) { input.AddImage("test-files/Barcode.png"); var Result = Ocr.Read(input); foreach (var Barcode in Result.Barcodes){ Console.WriteLine(Barcode.Value); } } var Ocr = new IronTesseract(); Ocr.Configuration.ReadBarCodes = true; using (var input = new OcrInput()) { input.AddImage("test-files/Barcode.png"); var Result = Ocr.Read(input); foreach (var Barcode in Result.Barcodes){ Console.WriteLine(Barcode.Value); } } Dim Ocr = New IronTesseract() Ocr.Configuration.ReadBarCodes = True Using input = New OcrInput() input.AddImage("test-files/Barcode.png") Dim Result = Ocr.Read(input) For Each Barcode In Result.Barcodes Console.WriteLine(Barcode.Value) Next Barcode End Using $vbLabelText $csharpLabel 輸入圖像 輸出 輸入圖像中的所有三個條形碼都被成功讀取,其隱藏文本被顯示。 5.2. 使用 Nanonets OCR Nanonets OCR API 提供檢測 QR 碼的功能。 然而,該功能僅在企業計劃中可用,您需要聯絡銷售部門以使用它。 此外,Nanonets 允許您檢測文檔或收據的特定部分。它還提供其他功能,如應付款、發票處理和會計自動化。 6. PDF 到文本 6.1. 使用 IronOCR 使用 IronOCR 讀取 PDF 文件和讀取圖像文件一樣簡單。 唯一需要更改的是使用 AddPdf 方法代替代碼中讀取圖像的 AddImage。 代碼如下: var Ocr = new IronTesseract(); using (var Input = new OcrInput()) { Input.AddPdf("test-files/example.pdf"); var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } var Ocr = new IronTesseract(); using (var Input = new OcrInput()) { Input.AddPdf("test-files/example.pdf"); var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } Dim Ocr = New IronTesseract() Using Input = New OcrInput() Input.AddPdf("test-files/example.pdf") Dim Result = Ocr.Read(Input) Console.WriteLine(Result.Text) End Using $vbLabelText $csharpLabel 提取的文本與 PDF 文件的格式相同。 6.2. 使用 Nanonets OCR 從 PDF 文件中讀取數據的功能也在 Nanonets OCR API 中可用。 代碼與圖像文本檢測代碼幾乎相同,除了請求中使用的 URL。讓我們看一下代碼: var client = new RestClient("https://app.nanonets.com/api/v2/OCR/Model/{{model_id}}/LabelFile/?async=false"); var request = new RestRequest(Method.POST); request.AddHeader("Authorization", "Basic " + Convert.ToBase64String(Encoding.Default.GetBytes("REPLACE_YOUR_API_KEY:"))); request.AddHeader("Accept", "Multipart/form-data"); request.AddFile("file", "test-files/example.pdf"); RestResponse response = client.Execute(request); Console.WriteLine(response.Content); var client = new RestClient("https://app.nanonets.com/api/v2/OCR/Model/{{model_id}}/LabelFile/?async=false"); var request = new RestRequest(Method.POST); request.AddHeader("Authorization", "Basic " + Convert.ToBase64String(Encoding.Default.GetBytes("REPLACE_YOUR_API_KEY:"))); request.AddHeader("Accept", "Multipart/form-data"); request.AddFile("file", "test-files/example.pdf"); RestResponse response = client.Execute(request); Console.WriteLine(response.Content); Dim client = New RestClient("https://app.nanonets.com/api/v2/OCR/Model/{{model_id}}/LabelFile/?async=false") Dim request = New RestRequest(Method.POST) request.AddHeader("Authorization", "Basic " & Convert.ToBase64String(Encoding.Default.GetBytes("REPLACE_YOUR_API_KEY:"))) request.AddHeader("Accept", "Multipart/form-data") request.AddFile("file", "test-files/example.pdf") Dim response As RestResponse = client.Execute(request) Console.WriteLine(response.Content) $vbLabelText $csharpLabel 在上面的代碼中,用您的 OCR 模型 ID 替換 model_id。 此外,用您自己的 API 金鑰替換 API 金鑰。 然後,用文件路徑替換自己的 PDF 文件路徑。 輸出與 IronOCR 類似,但 Nanonets OCR 的輸出中包括多餘的空格和新行。 8. 結論 IronOCR 免費用於開發目的,但商業使用需要付費授權。 它還提供免費試用,以測試其所有潛力,滿足您的需求。 Lite 套件從 $799 開始,並提供30天退款保證。 IronOCR 提供一年的產品支持和更新,然後每年 $399。 所有許可證均為永久性的,意味著只需一次性購買,無隱藏費用。 您還可以選擇僅需 $1999 一次性購買即享受 SaaS 和 OEM 產品的免版稅再發行保障。 如需了解更多有關許可證包和價格計劃的信息,請訪問以下 鏈接。 Nanonets OCR API 提供三種不同的包。 您可以免費註冊其入門包。 前500頁免費,之後每頁收費 $0.3。 您只需為您使用的內容付費。 如需了解更多詳細的價格信息,您可以訪問此 鏈接。 1. 創建 Visual Studio 項目 IronOCR 為 C# 開發人員提供了可用於大多數平台的高級 Tesseract API。 它可在 Windows、Linux、Mac、Azure、AWS 和 Lambda 上部署,並支援 .NET Framework 項目以及 .NET Standard 和 .NET Core。 IronOCR 還使得在 OCR 掃描中讀取條形碼,甚至將 OCR 匯出為 HTML 和可搜索的 PDF。 如需了解更多有關 C# Tesseract OCR 的信息,請點擊 這裡。 Nanonets OCR API 提供多種 OCR 工具。 它為多種類型的文件提供即用的 OCR 解決方案,如發票、收據、帳單、表單和身份證,以自動化數據捕獲。 無需模板設置,無隱藏費用,使用 Nanonets OCR API 可以節省 90% 的時間,提高 10 倍的生產力。 IronOCR 許可證是基於開發人員的,這意味著您應該根據將使用該產品的開發人員數量購買許可證。 Nanonets 的定價計劃基於提取信息和分析數據的圖像或 PDF 頁數。 專業版和企業版計劃是按月計費的,價格隨在模型和頁數增加而上升,與 IronOCR 許可證相比。 此外,IronOCR 許可證是一次性購買並可用於終身,並支援 OEM 和 SaaS 分發。 總體來看,兩個 API 都提供基於 AI 和 ML 的 OCR 功能。 IronOCR 相較於 Nanonets 有一點優勢,因為它可以離線使用,而且即使對於非結構化文檔也提供更可靠的結果。 IronOCR 提供了使用自定義訓練數據的設施,以更快速的集成獲得更準確的結果。 Nanonets OCR 提供基於關鍵字段的模型訓練功能,若未正確訓練,可能難以檢測。 此外,IronOCR 支援多語言,支援多達 125 種以上的國際語言。 現在,您可以以兩件商品的價錢獲得五個 Iron 產品,作為完整的 Iron Suite 的一部分。請訪問此鏈接以了解更多。 IronOCR 還提供免費試用,並提供退款保證。 您可以從這個鏈接下載 IronOCR。 [{i:(Nanonets OCR API 是其各自所有者的註冊商標。 本網站與 Nanonets OCR API 沒有關聯,也未被其認可或贊助。 所有產品名稱、徽標和品牌均為其各自所有者的財產。 比較僅供參考,反映撰寫時公開可用的信息。 常見問題解答 對於 C# 應用程式,什麼是 Nanonets OCR API 的最佳替代方案? IronOCR 是 C# 應用程式中 Nanonets OCR API 的強力推薦替代方案。它提供了一個強大的 .NET 庫,支持超過 125 種語言、條碼和 QR 碼掃描,並且可以離線使用。 我如何將 OCR 功能集成到我的 C# 應用程式中? 您可以使用 IronOCR 將 OCR 功能集成到您的 C# 應用程式中,該工具允許您通過其自定義的 Tesseract 5 引擎將圖像和 PDF 轉換為機器可讀文本。 使用 IronOCR 比 Nanonets OCR API 有什麼優勢? IronOCR 相比 Nanonets OCR API 提供了多種優勢,包括離線功能、一次性授權模式、廣泛的語言支持和對非結構化文件的高精確度。 IronOCR 如何處理多語種的 OCR 處理? IronOCR 通過支持超過 125 種語言來處理多語種的 OCR 進程,允許在同一文檔中準確識別各種語言的文本。 IronOCR 能讀取圖像中的條碼和 QR 碼嗎? 是的,IronOCR 可以從圖像文件中檢測和讀取條碼和 QR 碼,這使得它成為需要同時進行文本和編碼識別的應用程式的多功能工具。 IronOCR 提供哪些授權選項? IronOCR 為開發目的提供免費試用版。對於商業使用,需一次性購買授權,以便永久使用且無需支付重複費用。 IronOCR 的價格模型如何與 Nanonets 相比? IronOCR 使用一次性購買模型進行授權,允許用戶避免持續費用,而 Nanonets 根據使用量收費,提供免費啟動套餐,隨後按頁面收費。 使用 IronOCR 在 C# 項目中需要什麼安裝步驟? 要在 C# 項目中使用 IronOCR,您需要在開發環境中安裝 IronOCR NuGet 套件,然後即可立即開始實施 OCR 功能。 OCR 如何改善商業工作流程? OCR 通過將圖像和 PDF 轉換為可搜索和可編輯的文本來提高商業工作流程,自動化數據輸入過程並提升各種商業操作的效率。 IronOCR 何以適合離線使用? IronOCR 適合離線使用,因為它不需要持續的網路連接來執行 OCR 任務,使其成為需要在網路連接有限的環境中可靠運行的應用程式的理想選擇。 Kannapat Udonpant 立即與工程團隊聊天 軟體工程師 在成為软件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人实验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因为他直接向编写大部分 IronPDF 使用的代码的开发者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代码或文档时,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。 相關文章 更新日期 9月 25, 2025 如何在 C# 中選擇最佳 OCR 函式庫 確定專案的最佳光學字符識別(OCR)庫可能具有挑戰性。一些庫專注於企業級OCR功能和高OCR準確度 閱讀更多 更新日期 8月 24, 2025 為什麼 IronOCR 相對於短期記憶模組在光學字符識別中更好:.NET 開發者的實踐指南 光學字符識別(OCR)是從圖像和文檔中提取文本和信息的重要技術。雖然像 GPT-4 和 Gemini 的大型語言模型(LLMs)在自然語言處理方面帶來了革新。 閱讀更多 更新日期 7月 28, 2025 AWS OCR與Azure OCR(OCR功能比較) 這些包括像亞馬遜Web服務(AWS)、微軟Azure和谷歌雲平台上的Google Cloud Vision API等雲提供商 閱讀更多 Iris & IronOCR 間的 OCR 軟體比較IronOCR 和 Aspose.OCR 之間的比較
更新日期 8月 24, 2025 為什麼 IronOCR 相對於短期記憶模組在光學字符識別中更好:.NET 開發者的實踐指南 光學字符識別(OCR)是從圖像和文檔中提取文本和信息的重要技術。雖然像 GPT-4 和 Gemini 的大型語言模型(LLMs)在自然語言處理方面帶來了革新。 閱讀更多
更新日期 7月 28, 2025 AWS OCR與Azure OCR(OCR功能比較) 這些包括像亞馬遜Web服務(AWS)、微軟Azure和谷歌雲平台上的Google Cloud Vision API等雲提供商 閱讀更多