與其他組件的比較 Google OCR & IronOCR 之間的比較 Kannapat Udonpant 更新日期:7月 28, 2025 Download IronOCR NuGet 下載 DLL 下載 Windows 安裝程式 Start Free Trial Copy for LLMs Copy for LLMs Copy page as Markdown for LLMs Open in ChatGPT Ask ChatGPT about this page Open in Gemini Ask Gemini about this page Open in Grok Ask Grok about this page Open in Perplexity Ask Perplexity about this page Share Share on Facebook Share on X (Twitter) Share on LinkedIn Copy URL Email article OCR 代表光學字符識別。 它提供將圖像文件轉換為機器編碼文本的功能。 掃描的文檔通常由計算機以圖像文件形式保存。 這些圖像文件中的數據無法使用普通文本編輯器或甚至使用文字處理應用程序進行搜索、編輯或以文本格式保存。 OCR 處理幫助將這些圖像轉換為機器可讀的文本,以便用戶進一步處理。 在這個現代時代,通過互聯網共享的掃描文檔是數字格式,通常是 PDF 或圖像形式。 有許多在線資源可用來將圖像轉換為文本。 然而,大多數企業需要在其軟件應用程序中具備此功能。 考慮到這一點,有許多庫可以提供 OCR 處理技術,嵌入於軟件應用程序中。 在本文中,我們將討論兩個最流行的 C# 的 OCR 庫。 它們是: IronOCR Google Cloud Vision OCR (Vision API) IronOCR - C# 庫 IronOCR for .NET 是一個 C# 庫,用於掃描、搜索和閱讀圖像和 PDF。 它將圖像或 PDF 文件作為輸入,並使用最新的 Tesseract 5 自定義構建 .NET OCR 引擎生成文本、結構化數據或可搜索的 PDF 文檔。 Tesseract 支持 125 多種語言,並在 .NET Core 和 .NET Standard 中提供跨平台支持,範圍從 2.0 到 7。 IronOCR 是一個用戶友好的 API,允許 C# 開發人員自動將圖像轉換為文本,使用 IronTesseract 類和 API 密鑰。 它優先考慮速度、準確性和易用性。 它還幫助計算機視覺 API 通過訓練的模型集合來找到文本。 IronOCR 的另一個強大功能是它可以從所有圖像文件中掃描條形碼和 QR 碼並讀取其文本。 IronOCR 的其他重要功能如下所示。 功能特點 國際語言: 125 多種和自定義語言支持,高速高品質性能 文本和條形碼識別: 同時讀取多種語言的文本和數字 專業文檔: 專門從收據、支票、以及發票中讀取文本 從多種格式中讀取: 圖像(PNG、JPG、GIF、TIFF、BMP)、System.Drawing Objects、流、PDF 文檔(優化目標 DPI) 過濾器: 過濾嚮導、圖像修正、固定圖像方向、修正圖像顏色 簡單數據輸出: .NET 文本字符串、條形碼和 QR 數據、圖像 現在,讓我們看看 Google Cloud Vision API。 Google Cloud Vision OCR Google Cloud Vision API 是支援 C# 語言的 Google Cloud OCR 客戶端庫。 它允許 C# 開發人員輕松地將計算機視覺檢測功能集成到軟件應用程序中。 它執行 OVCR 並檢測來自圖像文件的文本、圖像標籤、面部檢測和地標檢測。 Google Cloud Vision API 使用 REST 和 RPC API 來提供強大的預訓練 ML(機器學習)模型。 通過 Cloud Vision API,您可以快速將圖像分類為已經預定義的數百萬個類別中。 它還可以檢測對象並從印刷文檔和手寫文本中讀取文本。 功能特點 圖像文本檢測: OCR 圖像以進行文本識別並將其轉換為機器語言代碼 文檔文本檢測: OCR 文件(PDF/TIFF),密集文本 地標檢測: 返回檢測到的對象的坐標 標誌檢測: 返回文本描述 標籤檢測: 返回圖像的一般標籤 本文其餘部分如下: 創建 Visual Studio 專案 安裝 AWS OCR Textract 安裝 Google OCR 圖像到文本 條形碼和 QR 碼到文本 PDF 到文本 結論 1. 創建 Visual Studio 項目 1. 創建 Visual Studio 專案 在本教程中,我們將使用 Visual Studio 2022 最新版本。 因此,我假設您已經下載並安裝了它來使用 C#。 如果沒有,您可以從 Visual Studio 網站下載。 現在,我們需要創建一個主控台專案,以便開始使用這兩個庫。 按照步驟創建專案: 打開您的 Visual Studio 2022。 點擊創建新專案。 從給定選項中選擇 C# 主控台應用程序。 配置您的新專案的名稱和位置。 例如 "OCRProject"。 點擊下一步。 從附加信息中,選擇 .NET 6.0 框架,因為它是最穩定的版本。 現在,點擊創建,專案將在您指定的位置創建。 接下來,我們將在專案中安裝庫以便進行比較。 3. 安裝 AWS OCR Textract 有多種方法可以安裝 IronOCR 庫。 讓我們一一查看它們。 2.1. 使用 Visual Studio NuGet 包管理器 NuGet 是一個包管理器,用於在您的專案中下載和安裝依賴項。 其包包含已編譯的代碼(DLL)和清單文件。通過以下方法訪問: 點擊工具選項卡 展開 NuGet 包管理器選項 點擊管理解決方案的 NuGet 包 或者,右鍵點擊解決方案總管 點擊管理 NuGet 包 現在,將打開 NuGet 包管理器窗口。 搜索 IronOCR 並點擊安裝。 2.2. 從 NuGet 網站下載 可以直接從 NuGet 官方網站下載。按照給定的步驟: 點擊 NuGet 網站上的鏈接。 點擊頁面的右側的下載包選項。 打開下載的包,並將開始安裝。 最後,重新加載解決方案,即完成。 2.3. 使用 IronOCR 網頁下載 只需訪問 Iron Software 網站,然後導航到 IronOCR for .NET 網頁。 滾動到底部並點擊下載 DLL 或下載 Windows 安裝程式。 將下載一個壓縮文件。 解壓縮它並添加到您的專案文件中,或者運行 Windows 安裝程式。 按照以下步驟將其添加到您的項目中。 右鍵單擊解決方案總管中的專案依賴項。 然後選擇添加項目引用選項。 瀏覽到下載的 DLL 文件位置。 最後,點擊確定以添加項目引用。 2.4. 使用 Visual Studio 中的命令提示符 在 Visual Studio 中導航到工具選項卡。 展開 NuGet 包管理器選項。 選擇包管理器控制台,並輸入以下命令: Install-Package IronOcr 這將自動在您的項目中下載並安裝 IronOCR。 現在,我們已經准備好在項目中使用 IronOCR。 2.5. 添加必要的 IronOCR 命名空間 只需添加一個命名空間,並需要在您需要訪問其功能的源代碼文件的頂部添加。 using IronOcr; using IronOcr; Imports IronOcr $vbLabelText $csharpLabel 現在,我們安裝 Google Vision OCR。 3. 安裝 Google OCR 要能夠在您的 C# 專案中使用 Vision API,您必須滿足以下前提條件: 創建一個 Google 帳戶 從 Google Cloud 控制台中創建一個新項目 啟用計費 啟用 Vision API 創建一個服務帳戶並設置憑據 將服務帳戶密鑰憑據下載為 JSON 文件格式 您可以在官方文檔中詳細了解使用 Google Cloud Vision 的設置和要求此處。 現在,要在 Visual Studio 中安裝執行 OCR 處理的 Google Cloud 客戶端庫,我們需要使用 NuGet 包管理器。 您可以從 NuGet 包管理器下載並安裝 AWS Textract SDK。 通過以下方法訪問: 點擊工具選項卡 展開 NuGet 包管理器選項 點擊管理解決方案的 NuGet 包 或者,右鍵點擊解決方案總管 點擊管理 NuGet 包 現在,將打開 NuGet 包管理器窗口。 搜索 Google Cloud Vision OCR 並點擊安裝。 3.2. 添加 Google Vision API 命名空間 包含以下命名空間以使用Google OCR視覺API: using Google.Cloud.Vision.V1; using Google.Cloud.Vision.V1; Imports Google.Cloud.Vision.V1 $vbLabelText $csharpLabel 還需要使用JSON文件格式下載的密鑰憑據設置環境變量。 Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json"); Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json"); Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json") $vbLabelText $csharpLabel 現在所有的設置都完成,可以使用了。 4. 圖像到文本 從圖像中讀取數據是一項艱巨的任務。 圖像的分辨率和質量在提取內容時起著重要作用。 這兩個庫都提供光學字符識別(OCR)功能,以從圖像中提取文本。 IronOCR 允許使用先進的 Tesseract 從 PDF 文件格式中識別和讀取文本。 IronOCR 對於開發人員來說,使用其強大的 IronTesseract 類來讀取圖像文件中的內容非常容易。 在這裡,我們將使用 PNG 圖像從圖像文件中讀取文本,代碼如下: var ocr = new IronTesseract(); using (var input = new OcrInput()) { // Add the image to be processed input.AddImage("test-files/employmentapp.png"); // Process the image var result = ocr.Read(input); // Output the extracted text Console.WriteLine(result.Text); } var ocr = new IronTesseract(); using (var input = new OcrInput()) { // Add the image to be processed input.AddImage("test-files/employmentapp.png"); // Process the image var result = ocr.Read(input); // Output the extracted text Console.WriteLine(result.Text); } Dim ocr = New IronTesseract() Using input = New OcrInput() ' Add the image to be processed input.AddImage("test-files/employmentapp.png") ' Process the image Dim result = ocr.Read(input) ' Output the extracted text Console.WriteLine(result.Text) End Using $vbLabelText $csharpLabel 輸入圖像 輸出 IronOCR 的輸出與給定的原始圖像一致。 代碼簡潔且易於理解,沒有任何技術問題。 4.2. 使用 Google OCR Google Cloud Vision OCR 也將圖像轉換為具有不同字體的文本。 首先,我們需要使用憑據文件創建一個客戶端。然後使用此客戶端對象,我們可以調用 DetectText 方法以便以註釋形式獲得響應。 代碼如下所示: Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json"); var client = ImageAnnotatorClient.Create(); var image = Google.Cloud.Vision.V1.Image.FromFile("test-files/employmentapp.png"); var response = client.DetectText(image); foreach (var annotation in response) { if (annotation.Description != null) { Console.WriteLine(annotation.Description); } } Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json"); var client = ImageAnnotatorClient.Create(); var image = Google.Cloud.Vision.V1.Image.FromFile("test-files/employmentapp.png"); var response = client.DetectText(image); foreach (var annotation in response) { if (annotation.Description != null) { Console.WriteLine(annotation.Description); } } Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json") Dim client = ImageAnnotatorClient.Create() Dim image = Google.Cloud.Vision.V1.Image.FromFile("test-files/employmentapp.png") Dim response = client.DetectText(image) For Each annotation In response If annotation.Description IsNot Nothing Then Console.WriteLine(annotation.Description) End If Next annotation $vbLabelText $csharpLabel 在此輸入中,給予的圖像用來比較兩個庫的輸出。 從上面的輸出中,您可以清楚地看到,IronOCR 保留了圖像輸出的格式。 儘管 Google OCR 給出準確的輸出文本,但表格的格式並未保留。 IronOCR 完美保留了圖像中表格的原本格式。 5. 條形碼和 QR 碼到文本 代碼幾乎與之前的相似。 IronOCR 提供了一個獨特而實用的功能,即在讀取圖像時,它可以讀取條形碼和 QR 碼。 它能夠檢測條形碼,並顯示其值。 首先,將 ReadBarCodes 配置設置為真,然後遍歷 OCR 結果中的每個條形碼。 讀取條形碼的代碼如下所示: var ocr = new IronTesseract(); ocr.Configuration.ReadBarCodes = true; using (var input = new OcrInput()) { // Add the image to be processed input.AddImage("test-files/Barcode.png"); // Process the image var result = ocr.Read(input); // Iterate and output barcode values foreach (var barcode in result.Barcodes) { Console.WriteLine(barcode.Value); } } var ocr = new IronTesseract(); ocr.Configuration.ReadBarCodes = true; using (var input = new OcrInput()) { // Add the image to be processed input.AddImage("test-files/Barcode.png"); // Process the image var result = ocr.Read(input); // Iterate and output barcode values foreach (var barcode in result.Barcodes) { Console.WriteLine(barcode.Value); } } Dim ocr = New IronTesseract() ocr.Configuration.ReadBarCodes = True Using input = New OcrInput() ' Add the image to be processed input.AddImage("test-files/Barcode.png") ' Process the image Dim result = ocr.Read(input) ' Iterate and output barcode values For Each barcode In result.Barcodes Console.WriteLine(barcode.Value) Next barcode End Using $vbLabelText $csharpLabel 輸入圖像 輸出 輸入中的所有三個條形碼均已成功讀取,並顯示其隱藏文本。 5.2. 使用 Google OCR Google Vision API 尚未提供此功能。 在軟件應用程序中讀取條形碼可能很方便。 但是,Google OCR 允許您從掃描文檔中獲取文本將其作為一個圖像文件。標籤檢測的代碼如下: var client = ImageAnnotatorClient.Create(); var image = Google.Cloud.Vision.V1.Image.FromUri("gs://cloud-samples-data/vision/using_curl/shanghai.jpeg"); var labels = client.DetectLabels(image); Console.WriteLine("Labels (and confidence score):"); Console.WriteLine(new String('=', 30)); foreach (var label in labels) { Console.WriteLine($"{label.Description} ({(int)(label.Score * 100)}%)"); } var client = ImageAnnotatorClient.Create(); var image = Google.Cloud.Vision.V1.Image.FromUri("gs://cloud-samples-data/vision/using_curl/shanghai.jpeg"); var labels = client.DetectLabels(image); Console.WriteLine("Labels (and confidence score):"); Console.WriteLine(new String('=', 30)); foreach (var label in labels) { Console.WriteLine($"{label.Description} ({(int)(label.Score * 100)}%)"); } Imports System Dim client = ImageAnnotatorClient.Create() Dim image = Google.Cloud.Vision.V1.Image.FromUri("gs://cloud-samples-data/vision/using_curl/shanghai.jpeg") Dim labels = client.DetectLabels(image) Console.WriteLine("Labels (and confidence score):") Console.WriteLine(New String("="c, 30)) For Each label In labels Console.WriteLine($"{label.Description} ({CInt(Math.Truncate(label.Score * 100))}%)") Next label $vbLabelText $csharpLabel 輸出 6. PDF 到文本 6.1. 使用 IronOCR 在 IronOCR 中讀取 PDF 文件就像讀取圖像文件一樣簡單。 您只需要將圖像讀取代碼中的AddImage方法更改為AddPdf。 代碼如下: var ocr = new IronTesseract(); using (var input = new OcrInput()) { // Add the PDF to be processed input.AddPdf("test-files/example.PDF"); // Process the PDF var result = ocr.Read(input); // Output the extracted text Console.WriteLine(result.Text); } var ocr = new IronTesseract(); using (var input = new OcrInput()) { // Add the PDF to be processed input.AddPdf("test-files/example.PDF"); // Process the PDF var result = ocr.Read(input); // Output the extracted text Console.WriteLine(result.Text); } Dim ocr = New IronTesseract() Using input = New OcrInput() ' Add the PDF to be processed input.AddPdf("test-files/example.PDF") ' Process the PDF Dim result = ocr.Read(input) ' Output the extracted text Console.WriteLine(result.Text) End Using $vbLabelText $csharpLabel 輸出 提取出的文本其格式與 PDF 文件相同。 6.2. 使用 Google OCR Google OCR 也提供從 PDF/TIFF 文檔中提取文本的功能。 但是,如果文件位於 Google Cloud Storage 中,它才會偵測文本。 為此,您需要創建一個 Google Storage 桶。 C# 的代碼不是容易上手,而且非常冗長,不適合在此展示。 在 C# 中檢測在文件中的文本尚無可用範例。 您可以查看 Java 代碼 參考學習。 8. 結論 IronOCR 免費用於開發目的,但商業使用需要付費授權。 它還提供免費試用,讓您測試其所有潛力。 Lite 套餐從一定金額開始,含有免費試用。 IronOCR 提供一年範疇的免費產品支持和更新,然後每年成本為 399 美元。所有許可證均為永久性,只需一次購買,無隱藏費用。 您還可以選擇免版稅的 SaaS 和 OEM 產品的分發覆蓋,僅需 1999 美元的一次性購買。 如需有關許可證套餐和定價計畫的更多信息,請訪問這裡。 Google Cloud Vision 定價計畫依賴於應用於圖像上的操作次數。 例如多頁面的如 PDF 文件,每頁作為一幅圖像進行處理。 此外,應用於圖像上的每個功能都是一個單獨的收費單位。 例如,如果您對同一圖像應用文本檢測和標籤檢測,每個功能將單獨收費。 定價計畫如下所示,欲知更詳情,請訪問此鏈接。 1. 創建 Visual Studio 項目 IronOCR 為 C# 開發人員提供了我們在任何平台上所知的最先進的 Tesseract API。 IronOCR 可以部署於 Windows、Linux、Mac、Azure、AWS、Lambda,並支持 .NET Framework 項目、.NET Standard 和 .NET Core 項目。 Amazon Textract 基於 Amazon 的計算機視覺科學家為日常分析數十億圖像和視頻而開發的、經過驗證的高度可擴展深度學習技術。 Google Cloud Vision API 是一個先進的 AI 構建 API。 它提供了一系列圖像分析功能,可以在建構 ML 應用程序時非常有用。 它允許開發人員直接使用 API 密鑰與 Google Cloud 通信,這意味著無需本地存儲文件。 IronOCR 許可基於用戶數,這意味著應根據使用該產品的開發人員數量來購買許可。 Google Cloud Vision 的許可基於圖像數量以提取信息並分析數據。 許可為每月許可,對於大量圖像價格相比 IronOCR 而言會變得非常昂貴。 此外,IronOCR 許可是一種一次性購買,可以使用終生,並支持 OEM 和 SaaS 分發。 總體結論是,這兩個庫都具備機器學習功能。 IronOCR 在 Google OCR 上稍具優勢,因為它專門針對 C# .NET 框架構建,速度快且節省時間。 它提供了所有功能,代碼行數很少,減輕了開發人員編寫冗長代碼的負擔。 它基於最受歡迎的 Tesseract 5 API,使其易於集成並分析圖像和其他文件格式,並具有準確的輸出。 另一方面,Google Vision OCR 基於 AI,並更專注於 Java、Python 和 REST 開發,僅在連接到 Google Cloud 時才可運行。 這可能會相當費時,因為響應來自服務器端。您可以根據您的特定需求選擇合適的庫。 現在,您可以以 2 個的價格獲得 5 個 Iron 產品。Iron Suite 包含以下工具: IronBarcode IronWebScraper IronOCR IronWebScraper IronWebscraper 訪問此鏈接以進一步探索。 您可以從 這裡 下載 IronOCR。 [{i:(Google Cloud Vision OCR 是其各自所有者的註冊商標。 本網站與 Google Cloud Vision OCR 沒有關聯、未經 Google Cloud Vision OCR 批准或贊助。 所有產品名稱、徽標和品牌均為其各自所有者的財產。 比較僅供參考,反映撰寫時公開可用的信息。 常見問題解答 如何使用 C# 將圖像轉換為文本? 您可以使用利用 Tesseract 5 引擎的 IronOCR 將圖片轉換為機器可讀的文本。 它支持超過 125 種語言,並且兼容多個平台,這對於 C# 應用程式中的文本提取來說是個不錯的選擇。 使用 IronOCR 進行條碼和 QR 碼掃描有哪些好處? IronOCR 不僅可以將圖片和 PDF 轉換為文本,還在條碼和 QR 碼掃描方面表現出色。 它提供快速和精確的數據提取,是需要全面 OCR 功能的應用程式的多功能工具。 IronOCR 如何處理不同語言? IronOCR 支持超過 125 種語言,並提供自定義語言支持。 這種廣泛的語言兼容性使其能夠高度適應於國際應用,確保跨多種語言的文本識別。 C# 專案中 IronOCR 的安裝要求是什麼? 要在 C# 專案中安裝 IronOCR,您可以使用 Visual Studio 中的 NuGet 包管理器。 只需在 NuGet 包管理器中搜尋 IronOCR 並安裝它,即可將 OCR 功能無縫集成到您的應用程式中。 IronOCR 的許可模式與基於雲的 OCR 服務相比如何? IronOCR 提供一次性購買模式,並附帶永久許可,提供長期價值,無需經常性費用。 相比之下,像 Google Cloud Vision 這樣的基於雲的 OCR 服務通常使用按次付費的定價模式,高使用量可能變得昂貴。 IronOCR 支持哪些平台? IronOCR 可以部署在包括 Windows、Linux、Mac、Azure、AWS 和 Lambda 在內的各種平台上。 它支持 .NET Framework、.NET Standard 和 .NET Core 專案,為不同的開發環境提供了靈活性。 IronOCR 能否離線運行? 是的,IronOCR 可以離線運行,這是相較於基於雲的解決方案的一個重大優勢。 這種能力確保您的 OCR 處理不依賴於網路連接,提供更大的控制和安全性。 IronOCR 如何確保 OCR 處理的準確性和速度? IronOCR 利用先進的算法和 Tesseract 5 引擎提供快速和準確的 OCR 處理。 其圖片校正過濾器進一步提高了文本識別精度,使其成為高品質 OCR 任務的可靠選擇。 Kannapat Udonpant 立即與工程團隊聊天 軟體工程師 在成為软件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人实验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因为他直接向编写大部分 IronPDF 使用的代码的开发者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代码或文档时,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。 相關文章 更新日期 9月 25, 2025 如何在 C# 中選擇最佳 OCR 函式庫 確定專案的最佳光學字符識別(OCR)庫可能具有挑戰性。一些庫專注於企業級OCR功能和高OCR準確度 閱讀更多 更新日期 8月 24, 2025 為什麼 IronOCR 相對於短期記憶模組在光學字符識別中更好:.NET 開發者的實踐指南 光學字符識別(OCR)是從圖像和文檔中提取文本和信息的重要技術。雖然像 GPT-4 和 Gemini 的大型語言模型(LLMs)在自然語言處理方面帶來了革新。 閱讀更多 更新日期 7月 28, 2025 AWS OCR與Azure OCR(OCR功能比較) 這些包括像亞馬遜Web服務(AWS)、微軟Azure和谷歌雲平台上的Google Cloud Vision API等雲提供商 閱讀更多 AWS vs Google Vision(OCR 功能比較)Iris & IronOCR 間的 OCR 軟體比較
更新日期 8月 24, 2025 為什麼 IronOCR 相對於短期記憶模組在光學字符識別中更好:.NET 開發者的實踐指南 光學字符識別(OCR)是從圖像和文檔中提取文本和信息的重要技術。雖然像 GPT-4 和 Gemini 的大型語言模型(LLMs)在自然語言處理方面帶來了革新。 閱讀更多
更新日期 7月 28, 2025 AWS OCR與Azure OCR(OCR功能比較) 這些包括像亞馬遜Web服務(AWS)、微軟Azure和谷歌雲平台上的Google Cloud Vision API等雲提供商 閱讀更多