跳過到頁腳內容
與其他組件的比較

Iris & IronOCR 間的 OCR 軟體比較

光學字符識別 (OCR) 允許在數位文件中檢測文字。 掃描的紙質文件總是被計算機保存為圖像文件。 這些圖像文件中的數據無法使用普通文本編輯器或甚至使用文字處理應用程序進行搜索、編輯或以文本格式保存。 OCR 處理幫助將這些圖像轉換為機器可讀的文本,以便用戶進一步處理。

在這個現代時代,互聯網上分享的文件都是數位格式,主要是 PDF 或圖像。 有許多在線資源可用來將圖像轉換為文本。 然而,大多數企業需要在其軟件應用程序中具備此功能。 考慮到這一點,許多庫提供可嵌入到軟件應用中的 OCR 解決方案。

在本文中,我們將比較兩種最受歡迎的 C# OCR 技術:

  • IronPDF * Iris OCR 軟體

IronOCR

IronOCR for .NET 是一個 C# 圖書館,用於掃描、搜索和閱讀圖像和 PDF。 它將圖像或 PDF 文件作為輸入,並使用最新的 Tesseract 5 自定義構建 .NET OCR 引擎生成文本、結構化數據或可搜索的 PDF 文檔。 其 Tesseract 提供超過 125 種語言,並支持 .NET Core、Standard 平台,從 2.0 直到 7。

IronOCR 是一個用戶友好的 API,允許 C# 開發者自動將圖像轉換為文本,只需使用 IronTesseract 類即可。 它優先考慮速度、準確性和易用性。 它還幫助計算機視覺 API 通過一套訓練模型來找到文本。

IronOCR 的另一個強大功能是它可以從所有圖像文件中掃描條形碼和 QR 碼並讀取其文本。 以下列出了 IronOCR 的其他重要功能。

功能特點

國際語言: 超過 125 種和自定義語言支持,具有高效和快速的性能。 * 文字和條碼讀取: 一次性從多個語言中讀取文字和數字。 * 專業文件: 專門從收據、支票、發票中讀取文字。 * 從多種格式讀取: 圖像(PNG、JPG、GIF、TIFF、BMP)、System.Drawing 對象、流和 PDF 文件(優化目標 DPI)。 * 過濾器: 過濾嚮導、圖像校正、修正圖像方向、修正圖像顏色。 * 簡單數據輸出: .NET 文本字符串、條碼和 QR 數據,圖像。

Iris OCR 軟體

Iris OCR SDK 是一個模塊化軟體工具包,可以使您的應用程序將圖像文字轉換為可編輯的文件,並提供其他文字識別服務。 它是最快的專業 OCR,具有高性能和精度。 通過 Iris 識別技術,您將獲得最先進的光學字符識別技術,包括最先進的掃描、基於 AI 的文件分類、數據完整性和數據提取。

Iris OCR 是一個功能豐富的 SDK,同時還提供強大的圖像清理工具以增強圖像。 它可以輕鬆集成到 C++、C#、J# 和 VB.NET 軟體應用中。 IrisOCR 提供長期支持,並被設計為跨平台使用。 它還支持 OEM 和 SaaS 應用。 Iris OCR 幫助企業提供靈活價格的全球解決方案。

功能特點

輸入格式: 圖像(JPG、PNG、BMP、TIFF)、PDF(圖像,文字)。 * 預處理: 圖像增強、表單清理、視角校正、質量評估。 * 文字識別: 識別超過 137 種不同語言(歐洲、亞洲、中東、特定表單)。 * 條碼識別: 1D 和 2D 條碼識別(PDF417、QR 碼、Code 39、UPC 等)。 * 輸出格式: Office(DOCX、XLSX、PPT、RTF)、PDF(圖像或可搜索的 PDF)、圖像格式(JPG、PNG、BMP、TIFF)、HTML、XML、TXT。

安裝

創建 Visual Studio 項目

在本教程中,我們將使用 Visual Studio 2022 的最新版本。 因此,我假設您已經下載並安裝了它來使用 C#。 如果沒有,您可以從 Visual Studio 網站下載。

現在,我們需要創建一個控制台專案以便開始使用這兩個庫。 按照步驟創建專案:

  • 打開您的 Visual Studio 2022。 * 點擊創建新項目。

Iris & IronOCR 軟體比較:圖 1

* 從給出的選項中選擇 C# 控制台應用程序,然後點擊“下一步”。

Iris & IronOCR 軟體比較:圖 2

  • 使用名稱和位置配置新專案。 例如“OCRProject”。

Iris & IronOCR 軟體比較:圖 3

* 為獲取更多信息,選擇 .NET 6.0 Framework,因為它是最穩定的版本。

Iris & IronOCR 軟體比較:圖 4

  • 現在,點擊創建,專案將在您指定的位置創建。

安裝 IronOCR

有多種方法可以安裝 IronOCR 庫。

1. 使用 Visual Studio NuGet 包管理器

NuGet 是一個包管理器,用於在您的專案中下載和安裝依賴項。 其包包含編譯代碼(DLL)和清單文件。使用以下方法訪問它:

* 點擊工具欄。

  • 擴展 NuGet 包管理選項。
  • 點擊管理解決方案的 NuGet 包。

Iris & IronOCR 軟體比較:圖 5

* 或右鍵單擊解決方案資源管理器。

  • 點擊管理 NuGet 套件。

Iris & IronOCR 軟體比較:圖 6

現在,將打開 NuGet 包管理器窗口。 搜索 IronOCR 並點擊安裝。

Iris & IronOCR 軟體比較:圖 7

2. 從 NuGet 網站下載

它可以直接從 NuGet 官方網站下載。

  1. 訪問 NuGet 網站
  2. 點擊頁面右側的下載包選項。
  3. 打開下載的包,它將開始安裝。
  4. 最後,重新加載解決方案,即完成。

3. 通過 IronOCR 網頁下載

只需訪問 Iron Software 網站並導航到 IronOCR for .NET 網頁。 滾動到底部並單擊下載 DLL 或下載 Windows 安裝程序。

Iris & IronOCR 軟體比較:圖 8

一個 zip 文件被下載。 提取您的項目文件或運行 Windows 安裝程序。 按照以下步驟將它添加到您的專案。

  1. 在 Visual Studio 的解決方案資源管理器中右鍵單擊專案的依賴項。
  2. 然後選擇添加項目引用選項。
  3. 瀏覽下載的 DLL 文件位置。
  4. 最後,單擊“確定”以添加項目引用。

4. 在 Visual Studio 中使用命令提示符

  1. 在 Visual Studio 中導航到工具選項卡。
  2. 展開 NuGet 包管理器選項。
  3. 選擇包管理器控制台,並輸入以下命令:

    Install-Package IronOcr

這將自動在您的項目中下載並安裝 IronOCR。

5. 添加必需的 IronOCR 命名空間

只需添加一個命名空間到我們需要訪問其功能的源代碼文件的頂部。

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

現在,我們已經准備好在項目中使用 IronOCR。

安裝 Iris OCR

有多種方法可以使用 Iris OCR。 如果您正在尋找小型企業或辦公室解決方案,可以使用 OCR 應用程序。可以從這個鏈接下載軟體。

如果您正在尋找中大型企業解決方案,那麼您需要聯繫 Iris 團隊以根據您的需求獲取報價。 SDKs 和其他文檔僅對註冊客戶提供。 要在開發環境中使用 SDK,您需要使用這個表單請求訪問。

在這裡,我們將使用 Iris 17 OCR 軟體進行比較。 它在基礎級別提供了所有功能,可以與 IronOCR 進行比較。 以下步驟將幫助您下載和安裝 Iris OCR 軟體:

  1. 軟體下載後,雙擊打開設置嚮導。

Iris & IronOCR 軟體比較:圖 9

  1. 點擊下一步,選擇安裝模式。
  2. 接下來,選擇您希望從中讀取文字的語言。

Iris & IronOCR 軟體比較:圖 10

  1. 點擊下一步,然後安裝 Iris OCR。

Iris & IronOCR 軟體比較:圖 11

  1. 現在軟體將開始安裝。 安裝後,單擊完成並打開 Iris OCR 軟體。

Iris & IronOCR 軟體比較:圖 12

一切完成! 現在我們來進行比較。

比較

1. 圖像到文字

從圖像中讀取數據是一項相當繁瑣的工作。 圖像的分辨率和質量在提取內容時發揮著重要作用。 這兩個庫都提供光學字符識別功能來從圖像中提取文本。

1.1. 使用 IronOCR

IronOCR 為開發者提供了一個非常方便的方法來讀取圖像文件的內容,借助其強大的 IronTessaract 類。 在這裡,我們將使用一個 PNG 圖像來從圖像文件中讀取文本,其代碼如下:

var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
' We use a using statement to ensure resources are freed after use
Using Input = New OcrInput()
	' Add the image from which you want to extract text
	Input.AddImage("test-files/employmentapp.png")
	' Perform OCR to read the text
	Dim Result = OCR.Read(Input)
	' Output the extracted text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel
輸入圖像

Iris & IronOCR 軟體比較:圖 13

輸出

Iris & IronOCR 軟體比較:圖 14 - 圖像輸出

IronOCR 的輸出與給定的原始圖像一致。 代碼簡潔且易於理解,沒有任何技術問題。

1.2. 使用 Iris OCR

Iris OCR 軟體允許您掃描所有紙張文件並用於文本識別。 使用 Iris OCR 技術進行文本提取非常簡單。 在“首頁”菜單標籤中,從“文件”選擇圖像文件。 使用相同的圖像來測試和比較兩個軟體的輸出。

Iris & IronOCR 軟體比較:圖 15

您可以對上傳的圖像進行圖像校正。 在“輸出文件”選項卡中,您可以選擇任何格式作為輸出。 它提供多種輸出格式,如 Word、Excel、PDF、文本文件等。只需以任何格式保存文件並打開查看提取的文本。

輸出

Iris & IronOCR 軟體比較:圖 16

可以看到,兩個軟體的輸出有明顯的差異。 IronOCR 提取了圖像中的準確文本以及格式。 而 Iris OCR 保存了格式,但全名和電話號碼卻錯了。

2. 條碼和 QR 碼到文字

2.1. 使用 IronOCR

IronOCR 提供了一個獨特而有用的功能,即在讀取圖像時可以讀取條碼和 QR 碼。 它能夠檢測條形碼,並顯示其值。

為此,將讀取條碼設置為 true,然後遍歷 OCR 結果中的每一個條碼。 讀取條形碼的代碼如下所示:

var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Dim OCR = New IronTesseract()
OCR.Configuration.ReadBarCodes = True
' Using statement to automatically dispose of resources
Using input = New OcrInput()
	' Add the image to be processed
	input.AddImage("test-files/Barcode.png")
	' Read the OCR result
	Dim Result = OCR.Read(input)
	' Iterate through the barcodes detected and display their values
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
$vbLabelText   $csharpLabel
輸入圖像

Iris & IronOCR 軟體比較:圖 17

輸出

Iris & IronOCR 軟體比較:圖 18

輸入圖像中的所有三個條形碼都被成功讀取,其隱藏文本被顯示。

2.2. 使用 Iris OCR

Iris OCR 也提供從圖片或 PDF 文件中提取條碼數據的功能。 然而,對於條碼,我們必須手動選擇要識別的條碼區域。 移動到區域選項卡並選擇條碼以獲取識別。

右鍵單擊選中的區域並將其作為數據複製,然後將其保存到文字處理文件中以查看數據。

Iris & IronOCR 軟體比較:圖 19

在這種情況下,Iris OCR 軟體無法檢測到圖片中條碼後的隱藏文字。

3. PDF 到文字

3.1. 使用 IronOCR

用於閱讀 PDF 文件與 IronOCR 讀取圖像一樣簡單。 您只需要將圖像讀取代碼中的AddImage方法更改為AddPdf。 代碼如下:

var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
' Using statement for resource management
Using Input = New OcrInput()
	' Add the PDF file to be processed
	Input.AddPdf("test-files/example.pdf")
	' Get the OCR results
	Dim Result = OCR.Read(Input)
	' Output the extracted text
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel
輸出

提取出的文本其格式與 PDF 文件相同。

Iris & IronOCR 軟體比較:圖 20

3.2. 使用 Iris OCR

使用 Iris 軟體閱讀 PDF 文件也非常容易。 它支持所有數位格式,PDF 就是其中之一。 您還可以使用 Iris OCR 軟體製作可搜索的格式。 PDF 是紙質文件,每個頁面都被當作單獨的圖像文件處理。使用“文件”選項打開紙質文件。 選擇要提取文本的頁面範圍,然後從給出的選項中將其保存為任何所需的可編輯格式。

Iris & IronOCR 軟體比較:圖 21

輸出

Iris & IronOCR 軟體比較:圖 22

許可

IronOCR 在開發目的下是免費的,但需要獲得商業用途的許可。 它還提供免費試用,讓您測試其所有潛力。 輕版包從 $799 起步,並提供 30 天退款保證。 IronOCR 提供 1 年免費產品支持和更新,然後之後每年 $399。 所有許可都是永久的,意味著僅需一次性購買,並且沒有隱藏費用。 您還可以選擇 SaaS 和 OEM 產品的免版稅再分發覆蓋,只需一次性購買 $1999。 有關許可包和價格計劃的更多信息,請訪問這裡

Iris & IronOCR 軟體比較:圖 23

Iris 是一款 OCR 解決方案,提供 10 天免費版作為試用。 其專業版從 $99 起,企業版從 $199 起。要在生產模式下使用其 SDK,我們需要從他們的銷售代表那裡獲取報價。如果您想要為 C# 或任何其他語言開發授權,請從這裡獲取報價。 更多有關專業版和企業版的比較信息,請查看這裡

Iris & IronOCR 軟體比較:圖 24

結論

Iris & IronOCR 軟體比較:圖 25

IronOCR 為 C# 開發者提供了我們所知的最先進的 Tesseract API,適用於任何平台。 IronOCR 可以部署在 Windows、Linux、Mac、Azure、AWS 和 Lambda 上,並支持_.NET Framework項目以及.NET Standard.NET Core_。 我們還可以在 OCR 掃描中讀取條碼,甚至可以將我們的 OCR 導出為 HTML 和可搜索的 PDF。

Iris OCR 軟體內建有 AI 功能,兼容於 Windows 和 Mac。 其 SDK 已經可用於多個編程語言。 Iris Pro 配備了用於 Windows 和 Mac 的 GUI 應用程序的 Iris OCR SDK 的功能。 您可以從圖像、PDF 中讀取文本,並以其他格式輸出。 您還可以使用 Iris 軟體自定義所有紙張文件,只需幾次點擊。

AWS Textract 許可證是基於所處理文檔頁數的,用於提取信息和分析數據。 Iris OCR 的開發許可未在其網站上發布。您必須請求報價以獲取許可信息。 此外,IronOCR 的許可是一次性購買的,並且可以終身使用。

總體而言,這兩種軟體均提供幾乎所有帶有 AI 技術的 OCR 功能,但 IronOCR 相對於 Iris OCR 具有輕微優勢。 在速度、準確性和整體性能方面,IronOCR 在生產環境中表現更佳。 它僅需幾行代碼即可製作高級文本識別應用。 API 文件也可提供全天候的使用,這使得開發者喜愛該庫,並將其作為 OCR 解決方案的首選。 您可以使用免費試用版測試其全部功能。

現在,您可以購買 5 個 Iron 產品,只需支付 2 個產品的價格。詳情可訪問此鏈接

這裡下載 IronOCR 並試試看。

[{i:(Iris OCR 軟體是其註冊所有者的註冊商標。 本網站與 Iris OCR 軟體無關,未經 Iris OCR 軟體支持或認可。 所有產品名稱、徽標和品牌均為其各自所有者的財產。 比較僅供參考,反映撰寫時公開可用的信息。

常見問題解答

如何使用OCR在C#中將圖片轉換為文本?

你可以使用IronOCR的Read方法將影像檔案轉換為機器可讀的文本。它支持多種影像格式和超過125種語言。

IronOCR程式庫支持哪些語言?

IronOCR支持超過125種語言,提供廣泛的國際語言相容性,用於文本和條碼識別。

如何提高圖片質量以獲得更好的OCR結果?

IronOCR包含內建的影像增強工具,自動調整圖片的對比度、亮度和解析度,以改進OCR的準確性。

IronOCR支持哪些輸出格式?

IronOCR可以以多種格式輸出文本,包括純文本、PDF和像XML和JSON這樣的結構化數據格式。

我可以在購買之前試用IronOCR嗎?

可以,IronOCR提供免費試用版本,讓開發者在購買商業許可證之前評估其功能和性能。

IronOCR的許可證如何運作?

IronOCR提供簡單的授權模型,允許一次性購買基於開發者的永久性許可證,包括企業使用選項。

IronOCR適合生產環境嗎?

IronOCR因其速度、高精度、易於整合和強大的開發者支持而被高度推薦用於生產環境。

IronOCR如何處理條碼和QR碼掃描?

IronOCR可以使用其內建的ReadBarCodes功能從影像中掃描條碼和QR碼,這可以在配置設定中啟用。

IronOCR與Iris OCR軟體的主要區別是什麼?

儘管兩者都提供強大的OCR功能,IronOCR因其易用性、豐富的文檔和簡單的授權而著稱。相比之下,Iris OCR以其速度、精確度和模組化設計而聞名,但需聯繫銷售代表以獲取授權詳情。

IronOCR可以與.NET Core和.NET Standard集成嗎?

可以,IronOCR完全支持.NET Core和.NET Standard,實現跨現代開發環境的無縫整合。

Kannaopat Udonpant
軟體工程師
在成為软件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人实验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因为他直接向编写大部分 IronPDF 使用的代码的开发者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代码或文档时,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。