跳過到頁腳內容
與其他組件的比較

Iris & IronOCR 間的 OCR 軟體比較

OCR(光學字元辨識)技術可以偵測數位檔案中的文字。 電腦總是將掃描的紙本檔案儲存為影像檔案。 這些圖像檔案中的資料無法使用普通文字編輯器甚至文字處理應用程式進行搜尋、編輯或以文字格式儲存。 OCR 處理有助於將這些圖像轉換為機器可讀文本,以便使用者進行進一步處理。

在當今時代,透過網路分享的文件都是數位格式,而且大多是 PDF 或影像格式。 網路上有很多資源可以將圖像轉換為文字。 然而,大多數企業都需要在其軟體應用程式中具備這種功能。 考慮到這一點,有許多函式庫提供可嵌入軟體應用程式的 OCR 解決方案。

本文將比較兩種最受歡迎的 C# OCR 技術:

  • IronOCR
  • Iris OCR 軟體

IronOCR。

IronOCR for .NET 是一個 C# 函式庫,用於掃描、搜尋和讀取影像和 PDF 檔案。 它以圖像或 PDF 文件作為輸入,並使用最新的 Tesseract 5 自訂 .NET OCR 引擎輸出文字、結構化資料或可搜尋的 PDF 文件。 其 Tesseract 提供 125 多種語言版本,並支援 .NET Core、Standard 2.0 到 7 的跨平台版本。

IronOCR 是一個用戶友好的 API,允許 C# 開發人員透過簡單地使用IronTesseract類別自動將圖像轉換為文字。 它優先考慮速度、準確性和易用性。 它還可以幫助電腦視覺 API 使用一組訓練好的模型來尋找文字。

IronOCR 的另一個強大功能是它可以掃描所有圖像檔案中的條碼和二維碼,並讀取其中的文字。 IronOCR的其他重要功能如下所示。

特點

  • 支援 125 種以上國際語言和自訂語言,效能高、速度快、品質好。 *文字和條碼讀取:*一次讀取多種語言的文字和數字。 專業文件:專門讀取收據、支票、發票中的文字。 可讀取多種格式:影像(PNG、JPG、GIF、TIFF、BMP)、 System.Drawing物件、串流和 PDF 文件(最佳化目標 DPI)。 濾鏡:**濾鏡精靈、影像校正、修復影像方向、修復影像顏色。 *簡單資料輸出: .NET 文字字串、條碼和二維碼資料、圖像。

虹膜OCR軟體

Iris OCR SDK是一個模組化軟體工具包,可讓您的應用程式將影像文字轉換為可編輯文件,並提供其他文字辨識服務。 它是速度最快、效能最高、準確率最高的專業OCR軟體。 虹膜辨識技術結合了最先進的光學字元辨識技術,包括最先進的掃描、基於人工智慧的文件分類、資料完整性和資料擷取。

Iris OCR 是一款功能豐富的 SDK,還提供強大的影像清理工具,用於影像增強。 它可以輕鬆與 C++、C#、J# 和 VB.NET 軟體應用程式整合。 IrisOCR 提供長期支持,並設計為跨平台使用。 它還支援 OEM 和 SaaS 應用。 Iris OCR 為企業提供價格靈活的全球化解決方案。

特點

*輸入格式:*圖像(JPG、PNG、BMP、TIFF)、PDF(圖像、文字)。 預處理:影像增強、形狀清理、透視校正、品質評估。 文字辨識:辨識 137 種以上不同語言的文字(歐洲、亞洲、中東、特定形式)。 條碼辨識:**一維與二維條碼辨識(PDF417、QR碼、Code 39、UPC等)。 *輸出格式: Office(DOCX、XLSX、PPT、RTF)、PDF(圖像或可搜尋的 PDF)、圖像格式(JPG、PNG、BMP、TIFF)、HTML、XML、TXT。

安裝

建立 Visual Studio 項目

在本教學中,我們將使用 Visual Studio 2022 最新版本。 所以,我假設您已經下載並安裝了 C# 版本。 如果沒有,您可以從Visual Studio 網站下載。

現在,我們需要建立一個控制台專案來開始使用這兩個庫。 請依照以下步驟建立專案:

安裝 IronOCR

安裝 IronOCR 庫有多種方法。

1. 使用 Visual Studio NuGet 套件管理器

NuGet 是用於下載和安裝專案相依性的套件管理器。 它的軟體包包含已編譯的程式碼(DLL)和清單檔案。可以使用以下方法存取它:

點選"工具"標籤。

或者,右鍵單擊"解決方案資源管理器"。

現在,NuGet 套件管理器視窗將會開啟。 瀏覽並選擇 IronOCR,然後點選安裝。

Iris 與 IronOCR OCR 軟體比較:圖 7

2. 從 NuGet 網站下載

可以直接從 NuGet 官方網站下載。

  1. 造訪NuGet 網站
  2. 點選頁面右側的下載包選項。
  3. 開啟下載的軟體包,它將開始安裝。
  4. 最後,重新載入解決方案,就完成了。

3. 使用 IronOCR 網頁下載

只需造訪 Iron Software 網站,然後導航至 IronOCR for the .NET 網頁即可。 捲動到頁面底部,點擊"下載 DLL"或"下載 Windows 安裝程式"。

Iris 與 IronOCR OCR 軟體比較:圖 8

已下載一個壓縮檔。 提取專案檔案或執行 Windows 安裝程式。 請按照以下步驟將其新增至您的專案。

  1. 在 Visual Studio 的解決方案資源管理器中,以滑鼠右鍵按一下專案的依賴項。
  2. 然後,選擇"新增項目參考"選項。
  3. 瀏覽已下載的 DLL 檔案所在位置。
  4. 最後,按一下"確定"以新增項目參考。

4. 在 Visual Studio 中使用命令提示符

  1. 在 Visual Studio 中,導覽至"工具"標籤。
  2. 擴充 NuGet 套件管理器選項。
  3. 選擇"套件管理員控制台",然後輸入以下命令:

    Install-Package IronOcr

這將自動下載 IronOCR 並將其安裝到您的專案中。

5. 加入必要的 IronOCR 命名空間

只需要一個命名空間,需要將其添加到我們需要存取其函數的原始程式碼檔案的頂部。

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

現在,我們已準備好在專案中使用 IronOCR。

安裝 Iris OCR

虹膜OCR有很多用途。 如果您正在尋找適用於小型企業或辦公室的解決方案,可以使用OCR應用程式。該軟體可從此鏈接下載。

如果您正在尋找中大型企業解決方案,那麼您需要聯絡 Iris 團隊,根據您的需求取得報價。 SDK 和其他文件僅供註冊客戶使用。 要在開發環境中使用 SDK,您需要使用此表單申請存取權限。

這裡我們將使用 Iris 17 OCR 軟體進行比較。 它提供了所有基本功能,可以與 IronOCR 進行比較。 以下步驟將協助您下載並安裝 Iris OCR 軟體:

  1. 軟體下載完成後,請雙擊開啟安裝精靈。

    Iris 與 IronOCR OCR 軟體比較:圖 9

  2. 點選下一步,選擇安裝模式。
  3. 接下來,選擇你想閱讀文本的語言。

    Iris 與 IronOCR OCR 軟體比較:圖 10

  4. 點選下一步並安裝 Iris OCR。

    Iris 與 IronOCR OCR 軟體比較:圖 11

  5. 現在軟體將開始安裝。 安裝完成後,點選完成並開啟 Iris OCR 軟體。

    Iris 與 IronOCR OCR 軟體比較:圖 12

全部完成! 現在讓我們進入比較環節。

比較

1. 圖片轉文字

從影像中讀取資料是一項相當繁瑣的任務。 影像解析度和品質在提取內容時起著重要作用。 這兩個庫都提供光學字元辨識功能,可以從圖像中提取文字。

1.1. 使用 IronOCR

IronOCR 憑藉其強大的IronTessaract類,使開發人員能夠非常輕鬆地讀取影像檔案的內容。 這裡我們將使用PNG圖像從圖像檔案讀取文本,程式碼如下:

var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
' We use a using statement to ensure resources are freed after use
Using Input = New OcrInput()
	' Add the image from which you want to extract text
	Input.AddImage("test-files/employmentapp.png")
	' Perform OCR to read the text
	Dim Result = OCR.Read(Input)
	' Output the extracted text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel
輸入影像

Iris 與 IronOCR 的 OCR 軟體比較:圖 13

輸出

Iris 和 IronOCR OCR 軟體比較:圖 14 - 影像輸出

IronOCR 的輸出結果與輸入的原始影像完全一致。 程式碼簡潔易懂,沒有任何技術細節。

1.2. 使用虹膜OCR

Iris OCR 軟體可以掃描所有紙本文件並用於文字辨識。 使用Iris OCR技術提取文字非常簡單。 從"主頁"選單標籤中的"從檔案"選擇圖像檔案。 使用同一張圖片來測試和比較兩個軟體的輸出結果。

Iris 與 IronOCR OCR 軟體比較:圖 15

您可以對上傳的圖片進行影像校正。 在輸出檔案標籤中,您可以選擇任何格式作為輸出格式。 它提供多種輸出格式,例如 Word、Excel、PDF、文字檔案等。只需將文件儲存為任意格式,然後開啟即可查看提取的文字。

輸出

Iris 與 IronOCR OCR 軟體比較:圖 16

你可以看出這兩個軟體的輸出結果有明顯的差異。 IronOCR 從圖像中提取了完整的文字及其格式。 然而,Iris OCR 雖然保留了格式,但姓名和電話號碼卻全部亂碼了。

2. 條碼和二維碼轉文本

2.1. 使用 IronOCR

IronOCR 在讀取影像時提供了一個獨特且有用的功能,即它可以讀取條碼和二維碼。 它可以輕鬆檢測條碼並顯示其值。

為此,請將讀取條碼配置設為 true,然後遍歷 OCR 結果中的每個條碼。 條碼讀取代碼如下:

var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Dim OCR = New IronTesseract()
OCR.Configuration.ReadBarCodes = True
' Using statement to automatically dispose of resources
Using input = New OcrInput()
	' Add the image to be processed
	input.AddImage("test-files/Barcode.png")
	' Read the OCR result
	Dim Result = OCR.Read(input)
	' Iterate through the barcodes detected and display their values
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
$vbLabelText   $csharpLabel
輸入影像

Iris 與 IronOCR OCR 軟體比較:圖 17

輸出

Iris 與 IronOCR OCR 軟體比較:圖 18

輸入圖像中的所有三個條碼均已成功讀取,並且其隱藏文字已顯示出來。

2.2. 使用虹膜OCR

Iris OCR 還提供了從圖像或 PDF 文件中提取條碼資料的功能。 但是對於條碼,我們必須手動選擇要偵測的條碼區域。 切換到區域選項卡,然後選擇要識別的條碼。

右鍵單擊選定區域並將其複製為數據,然後將其儲存到文字處理文件中以查看數據。

Iris 與 IronOCR OCR 軟體比較:圖 19

在這種情況下,Iris OCR 軟體無法偵測到圖片中條碼後面的隱藏文字。

3. PDF 轉文本

3.1. 使用 IronOCR

在 IronOCR 中,閱讀 PDF 文件就像閱讀圖像一樣簡單。 您只需在映像讀取程式碼中將AddImage方法變更為AddPdf即可。 代碼如下:

var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
' Using statement for resource management
Using Input = New OcrInput()
	' Add the PDF file to be processed
	Input.AddPdf("test-files/example.pdf")
	' Get the OCR results
	Dim Result = OCR.Read(Input)
	' Output the extracted text
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel
輸出

擷取的文字格式與 PDF 檔案格式相同。

Iris 與 IronOCR OCR 軟體比較:圖 20

3.2. 使用虹膜OCR

使用 Iris 軟體閱讀 PDF 檔案也非常容易。 它支援所有數字格式,PDF 就是其中之一。 您也可以使用 Iris OCR 軟體建立可搜尋格式。 PDF 文件本質上是紙本文檔,每一頁都被視為單獨的圖像文件。使用"從文件開啟"選項開啟紙本文件。 選擇要從中提取文字的頁面範圍,並從給定的選項中選擇任意可編輯格式儲存。

Iris 與 IronOCR OCR 軟體比較:圖 21

輸出

Iris 與 IronOCR OCR 軟體比較:圖 22

授權

IronOCR 可免費用於開發目的,但商業用途需要獲得許可。 它還提供免費試用,讓您測試其所有功能是否符合您的需求。 精簡版套餐起價為$799 ,並提供 30 天退款保證。 IronOCR 提供 1 年免費產品支援和更新,之後每年收費 399 美元。 所有許可證均為永久有效,這意味著只需一次性購買,沒有任何隱藏費用。 您還可以選擇為 SaaS 和 OEM 產品提供免版稅再分發保障,只需一次性支付 1999 美元。 有關許可套餐和定價方案的更多信息,請訪問此處

Iris 與 IronOCR OCR 軟體比較:圖 23

Iris 是一款 OCR 解決方案,提供 10 天免費試用版。 其專業版起價為 99 美元,企業版起價為 199 美元。要在生產環境中使用其 SDK,我們需要聯絡其銷售代表以取得報價。如果您想獲得 C# 或其他語言開發的許可,請點擊此處以取得報價。 您可以在這裡查看更多資訊以及專業版和企業版之間的比較。

Iris 與 IronOCR OCR 軟體比較:圖 24

結論

Iris 與 IronOCR OCR 軟體比較:圖 25

IronOCR 為 C# 開發人員提供我們所知的最先進的 Tesseract API,可在任何平台上使用。 IronOCR 可部署在 Windows、Linux、Mac、Azure、AWS 和 Lambda 上,並支援 .NET Framework 專案以及 .NET Standard 和 .NET Core 專案。 我們還可以讀取 OCR 掃描中的條碼,甚至可以將 OCR 匯出為 HTML 和可搜尋的 PDF。

Iris OCR 軟體內建人工智慧功能,相容於 Windows 和 Mac 系統。 它的SDK支援多種程式語言。 Iris Pro 具備 Iris OCR SDK for Windows 和 Mac 的功能,並以 GUI 應用程式的形式呈現。 您可以讀取圖像和 PDF 中的文本,並將其輸出為其他格式。 您也可以使用 Iris 軟體,只需點擊幾下即可自訂所有紙本文件。

IronOCR 許可證是基於開發者的,這意味著您應該始終根據將使用該產品的開發者數量購買許可證。 Iris OCR 開發許可協議並未在 Iris 網站上公佈。您需要聯絡 Iris 索取報價以取得許可資訊。 此外,IronOCR 許可證是一次性購買,可以終身使用。

總體而言,這兩款軟體都提供了幾乎所有 OCR 功能以及 AI 技術,但 IronOCR 比 Iris OCR 略勝一籌。 就速度、準確性和整體效能而言,IronOCR 在生產環境中表現更佳。 它僅使用幾行程式碼即可建立一個高級文字識別應用程式。 API 文件也全天候可用,這使得開發人員喜歡這個庫,並使其成為 OCR 解決方案的首選。 您可以免費試用其全部功能。

現在,您可以以 2 件商品的價格購買 5 件鐵製品。欲了解更多信息,請訪問此鏈接

這裡下載 IronOCR 並試試看。

請注意Iris OCR 軟體是其各自所有者的註冊商標。 本網站與 Iris OCR 軟體公司沒有任何關聯,也未獲得其認可或贊助。 所有產品名稱、標誌和品牌均為其各自擁有者的財產。 比較資料僅供參考,並反映撰寫時的公開資訊。

常見問題解答

如何在 C# 中使用 OCR 將影像轉換為文字?

您可以在影像檔案上使用 IronOCR 的 Read 方法,將影像檔案轉換為機器可讀的文字。它支援多種影像格式和超過 125 種語言。

IronOCR 函式庫支援哪些語言?

IronOCR 支援超過 125 種語言,為文字和 BarCode 識別提供廣泛的國際語言相容性。

如何增強影像品質以獲得更好的 OCR 效果?

IronOCR 包括內建的影像增強工具,可自動調整影像的對比、亮度和解析度,以提高 OCR 的精確度。

IronOCR 支援哪些輸出格式?

IronOCR 可以輸出各種格式的文字,包括純文字、PDF 以及 XML 和 JSON 等結構化資料格式。

在購買之前,我可以試用 IronOCR 嗎?

是的,IronOCR 提供免費試用版本,讓開發人員在購買商業授權之前,可以評估其功能和效能。

IronOCR 的授權如何運作?

IronOCR 提供直接的授權模式,以開發人員為基礎的永久授權可供一次性購買,包括企業使用的選項。

IronOCR 適用於生產環境嗎?

IronOCR 因其速度快、準確性高、易於整合以及強大的開發人員支援,被強烈推薦用於生產環境。

IronOCR 如何處理條碼和 QR 掃描?

IronOCR 可以使用其內建的 ReadBarCode 功能掃描圖片上的條碼和 QR 碼,您可以在組態設定中啟用此功能。

IronOCR 與 Iris OCR 軟體的主要差異為何?

雖然兩者都提供強大的 OCR 功能,但 IronOCR 以其易用性、詳盡的文件和直接的授權而著稱。相比之下,Iris OCR 以其速度、準確性和模組化設計著稱,但需要聯絡銷售代表以瞭解授權細節。

IronOCR 可以與 .NET Core 和 .NET Standard 整合嗎?

是的,IronOCR 與 .NET Core 和 .NET Standard 完全相容,可在現代開發環境中實現無縫整合。

Kannaopat Udonpant
軟體工程師
在成為软件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人实验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因为他直接向编写大部分 IronPDF 使用的代码的开发者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代码或文档时,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。