與其他組件比較

Iris 與 IronOCR 的 OCR 軟體比較

發佈 2023年5月16日
分享:

光學字符識別 (OCR) 允許在數位文件中檢測到文字。電腦會將掃描的紙質文件保存為圖像文件。這些圖像文件中的數據不能使用普通的文字編輯器或即使使用文字處理軟件進行搜索、編輯或保存為文字格式。OCR 處理有助於將這些圖像轉換為機器可讀的文字,以便用戶進一步處理。

在這個現代時代,通過互聯網共享的文件是數字格式的,大部分是 PDF 或圖像格式。有許多在線資源可以將圖像轉換為文字。然而,多數企業需要在其軟件應用中實現此功能。考慮到這一點,有許多提供可以嵌入在軟件應用中的 OCR 解決方案的庫。

在本文中,我們將比較兩種最受歡迎的 C# OCR 技術:

  • IronOCR
  • Iris OCR 軟件

介紹

IronOCR

IronOCR IronOCR for .NET 是一個用於掃描、搜索和讀取圖像及 PDF 的 C# 庫。它以圖像或 PDF 文件作為輸入,並使用最新的 Tesseract 5 自定義構建的 .NET OCR 引擎來輸出文字、結構化數據或可搜索的 PDF 文件。其 Tesseract 支持 125 多種語言,並在 .NET Core、Standard 的跨平台支持下,從 2.0 一直到 7。

IronOCR 是一個用戶友好的 API,允許 C# 開發人員僅使用 IronTesseract 類自動將圖像轉換為文字。它優先考慮速度、準確性和易用性。它還有助於計算機視覺 API 使用訓練模型集來查找文字。

IronOCR 另一個強大的功能是它可以掃描所有圖像文件中的條形碼和 QR 碼並讀取其文字。IronOCR 的其他重要功能如下所示。

功能

  • 國際語言: 支援超過125種語言及自訂語言,並具有高效能與快速性能
  • 文字與條碼讀取: 同時讀取多種語言的文字和數字
  • 專業文件: 專門讀取收據、支票、發票上的文字
  • 多種格式讀取: 圖片 (PNG、JPG、GIF、TIFF、BMP), System.Drawing 對象、流和 PDF 文件 (最佳化目標DPI)
  • 過濾器:過濾嚮導、影像校正、校正影像方向、校正影像顏色
  • 簡單數據輸出:.NET文字字符串、條碼和QR數據、影像

Iris OCR 軟體

Iris OCR SDK 是一個模組化的軟體工具包,能夠使您的應用程式將圖像文字轉換為可編輯檔案,並提供其他文字識別服務。它是速度最快的專業OCR,具有高效能和精確性。使用虹膜識別技術,您可以獲得最先進的光學字符識別技術,其中包括最先進的掃描、基於AI的文件分類、數據完整性和數據提取。

IrisOCR 是一個功能豐富的SDK,還提供強大的圖像清理工具以增強圖像。它可以輕鬆整合到 C++、C#、J# 和 VB.NET 軟體應用程式中。IrisOCR 提供長期支援,並設計為跨平台使用,還支援 OEM 和 SaaS 應用程式。IrisOCR 以靈活的價格為企業提供全球解決方案。

功能

  • 輸入格式: 圖像 (JPG, PNG, BMP, TIFF),PDF (圖像,文本)
  • 預處理: 圖像增強、表格清理、透視校正、品質評估
  • 文字識別: 識別超過137種不同語言的文字 (歐洲,亞洲,中東,特定表單)
  • 條碼識別: 1D 和 2D 条码识别 (PDF417、QR code、Code 39、UPC等。)
  • 輸出格式: Office (DOCX, XLSX, PPT, RTF),PDF (圖片或可搜尋的PDF), 圖像格式 (JPG, PNG, BMP, TIFF), HTML, XML, TXT

安裝

建立 Visual Studio 專案

在這個教程中,我們將使用最新版本的 Visual Studio 2022。因此,我假設你已經為 C# 下載並安裝了它。如果沒有,你可以從 Visual Studio 網站現在,我們需要建立一個控制台專案來開始使用這兩個函式庫。請按照以下步驟建立專案:

  • 打開你的 Visual Studio 2022。
  • 點擊「建立新專案」。

    Iris 與 IronOCR 的 OCR 軟體比較:圖 1

  • 從給定的選項中選擇 C# 主控台應用程式,然後點擊下一步

    Iris與IronOCR的OCR軟體比較:圖2

為您的新專案設定名稱和位置。例如 "OCRProject"。

![Iris與IronOCR的光學字符識別(OCR)軟體比較:圖3](/static-assets/ocr/blog/ocr-software-by-iris-alternatives/ocr-software-by-iris-alternatives-3.webp)
  • 如需更多信息,請選擇 .NET 6.0 框架,因為它是最穩定的版本。

    Iris 與 IronOCR OCR 軟體比較:圖 4

  • 現在,點擊「建立」並且專案將會在您指定的位置中建立。

安裝 IronOCR

有多種方法可以安裝 IronOCR 庫。

1. 使用 Visual Studio NuGet 套件管理器

NuGet 是用於在您的專案中下載和安裝相依性的套件管理器。它的套件包含編譯後的程式碼 (DLL) 並且題示檔案。請使用以下方法存取:

  • 點擊工具標籤
  • 展開 NuGet 套件管理員選項
  • 點擊管理解決方案的 NuGet 套件

    Iris 與 IronOCR OCR 軟體比較:圖 5

  • 或者,右鍵點擊方案總管
  • 點擊管理 NuGet 套件

    Iris 與 IronOCR 軟體之間的 OCR 比較:圖6

現在,NuGet 套件管理器視窗將會打開。瀏覽 IronOCR 並點擊安裝。

IRIS與IronOCR軟體之間的比較:圖7

2. 從 NuGet 網站下載

可以直接從 NuGet 官方網站下載。

  1. 點擊連結:""。

  2. 點擊頁面右側的下載包選項。

  3. 打開下載的包後會開始安裝。

  4. 最後,重新載入解決方案,完成。

3. 透過 IronOCR 網頁下載

只需訪問 Iron Software 官網,並導航至 IronOCR for .NET 網頁。滾動至頁面底部,點擊下載 DLL 或下載 Windows 安裝程式。

Iris 與 IronOCR OCR 軟體的比較:圖 8

下載壓縮檔。解壓縮您的專案檔案或執行 Windows 安裝程式。請按照以下步驟將其新增到您的專案中。

  1. 在 Visual Studio 的方案總管中,右鍵點擊專案的相依性。

  2. 然後,選擇“新增專案參考”選項。

  3. 瀏覽下載的 DLL 檔案位置。

  4. 最後,點擊“確定”以新增專案參考。

4. 在 Visual Studio 中使用命令提示符

  1. 瀏覽到 Visual Studio 中的工具選項卡。
  2. 展開 NuGet 套件管理器選項。
  3. 選擇套件管理器控制台並輸入以下命令:
    Install-Package IronOcr

這將自動下載並安裝 IronOCR 在您的專案中。

5. 添加必要的 IronOCR 命名空間

只需添加一個命名空間,並將其添加到需要訪問其功能的源代碼文件的頂部。

using IronOcr;
using IronOcr;
Imports IronOcr
VB   C#

現在,我們已準備好在項目中使用IronOCR。

安裝 Iris OCR

有許多方法可以使用 Iris OCR。如果您正在尋找適合小型企業或辦公室的解決方案,可以使用 OCR 應用程式。這套軟體可以從這裡下載 連結如果您正在尋找中大型企業解決方案,則需要聯繫Iris團隊獲取根據您的需求提供的報價。SDK和其他文檔僅適用於註冊用戶。要在開發環境中使用SDK,您需要使用此請求訪問權限。 格式在這裡我們將使用 Iris 17 OCR 軟體作為比較用途。它在基本層級提供所有功能,可以用來與 IronOCR 進行比較。以下步驟將幫助您下載和安裝 Iris OCR 軟體:

  1. 下載軟體後,雙擊打開設置嚮導。

    Iris與IronOCR光學字元識別軟體比較:圖9

  2. 點擊下一步並選擇安裝模式。

  3. 接著,選擇你希望讀取文本的語言。

    Iris 與 IronOCR 軟體之間的 OCR 軟體比較:圖 10

  4. 點擊下一步並安裝 Iris OCR

    Iris 與 IronOCR 軟體的比較:圖11

  5. 現在軟體將開始安裝。安裝後,點擊完成並打開 Iris OCR 軟體。

    Iris與IronOCR的OCR軟體比較:圖12

一切完成! 現在讓我們進入比較本身。

比較

1. 圖片轉文字

從圖片讀取數據是一項相當繁瑣的任務。圖片的解析度和質量在擷取內容時起著重要作用。這兩個程式庫都提供了光學字符識別功能來從圖片中提取文字。

1.1. 使用 IronOCR

IronOCR 使用其強大的 IronTessaract 類使開發人員能夠非常輕鬆地讀取圖像文件的內容。這裡我們將使用一個 PNG 圖像來 從圖像文件讀取文本 以及程式碼如下:


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddImage("test-files/employmentapp.png");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }

    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddImage("test-files/employmentapp.png");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }
Dim OCR = New IronTesseract()
	Using Input = New OcrInput()
		Input.AddImage("test-files/employmentapp.png")
		Dim Result = OCR.Read(Input)
		Console.WriteLine(Result.Text)
	End Using
VB   C#
輸入圖像

Iris和IronOCR之間的OCR軟體比較:圖13

輸出

Iris 與 IronOCR 的 OCR 軟體比較:圖 14 - 圖像輸出

IronOCR 的輸出與提供給它的原始圖像相匹配。代碼簡潔且易於理解,沒有任何技術性問題。

1.2. 使用 Iris OCR

Iris OCR 軟體允許掃描所有紙質文件並用於文字識別。使用 Iris OCR 技術進行文字提取非常簡單。在主選單標籤的“From File”中選擇一個圖像文件。相同的圖像被用來測試和比較兩個軟體的輸出。

Iris與IronOCR的OCR軟體比較:圖15

您可以對上傳的圖片進行圖像校正。在輸出文件標籤中,您可以選擇任何格式作為輸出。它提供多種輸出格式,如Word、Excel、PDF、文本文件等。只需將文件以任何格式保存並打開以查看提取的文本。

輸出

Iris 與 IronOCR 的 OCR 軟體比較:圖16

您可以看到,這兩款軟體的輸出有明顯的差異。IronOCR 準確地從圖片中提取了文本和格式。然而,Iris OCR 雖然保留了格式,但全名和電話號碼卻被弄亂了。

條碼和二維碼轉文本

2.1. 使用 IronOCR

IronOCR 在讀取圖像時提供了一個獨特且有用的功能,即它可以讀取條碼和 QR 碼。它可以輕鬆地檢測條碼並顯示其值。

要實現此功能,請將讀取條碼配置設置為 true,然後遍歷 OCR 結果中的每個條碼。讀取條碼的代碼如下所示:


    var OCR = new IronTesseract();
    OCR.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput()){   
        input.AddImage("test-files/Barcode.png");   
        var Result = OCR.Read(input);   
        foreach (var Barcode in Result.Barcodes){
                Console.WriteLine(Barcode.Value);
        }
    }

    var OCR = new IronTesseract();
    OCR.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput()){   
        input.AddImage("test-files/Barcode.png");   
        var Result = OCR.Read(input);   
        foreach (var Barcode in Result.Barcodes){
                Console.WriteLine(Barcode.Value);
        }
    }
Dim OCR = New IronTesseract()
	OCR.Configuration.ReadBarCodes = True
	Using input = New OcrInput()
		input.AddImage("test-files/Barcode.png")
		Dim Result = OCR.Read(input)
		For Each Barcode In Result.Barcodes
				Console.WriteLine(Barcode.Value)
		Next Barcode
	End Using
VB   C#
輸入圖像

Iris OCR 軟體與 IronOCR 的比較:圖 17

輸出

Iris 與 IronOCR 的 OCR 軟體比較:圖 18

輸入圖像中的三個條碼都被成功讀取,並顯示其隱藏的文字。

2.2. 使用 Iris OCR

Iris OCR 也提供從圖像或 PDF 文件中提取條碼數據的功能。然而,對於條碼,我們必須手動選擇要檢測的條碼區域。移動到區域選項卡並選擇要識別的條碼。

右鍵點擊選定的區域並將其作為數據複製,然後將其保存到文字處理文件中以查看數據。

Iris OCR軟件與IronOCR之間的比較:圖19

在這種情況下,Iris OCR 軟體無法檢測到圖片中條碼後面的隱藏文字。

3. PDF 轉文字

3.1. 使用 IronOCR

讀取 PDF 文件在 IronOCR 中就像讀取圖像文件一樣簡單。您只需要將圖像讀取代碼中的 AddImage 方法更改為 AddPDF。代碼如下所示:


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddPdf("test-files/example.pdf");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }

    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddPdf("test-files/example.pdf");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }
Dim OCR = New IronTesseract()
	Using Input = New OcrInput()
		Input.AddPdf("test-files/example.pdf")
		Dim Result = OCR.Read(Input)
		Console.WriteLine(Result.Text)
	End Using
VB   C#
輸出

提取的文本格式與 PDF 文件相同。

Iris 和 IronOCR 之間的 OCR 軟體比較:圖 20

3.2. 使用 Iris OCR

使用 Iris 軟體讀取 PDF 檔也是非常簡單的。它支援所有的數位格式,其中也包含 PDF。你也可以使用 Iris OCR 軟體製作可搜尋的格式。PDF 是一種紙本文件,且每一頁都被視為單獨的圖像檔。使用「From File」選項開啟紙本文件。選擇你想要提取文字的頁面範圍,並從提供的選項中將其儲存為任何可編輯的格式。

Iris 與 IronOCR 的 OCR 軟體比較:圖 21

輸出

Iris和IronOCR之間的OCR軟體比較:圖22

許可證

IronOCR 可免費用於開發用途,但商業使用需要獲得許可。它還提供免費試用來測試您所需的所有潛力。精簡版的套餐從 $749 起,有30天退款保證。IronOCR 提供1年的免費產品支持和更新,之後每年價格為 $399。所有許可證都是永久性的,意味著只需一次購買,且無隱藏費用。您還可以選擇無版稅的重分發覆蓋,用於 SaaS 和 OEM 產品,只需一次性購買 $1999。如需了解更多有關許可證套餐和定價計劃的信息,請訪問 這裡.

Iris 與 IronOCR 的 OCR 軟體比較:圖 23

Iris是一個提供10天免費試用版本的OCR解決方案。其專業版本起價為$99,企業版本起價為$199。要在生產模式中使用其SDK,我們需要從他們的銷售代表那裡獲取報價。如果您想為C#或任何其他語言開發進行授權,請從他們那裡獲取報價。 這裡更多信息和專業版與合作版的比較可以查看 這裡.

Iris 和 IronOCR 光學字符識別 (光學字符識別) 軟體比較:圖 24

結論

Iris 與 IronOCR 光學字符識別 (光學字符識別) 軟體比較:圖 25

IronOCR 提供 C# 開發人員我們所知最先進的平台無關 Tesseract API。IronOCR 可以在 Windows、Linux、Mac、Azure、AWS 和 Lambda 上部署,並支援 .NET Framework 專案以及 .NET Standard.NET Core。我們還可以在 OCR 掃描中讀取條碼,甚至將我們的 OCR 匯出為 HTML 和可搜尋的 PDF。

Iris OCR 軟體具有 AI 功能,與 Windows 和 Mac 相容。其 SDK 可供多種編程語言使用。Iris Pro 具有 Iris OCR SDK 的功能,適用於 Windows 和 Mac 作為 GUI 應用程式。您可以從圖像和 PDF 中讀取文本,並將其輸出為其他格式。您還可以使用 Iris 軟體自訂所有的紙質文件,只需幾下點擊即可完成。

IronOCR 授權是基於開發人員的,這意味著您應該根據將要使用該產品的開發人數量來購買授權。Iris OCR 開發許可不在 Iris 網站上發布。您必須請求報價以獲取授權資訊。此外,IronOCR 許可是一種一次性購買,可以終身使用。

總體而言,這兩種軟體都提供幾乎所有的 OCR 功能,並具有 AI 技術,但 IronOCR 在某些方面略勝一籌。在速度、準確性和整體性能方面,IronOCR 在生產環境中更優。它只需幾行代碼即可製作高層次的文本識別應用程式。API 文件也隨時可用,使開發人員喜愛這個庫,並使其在 OCR 解決方案中成為首選。您可以測試其全部功能,配有一 免費試用現在,您可以用兩個的價格購買五個Iron產品。欲了解更多資訊,請訪問此 連結從 下載 IronOCR 這裡 試試看。

< 上一頁
谷歌OCR與IronOCR之間的比較
下一個 >
IronOCR和Nanonets OCR的比較

準備開始了嗎? 版本: 2024.10 剛剛發布

免費 NuGet 下載 總下載次數: 2,433,305 查看許可證 >