與其他組件比較

Iris 與 IronOCR 的 OCR 軟體比較

發佈 2023年5月16日
分享:

光學文字辨識(OCR)允許在數位文件中偵測文字。 掃描的紙質文件總是由電腦保存為圖像文件。 這些圖像文件中的數據無法通過普通的文本編輯器甚至是文字處理應用程式進行搜索、編輯或以文本格式保存。 OCR 處理有助於將這些圖像轉換為機器可讀的文本,以便用戶進一步處理。

在這個現代時代,透過互聯網分享的文件是數位格式,且大多是PDF或圖像形式。 有許多在線資源可用於將圖像轉換為文字。 然而,大多數企業需要在其軟體應用程式中實現此功能。 考慮到這一點,有許多庫提供可嵌入軟體應用程式的光學字符識別(OCR)解決方案。

在本文中,我們將比較兩種最受歡迎的C# OCR技術:

  • IronOCR
  • Iris OCR 軟體

介紹

IronOCR

IronOCRfor .NET 是一個用於掃描、搜索和讀取影像及 PDF 的 C# 庫。 它以圖像或 PDF 文件作為輸入,使用最新的 Tesseract 5 自訂構建的 .NET OCR 引擎輸出文本、結構化數據或可搜索的 PDF 文件。 它的 Tesseract 支持 125 多種語言,並提供 .NET Core, Standard 的跨平台支持,版本從 2.0 到 7。

IronOCR 是一個用戶友好的 API,允許 C# 開發人員通過使用 IronTesseract 類簡單地自動將影像轉換為文字。 它優先考量速度、準確性和易用性。 它還協助計算機視覺API使用一組訓練好的模型來尋找文本。

IronOCR 的另一個強大功能是它可以從所有圖像文件中掃描條碼和 QR 碼並讀取其文本。 IronOCR 的其他重要功能如下所示。

功能

  • 國際語言: 支持 125+ 種語言及自定義語言,提供高質量和快速的性能表現
  • 文字和條碼識別: 同時從多種語言中讀取文字和數字
  • 專業文件: 專門從收據、支票、發票中讀取文本
  • 從多種格式中讀取: 圖像(PNG、JPG、GIF、TIFF、BMP), System.Drawing 對象、流和 PDF 文件(最佳化目標DPI)
  • 篩選器:篩選器精靈,影像校正,修正影像方向,修正影像顏色
  • 簡單數據輸出: .NET文字字串、Barcode和QR數據、圖像

Iris OCR 軟體

Iris OCR SDK是一個模組化軟體工具包,使您的應用程式能夠將圖像文本轉換為可編輯文件,並提供其他文本識別服務。 這是速度最快、性能卓越且準確率高的專業光學字符識別(OCR)。 透過虹膜識別技術,您可以獲得最先進的光學字符識別技術,包括最先進的掃描、基於人工智慧的文件分類、數據完整性和數據提取。

Iris OCR 是一個功能豐富的 SDK,還提供了強大的影像清理工具用於影像增強。 它可以輕鬆整合到 C++、C#、J# 和 VB.NET 軟體應用程式中。 IrisOCR 提供長期支援,並設計為可跨平台使用。 它還支援 OEM 和 SaaS 應用程序。 Iris OCR 透過彈性的價格為企業提供全球解決方案。

功能

  • 輸入格式: 圖像(JPG, PNG, BMP, TIFF),PDF(圖像,文本)
  • 預處理: 圖像增強、表格清理、透視校正、品質評估
  • 文字识别: 识别 137 种以上不同语言的文本(歐洲,亞洲,中東,特定表單)
  • 條碼識別: 一維和二維條碼識別(PDF417、QR code、Code 39、UPC等。)
  • 輸出格式: Office(DOCX, XLSX, PPT, RTF),PDF(圖片或可搜尋的PDF), 圖像格式(JPG, PNG, BMP, TIFF), HTML, XML, TXT

安裝

建立 Visual Studio 專案

在本教程中,我們將使用最新版本的 Visual Studio 2022。 所以,我假設你已經下載並安裝了 C#。 如果沒有,您可以從下載它Visual Studio 網站.

現在,我們需要建立一個控制台專案以開始使用這兩個庫。 按照以下步驟創建專案:

  • 打開您的 Visual Studio 2022。
  • 點擊建立新專案。

    Iris 與 IronOCR 的 OCR 軟體比較:圖 1

  • 從給定選項中選擇 C# 主控台應用程式,然後點擊下一步

    Iris與IronOCR的OCR軟體比較:圖2

  • 配置您的新專案名稱和位置。 例如「OCRProject」。

    Iris與IronOCR的光學字符識別(OCR)軟體比較:圖3

  • 如需更多信息,請選擇 .NET 6.0 Framework,因為它是最穩定的版本。

    Iris 與 IronOCR OCR 軟體比較:圖 4

  • 現在,點擊「建立」,專案將在您指定的位置創建。

安裝 IronOCR

有多種方法可以安裝IronOCR庫。

1. 使用 Visual Studio NuGet 套件管理器

NuGet 是一個用於在您的專案中下載和安裝相依項目的套件管理工具。 其套件包含編譯代碼(DLL)和清單檔案。使用以下方法存取它:

  • 單擊工具選項卡
  • 擴展 NuGet 套件管理器選項
  • 點選管理解決方案的 NuGet 套件

    Iris 與 IronOCR OCR 軟體比較:圖 5

  • 或者,右鍵點擊方案總管
  • 點擊管理 NuGet 套件

    Iris 與 IronOCR 軟體之間的 OCR 比較:圖6

    現在,NuGet 套件管理器視窗將會開啟。 瀏覽 IronOCR 並點擊安裝。

    IRIS與IronOCR軟體之間的比較:圖7

2. 從 NuGet 網站下載

可以直接從 NuGet 官方網站下載。

  1. 點擊連結:""。

  2. 點擊頁面右側的下載包選項。

  3. 打開下載的套件,它將開始安裝。

  4. 最後,重新載入解決方案,就完成了。

3. 使用 IronOCR 網頁下載

只需造訪 Iron Software 網站並導航至 IronOCR for .NET 網頁。 滾動到頁面底部並點擊下載 DLL 或下載 Windows 安裝程式。

Iris 與 IronOCR OCR 軟體的比較:圖 8

已下載壓縮檔。 提取您的專案檔案或運行Windows安裝程式。 按照以下步驟將其新增到您的專案。

  1. 在 Visual Studio 的方案總管中右鍵點擊專案的相依性。

  2. 然後,選擇選項新增專案參考。

  3. 瀏覽已下載的DLL文件位置。

  4. 最後,點擊「確定」以添加專案參考。

4. 在 Visual Studio 中使用命令提示字元

  1. 在 Visual Studio 中導航到工具選項卡。

  2. 擴展 NuGet 套件管理員選項。

  3. 選擇套件管理器主控台並輸入以下命令:
    Install-Package IronOcr

這將自動下載並安裝 IronOCR 在您的專案中。

5. 添加必要的 IronOCR 命名空間

只需一個命名空間,並需要在我們需要訪問其功能的源代碼文件的頂部添加。

using IronOcr;
using IronOcr;
Imports IronOcr
VB   C#

現在,我們已準備好在項目中使用IronOCR。

安裝 Iris OCR

Iris OCR 有許多使用方式。 如果您在尋找小型企業或辦公室解決方案,您可以使用這個OCR應用程式。軟體可以從這裡下載連結.

如果您正在尋找中大型企業解決方案,那麼您需要聯繫Iris團隊以根據您的需求獲取報價。 SDK 和其他文件僅提供給註冊客戶。 要在開發環境中使用 SDK,您需要使用此請求訪問權限格式.

在此,我們將使用 Iris 17 OCR 軟體進行比較。 它提供了所有基礎層級的功能,可用於與IronOCR進行比較。 以下步驟將有助於下載和安裝 Iris OCR 軟體:

  1. 下載軟體後,雙擊以開啟安裝精靈。

    Iris與IronOCR光學字元識別軟體比較:圖9

  2. 單擊下一步並選擇安裝模式。

  3. 接下來,選擇您想從中閱讀文本的語言

    Iris 與 IronOCR 軟體之間的 OCR 軟體比較:圖 10

  4. 點擊下一步並安裝 Iris OCR

    Iris 與 IronOCR 軟體的比較:圖11

  5. 現在軟體將開始安裝。 安裝完成後,點擊完成並打開 Iris OCR 軟體。

    Iris與IronOCR的OCR軟體比較:圖12

    一切完成! 現在讓我們繼續比較本身。

比較

1. 圖像轉文字

從圖像中讀取資料是一項相當繁瑣的任務。 圖像解析度和品質在提取內容時起著重要作用。 兩個庫都提供光學字符識別功能,用於從圖像中提取文本。

1.1. 使用 IronOCR

IronOCR 的強大 IronTessaract 類別使開發者能夠輕鬆讀取圖像文件的內容。 在這裡,我們將使用 PNG 圖片來從圖像文件讀取文本以及程式碼如下:


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddImage("test-files/employmentapp.png");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }

    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddImage("test-files/employmentapp.png");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }
Dim OCR = New IronTesseract()
	Using Input = New OcrInput()
		Input.AddImage("test-files/employmentapp.png")
		Dim Result = OCR.Read(Input)
		Console.WriteLine(Result.Text)
	End Using
VB   C#
輸入圖片

Iris和IronOCR之間的OCR軟體比較:圖13

輸出

Iris 與 IronOCR 的 OCR 軟體比較:圖 14 - 圖像輸出

IronOCR 的輸出與提供給它的原始圖像相符。 程式碼簡潔易懂,沒有任何技術細節。

1.2. 使用 Iris OCR

Iris OCR 軟體允許您掃描所有紙張文件,並用於文字識別。 使用 Iris OCR 技術進行文字擷取非常簡單。 從主頁選單標籤中的「From File」選擇一個圖像檔案。 相同的圖像用於測試和比較兩個軟件的輸出。

Iris與IronOCR的OCR軟體比較:圖15

您可以對上傳的圖像進行圖像校正。 在輸出文件選項卡中,您可以選擇任何格式作為輸出。 它提供多種輸出格式,如 Word、Excel、PDF、文字檔等。只需以任何格式儲存檔案並開啟以查看提取的文字。

輸出

Iris 與 IronOCR 的 OCR 軟體比較:圖16

您可以看到這兩款軟體的輸出結果存在明顯差異。 IronOCR從圖像中提取了精確的文字以及格式。 然而,Iris OCR 保留了格式,但全名和電話號碼卻出了問題。

條碼和二維碼轉文本

2.1. 使用 IronOCR

IronOCR 提供了一個獨特且實用的功能,即在讀取圖像時可以識別條碼和 QR 碼。 它可以輕鬆檢測條碼並顯示其值。

為此,將讀取條碼配置設置為 true,然後遍歷 OCR 結果中的每一個條碼。 下面是讀取條碼的程式碼:


    var OCR = new IronTesseract();
    OCR.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput()){   
        input.AddImage("test-files/Barcode.png");   
        var Result = OCR.Read(input);   
        foreach (var Barcode in Result.Barcodes){
                Console.WriteLine(Barcode.Value);
        }
    }

    var OCR = new IronTesseract();
    OCR.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput()){   
        input.AddImage("test-files/Barcode.png");   
        var Result = OCR.Read(input);   
        foreach (var Barcode in Result.Barcodes){
                Console.WriteLine(Barcode.Value);
        }
    }
Dim OCR = New IronTesseract()
	OCR.Configuration.ReadBarCodes = True
	Using input = New OcrInput()
		input.AddImage("test-files/Barcode.png")
		Dim Result = OCR.Read(input)
		For Each Barcode In Result.Barcodes
				Console.WriteLine(Barcode.Value)
		Next Barcode
	End Using
VB   C#
輸入圖片

Iris OCR 軟體與 IronOCR 的比較:圖 17

輸出

Iris 與 IronOCR 的 OCR 軟體比較:圖 18

輸入圖像中的所有三個條碼均已成功讀取,並顯示其隱藏文字。

2.2. 使用 IRIS OCR

Iris OCR 也提供從圖像或 PDF 文件中提取條碼資料的功能。 然而,對於條碼,我們必須手動選擇要檢測的條碼區域。 移至「區域」標籤,然後選擇要識別的條碼。

右鍵點擊選定區域並將其複製為資料,然後將其保存在文字處理文件中以查看資料。

Iris OCR軟件與IronOCR之間的比較:圖19

在這種情況下,Iris OCR 軟體無法檢測圖片中條碼後的隱藏文字。

3. PDF 轉文字

3.1. 使用 IronOCR

在 IronOCR 中,閱讀 PDF 文件就像閱讀圖像文件一樣簡單。 您只需要將圖像讀取代碼中的AddImage方法更改為AddPDF。 代碼如下:


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddPdf("test-files/example.pdf");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }

    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddPdf("test-files/example.pdf");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }
Dim OCR = New IronTesseract()
	Using Input = New OcrInput()
		Input.AddPdf("test-files/example.pdf")
		Dim Result = OCR.Read(Input)
		Console.WriteLine(Result.Text)
	End Using
VB   C#
輸出

提取的文本格式與 PDF 文件相同。

Iris 和 IronOCR 之間的 OCR 軟體比較:圖 20

3.2. 使用 IRIS OCR

使用 Iris 軟體閱讀 PDF 檔案也非常簡單。 它支持所有數字格式,而 PDF 是其中之一。 您也可以使用 Iris OCR 軟體製作可搜尋的格式。 PDF 是一種紙質文件,每一頁被視為單獨的圖像文件。使用「從文件打開」選項打開紙質文件。 選擇您要擷取文字的頁面範圍,並將其儲存為給定選項中的任一可編輯格式。

Iris 與 IronOCR 的 OCR 軟體比較:圖 21

輸出

Iris和IronOCR之間的OCR軟體比較:圖22

授權

IronOCR 可以免費用於開發目的,但商業用途需要取得授權。 它還提供免費試用,以測試其潛力是否滿足您的需求。 輕量套裝的價格從 $749 開始,並提供 30 天退費保證。 IronOCR 提供 1 年的免費產品支援和更新,其後每年收費 $399。 所有授權均為永久性,這意味著只需一次性購買,沒有隱藏費用。 您也可以選擇以1999美元的一次性購買費用獲得SaaS和OEM產品的免版稅重新分發覆蓋。 如需了解有關授權方案及定價計劃的更多資訊,請訪問這裡.

Iris 與 IronOCR 的 OCR 軟體比較:圖 23

Iris 是一款光學字符識別(OCR)解決方案,提供 10 天的免費試用版。 專業版價格從 $99 起,合作版價格從 $199 起。要在生產模式中使用其 SDK,您需要從他們的銷售代表處獲取報價。如果您想為 C# 或其他語言的開發授權,請從這裡. 可以查詢專業版和企業版之間的更多資訊和比較。這裡.

Iris 和 IronOCR 光學字符識別 (光學字符識別) 軟體比較:圖 24

結論

Iris 與 IronOCR 光學字符識別 (光學字符識別) 軟體比較:圖 25

IronOCR 為 C# 開發者提供我們所知最先進的 Tesseract API,適用於任何平台。 IronOCR 可部署在 Windows、Linux、Mac、Azure、AWS 和 Lambda,並支援 .NET Framework 專案以及 .NET Standard.NET Core。 我們還可以在OCR掃描中讀取條碼,甚至將我們的OCR導出為HTML和可搜索的PDF。

Iris OCR 軟體內建 AI 功能,兼容 Windows 和 Mac。 其 SDK 可用於多種程式語言。 Iris Pro 具有 Iris OCR SDK 的功能,可以在 Windows 和 Mac 上作為 GUI 應用程式使用。 您可以從影像和 PDF 中讀取文字,並將其輸出為其他格式。 您也可以使用Iris軟體僅需幾下點擊即可自訂所有的紙本文件。

IronOCR 授權是基於開發者的,這意味著您應根據將使用該產品的開發者數量購買授權。 Iris OCR 開發許可證未在 Iris 網站上發布。您需要索取報價以獲取許可證資訊。 此外,IronOCR 授權是一次性購買,可終身使用。

總體而言,這兩款軟體幾乎都提供了使用 AI 技術的所有 OCR 功能,但 IronOCR 相較於 Iris OCR 具有輕微的優勢。 在速度、準確性和整體性能方面,IronOCR在生產環境中表現更佳。 只需幾行代碼即可製作高階文字識別應用程式。 API 文件全天候可用,這使得開發人員喜愛這個函式庫,並成為 OCR 解決方案的首選。 您可以使用完整功能進行測試免費試用.

現在,您可以以購買兩件的價格購買五件 Iron 產品。欲了解更多資訊,請造訪此頁。連結.

從下載 IronOCR這裡試試看。

< 上一頁
谷歌OCR與IronOCR之間的比較
下一個 >
IronOCR和Nanonets OCR的比較

準備開始了嗎? 版本: 2024.11 剛剛發布

免費 NuGet 下載 總下載次數: 2,791,504 查看許可證 >