與其他組件比較

Iris 與 IronOCR 的 OCR 軟體比較

Kannaopat Udonpant
坎納帕特·烏頓潘
2023年5月16日
分享:

光學文字辨識(OCR)允許在數位文件中偵測文字。 掃描的紙質文件總是由電腦保存為圖像文件。 這些圖像文件中的數據無法通過普通的文本編輯器甚至是文字處理應用程式進行搜索、編輯或以文本格式保存。 OCR 處理有助於將這些圖像轉換為機器可讀的文本,以便用戶進一步處理。

在這個現代時代,透過互聯網分享的文件是數位格式,且大多是PDF或圖像形式。 有許多在線資源可用於將圖像轉換為文字。 然而,大多數企業需要在其軟體應用程式中實現此功能。 考慮到這一點,有許多庫提供可嵌入軟體應用程式的光學字符識別(OCR)解決方案。

在本文中,我們將比較兩種最受歡迎的C# OCR技術:

  • IronOCR
  • Iris OCR 軟體

介紹

IronOCR

IronOCR for .NET 是一個用於掃描、搜索和讀取圖像和 PDF 的 C# 庫。 它以圖像或 PDF 文件作為輸入,使用最新的 Tesseract 5 自訂構建的 .NET OCR 引擎輸出文本、結構化數據或可搜索的 PDF 文件。 它的 Tesseract 支持 125 多種語言,並提供 .NET Core, Standard 的跨平台支持,版本從 2.0 到 7。

IronOCR 是一個用戶友好的 API,允許 C# 開發者通過使用 IronTesseract 類自動將圖像轉換為文字。 它優先考量速度、準確性和易用性。 它還協助計算機視覺API使用一組訓練好的模型來尋找文本。

IronOCR 的另一個強大功能是它可以從所有圖像文件中掃描條碼和 QR 碼並讀取其文本。 IronOCR 的其他重要功能如下所示。

功能

  • 國際語言:支持125種以上的語言和自定義語言,提供高質量和快速的性能
  • 文本和條碼讀取:同時從多種語言中讀取文字和數字
  • 專業文件:專門從收據、支票、發票中讀取文本
  • 從多種格式讀取:圖像(PNG,JPG,GIF,TIFF,BMP),System.Drawing物件,資料流和 PDF 文件(優化的目標 DPI)
  • 篩選器:篩選精靈、圖像校正、修正圖像方向、修正圖像顏色
  • 簡易資料輸出: .NET 文字字串、Barcode 和 QR 資料、影像

Iris OCR 軟體

Iris OCR SDK 是一個模組化的軟體工具包,使您的應用程式能夠將圖像文字轉換成可編輯的文件並提供其他文字識別服務。 這是速度最快、性能卓越且準確率高的專業光學字符識別(OCR)。 透過虹膜識別技術,您可以獲得最先進的光學字符識別技術,包括最先進的掃描、基於人工智慧的文件分類、數據完整性和數據提取。

Iris OCR 是一個功能豐富的 SDK,還提供了強大的影像清理工具用於影像增強。 它可以輕鬆整合到 C++、C#、J# 和 VB.NET 軟體應用程式中。 IrisOCR 提供長期支援,並設計為可跨平台使用。 它還支援 OEM 和 SaaS 應用程序。 Iris OCR 透過彈性的價格為企業提供全球解決方案。

功能

  • 輸入格式:圖像(JPG、PNG、BMP、TIFF),PDF(圖像,文本)
  • 預處理:影像增強、表單清理、透視校正、品質評估
  • 文字識別:識別137多種不同語言的文字(歐洲、亞洲、中東、特定格式)
  • 條碼識別: 支援一維和二維條碼識別(PDF417、QR碼、Code 39、UPC等)
  • 輸出格式:Office (DOCX, XLSX, PPT, RTF), PDF(影像或可搜尋的PDF), 影像格式 (JPG, PNG, BMP, TIFF), HTML, XML, TXT

安裝

建立 Visual Studio 專案

在本教程中,我們將使用最新版本的 Visual Studio 2022。 所以,我假設你已經下載並安裝了 C#。 如果沒有,您可以從Visual Studio 網站下載。

現在,我們需要建立一個控制台專案以開始使用這兩個庫。 按照以下步驟創建專案:

  • 打開您的 Visual Studio 2022。
  • 點擊建立新專案。

    Iris 與 IronOCR 的 OCR 軟體比較:圖 1

  • 從給定選項中選擇 C# 主控台應用程式,然後點擊下一步

    Iris 與 IronOCR 的 OCR 軟體比較:圖 2

  • 配置您的新專案名稱和位置。 例如「OCRProject」。

    Iris OCR 軟體與 IronOCR 的比較:圖 3

  • 如需更多信息,請選擇 .NET 6.0 Framework,因為它是最穩定的版本。

    Iris 與 IronOCR 的 OCR 軟體比較:圖 4

  • 現在,點擊「建立」,專案將在您指定的位置創建。

安裝 IronOCR

有多種方法可以安裝IronOCR庫。

1. 使用 Visual Studio NuGet 套件管理器

NuGet 是一個用於在您的專案中下載和安裝相依項目的套件管理工具。 其套件包含編譯代碼(DLL)和清單文件。使用以下方法訪問:

  • 單擊工具選項卡
  • 擴展 NuGet 套件管理器選項
  • 點選管理解決方案的 NuGet 套件

    Iris OCR 软件与 IronOCR 的比较:图 5

  • 或者,右鍵點擊方案總管
  • 點擊管理 NuGet 套件

    Iris 與 IronOCR 的 OCR 軟體比較:圖 6

    現在,NuGet 套件管理器視窗將會開啟。 瀏覽 IronOCR 並點擊安裝。

    Iris與IronOCR的OCR軟體比較:圖7

2. 從 NuGet 網站下載

可以直接從 NuGet 官方網站下載。

  1. 點擊連結:""。

  2. 點擊頁面右側的下載包選項。

  3. 打開下載的套件,它將開始安裝。

  4. 最後,重新載入解決方案,就完成了。

3. 使用 IronOCR 網頁下載

只需造訪 Iron Software 網站並導航至 IronOCR for .NET 網頁。 滾動到頁面底部並點擊下載 DLL 或下載 Windows 安裝程式。

Iris OCR 軟體與 IronOCR 的比較:圖 8

已下載壓縮檔。 提取您的專案檔案或運行Windows安裝程式。 按照以下步驟將其新增到您的專案。

  1. 在 Visual Studio 的方案總管中右鍵點擊專案的相依性。

  2. 然後,選擇選項新增專案參考。

  3. 瀏覽已下載的DLL文件位置。

  4. 最後,點擊「確定」以添加專案參考。

4. 在 Visual Studio 中使用命令提示字元

  1. 在 Visual Studio 中導航到工具選項卡。

  2. 擴展 NuGet 套件管理員選項。

  3. 選擇套件管理器主控台並輸入以下命令:
    Install-Package IronOcr

這將自動下載並安裝 IronOCR 在您的專案中。

5. 添加必要的 IronOCR 命名空間

只需一個命名空間,並需要在我們需要訪問其功能的源代碼文件的頂部添加。

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

現在,我們已準備好在項目中使用IronOCR。

安裝 Iris OCR

Iris OCR 有許多使用方式。 如果您正在尋找小型企業或辦公室解決方案,您可以使用OCR應用程式。該軟體可以從這個連結下載。

如果您正在尋找中大型企業解決方案,那麼您需要聯繫Iris團隊以根據您的需求獲取報價。 SDK 和其他文件僅提供給註冊客戶。 要在開發環境中使用 SDK,您需要使用此表單申請訪問權限。

在此,我們將使用 Iris 17 OCR 軟體進行比較。 它提供了所有基礎層級的功能,可用於與IronOCR進行比較。 以下步驟將有助於下載和安裝 Iris OCR 軟體:

  1. 下載軟體後,雙擊以開啟安裝精靈。

    Iris OCR 軟體與 IronOCR 軟體比較:圖 9

  2. 單擊下一步並選擇安裝模式。

  3. 接下來,選擇您想從中閱讀文本的語言

    Iris 與 IronOCR 的 OCR 軟體比較:圖 10

  4. 點擊下一步並安裝 Iris OCR

    Iris 與 IronOCR 之間的 OCR 軟體比較:圖 11

  5. 現在軟體將開始安裝。 安裝完成後,點擊完成並打開 Iris OCR 軟體。

    Iris OCR 軟體與 IronOCR 之間的比較:圖 12

    一切搞定! 現在讓我們繼續比較本身。

比較

1. 圖像轉文字

從圖像中讀取資料是一項相當繁瑣的任務。 圖像解析度和品質在提取內容時起著重要作用。 兩個庫都提供光學字符識別功能,用於從圖像中提取文本。

1.1. 使用 IronOCR

IronOCR 透過其強大的 IronTessaract 類別,使開發者能夠非常輕鬆地讀取圖像文件的內容。 在此我們將使用 PNG 圖像來從圖像檔案讀取文字,代碼如下:


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddImage("test-files/employmentapp.png");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }

    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddImage("test-files/employmentapp.png");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }
Dim OCR = New IronTesseract()
	Using Input = New OcrInput()
		Input.AddImage("test-files/employmentapp.png")
		Dim Result = OCR.Read(Input)
		Console.WriteLine(Result.Text)
	End Using
$vbLabelText   $csharpLabel
輸入圖片

Iris OCR 軟體與 IronOCR 的比較:圖 13

輸出

Iris 與 IronOCR 的 OCR 軟體比較:圖 14 - 圖像輸出

IronOCR 的輸出與提供給它的原始圖像相符。 程式碼簡潔易懂,沒有任何技術細節。

1.2. 使用 Iris OCR

Iris OCR 軟體允許您掃描所有紙張文件,並用於文字識別。 使用 Iris OCR 技術進行文字擷取非常簡單。 從主頁選單標籤中的「From File」選擇一個圖像檔案。 相同的圖像用於測試和比較兩個軟件的輸出。

Iris OCR 軟體與 IronOCR 的比較:圖15

您可以對上傳的圖像進行圖像校正。 在輸出文件選項卡中,您可以選擇任何格式作為輸出。 它提供多種輸出格式,如 Word、Excel、PDF、文字檔等。只需以任何格式儲存檔案並開啟以查看提取的文字。

輸出

Iris 與 IronOCR 的 OCR 軟體比較:圖 16

您可以看到這兩款軟體的輸出結果存在明顯差異。 IronOCR從圖像中提取了精確的文字以及格式。 然而,Iris OCR 保留了格式,但全名和電話號碼卻出了問題。

條碼和二維碼轉文本

2.1. 使用 IronOCR

IronOCR 提供了一個獨特且實用的功能,即在讀取圖像時可以識別條碼和 QR 碼。 它可以輕鬆檢測條碼並顯示其值。

為此,將讀取條碼配置設置為 true,然後遍歷 OCR 結果中的每一個條碼。 下面是讀取條碼的程式碼:


    var OCR = new IronTesseract();
    OCR.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput()){   
        input.AddImage("test-files/Barcode.png");   
        var Result = OCR.Read(input);   
        foreach (var Barcode in Result.Barcodes){
                Console.WriteLine(Barcode.Value);
        }
    }

    var OCR = new IronTesseract();
    OCR.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput()){   
        input.AddImage("test-files/Barcode.png");   
        var Result = OCR.Read(input);   
        foreach (var Barcode in Result.Barcodes){
                Console.WriteLine(Barcode.Value);
        }
    }
Dim OCR = New IronTesseract()
	OCR.Configuration.ReadBarCodes = True
	Using input = New OcrInput()
		input.AddImage("test-files/Barcode.png")
		Dim Result = OCR.Read(input)
		For Each Barcode In Result.Barcodes
				Console.WriteLine(Barcode.Value)
		Next Barcode
	End Using
$vbLabelText   $csharpLabel
輸入圖片

Iris 與 IronOCR 的 OCR 軟體比較:圖 17

輸出

Iris OCR 軟體與 IronOCR 之間的比較:圖 18

輸入圖像中的所有三個條碼均已成功讀取,並顯示其隱藏文字。

2.2. 使用 IRIS OCR

Iris OCR 也提供從圖像或 PDF 文件中提取條碼資料的功能。 然而,對於條碼,我們必須手動選擇要檢測的條碼區域。 移至「區域」標籤,然後選擇要識別的條碼。

右鍵點擊選定區域並將其複製為資料,然後將其保存在文字處理文件中以查看資料。

Iris與IronOCR的OCR軟體比較:圖19

在這種情況下,Iris OCR 軟體無法檢測圖片中條碼後的隱藏文字。

3. PDF 轉文字

3.1. 使用 IronOCR

在 IronOCR 中,閱讀 PDF 文件就像閱讀圖像文件一樣簡單。 您只需將圖片讀取程式碼中的AddImage方法更改為AddPDF。 代碼如下:


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddPdf("test-files/example.pdf");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }

    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddPdf("test-files/example.pdf");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }
Dim OCR = New IronTesseract()
	Using Input = New OcrInput()
		Input.AddPdf("test-files/example.pdf")
		Dim Result = OCR.Read(Input)
		Console.WriteLine(Result.Text)
	End Using
$vbLabelText   $csharpLabel
輸出

提取的文本格式與 PDF 文件相同。

Iris與IronOCR的OCR軟體比較:圖20

3.2. 使用 IRIS OCR

使用 Iris 軟體閱讀 PDF 檔案也非常簡單。 它支持所有數字格式,而 PDF 是其中之一。 您也可以使用 Iris OCR 軟體製作可搜尋的格式。 PDF 是一種紙質文件,每一頁被視為單獨的圖像文件。使用「從文件打開」選項打開紙質文件。 選擇您要擷取文字的頁面範圍,並將其儲存為給定選項中的任一可編輯格式。

Iris OCR 軟體與 IronOCR 比較:圖 21

輸出

Iris 與 IronOCR 的 OCR 軟體比較:圖 22

授權

IronOCR 可以免費用於開發目的,但商業用途需要取得授權。 它還提供免費試用,以測試其潛力是否滿足您的需求。 精簡版套件的起價為$749,並提供 30 天退款保證。 IronOCR 提供 1 年的免費產品支援和更新,其後每年收費 $399。 所有授權均為永久性,這意味著只需一次性購買,沒有隱藏費用。 您也可以選擇以1999美元的一次性購買費用獲得SaaS和OEM產品的免版稅重新分發覆蓋。 有關授權套裝與價格方案的更多資訊,請造訪這裡

Iris OCR軟體與IronOCR的比較:圖23

Iris 是一款光學字符識別(OCR)解決方案,提供 10 天的免費試用版。 專業版起價為 99 美元,合作版起價為 199 美元。要在生產模式中使用其 SDK,我們需要從他們的銷售代表那裡獲得報價。如果您想為 C# 或其他語言開發授權,請從這裡獲得報價。 更多有關專業版和企業版之間的資訊和比較可以在這裡查看。

Iris 與 IronOCR 的 OCR 軟體比較:圖形 24

結論

Iris OCR 軟體與 IronOCR 的比較:圖 25

IronOCR 為 C# 開發者提供我們所知最先進的 Tesseract API,適用於任何平台。 IronOCR 可部署在 Windows、Linux、Mac、Azure、AWS 和 Lambda,並支援 .NET Framework 專案以及 .NET Standard.NET Core。 我們還可以在OCR掃描中讀取條碼,甚至將我們的OCR導出為HTML和可搜索的PDF。

Iris OCR 軟體內建 AI 功能,兼容 Windows 和 Mac。 其 SDK 可用於多種程式語言。 Iris Pro 具有 Iris OCR SDK 的功能,可以在 Windows 和 Mac 上作為 GUI 應用程式使用。 您可以從影像和 PDF 中讀取文字,並將其輸出為其他格式。 您也可以使用Iris軟體僅需幾下點擊即可自訂所有的紙本文件。

IronOCR 授權是基於開發者的,這意味著您應根據將使用該產品的開發者數量購買授權。 Iris OCR 開發許可證未在 Iris 網站上發布。您需要索取報價以獲取許可證資訊。 此外,IronOCR 授權是一次性購買,可終身使用。

總體而言,這兩款軟體幾乎都提供了使用 AI 技術的所有 OCR 功能,但 IronOCR 相較於 Iris OCR 具有輕微的優勢。 在速度、準確性和整體性能方面,IronOCR在生產環境中表現更佳。 只需幾行代碼即可製作高階文字識別應用程式。 API 文件全天候可用,這使得開發人員喜愛這個函式庫,並成為 OCR 解決方案的首選。 您可以使用免費試用版測試其全部功能。

現在,您可以以兩件的價格購買五件 Iron 產品。欲了解更多資訊,請訪問此連結

這裡下載 IronOCR 並試用一下。

Kannaopat Udonpant
坎納帕特·烏頓潘
軟體工程師
在成為軟體工程師之前,Kannapat 在日本北海道大學完成了環境資源博士學位。在攻讀學位期間,Kannapat 也成為了車輛機器人實驗室的成員,該實驗室隸屬於生物生產工程學系。2022 年,他利用自己的 C# 技能,加入了 Iron Software 的工程團隊,專注於 IronPDF 的開發。Kannapat 珍視這份工作,因為他可以直接向負責撰寫大部分 IronPDF 程式碼的開發人員學習。除了同儕學習外,Kannapat 還享受在 Iron Software 工作的社交方面。當他不在撰寫程式碼或文件時,Kannapat 通常會在 PS5 上玩遊戲或重看《最後生還者》。
< 上一頁
谷歌OCR與IronOCR之間的比較
下一個 >
IronOCR和Nanonets OCR的比較