在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
光學字符識別 (OCR) 允許在數位文件中檢測到文字。電腦會將掃描的紙質文件保存為圖像文件。這些圖像文件中的數據不能使用普通的文字編輯器或即使使用文字處理軟件進行搜索、編輯或保存為文字格式。OCR 處理有助於將這些圖像轉換為機器可讀的文字,以便用戶進一步處理。
在這個現代時代,通過互聯網共享的文件是數字格式的,大部分是 PDF 或圖像格式。有許多在線資源可以將圖像轉換為文字。然而,多數企業需要在其軟件應用中實現此功能。考慮到這一點,有許多提供可以嵌入在軟件應用中的 OCR 解決方案的庫。
在本文中,我們將比較兩種最受歡迎的 C# OCR 技術:
IronOCR IronOCR for .NET 是一個用於掃描、搜索和讀取圖像及 PDF 的 C# 庫。它以圖像或 PDF 文件作為輸入,並使用最新的 Tesseract 5 自定義構建的 .NET OCR 引擎來輸出文字、結構化數據或可搜索的 PDF 文件。其 Tesseract 支持 125 多種語言,並在 .NET Core、Standard 的跨平台支持下,從 2.0 一直到 7。
IronOCR 是一個用戶友好的 API,允許 C# 開發人員僅使用 IronTesseract
類自動將圖像轉換為文字。它優先考慮速度、準確性和易用性。它還有助於計算機視覺 API 使用訓練模型集來查找文字。
IronOCR 另一個強大的功能是它可以掃描所有圖像文件中的條形碼和 QR 碼並讀取其文字。IronOCR 的其他重要功能如下所示。
System.Drawing
對象、流和 PDF 文件 (最佳化目標DPI)Iris OCR SDK 是一個模組化的軟體工具包,能夠使您的應用程式將圖像文字轉換為可編輯檔案,並提供其他文字識別服務。它是速度最快的專業OCR,具有高效能和精確性。使用虹膜識別技術,您可以獲得最先進的光學字符識別技術,其中包括最先進的掃描、基於AI的文件分類、數據完整性和數據提取。
IrisOCR 是一個功能豐富的SDK,還提供強大的圖像清理工具以增強圖像。它可以輕鬆整合到 C++、C#、J# 和 VB.NET 軟體應用程式中。IrisOCR 提供長期支援,並設計為跨平台使用,還支援 OEM 和 SaaS 應用程式。IrisOCR 以靈活的價格為企業提供全球解決方案。
在這個教程中,我們將使用最新版本的 Visual Studio 2022。因此,我假設你已經為 C# 下載並安裝了它。如果沒有,你可以從 Visual Studio 網站現在,我們需要建立一個控制台專案來開始使用這兩個函式庫。請按照以下步驟建立專案:
點擊「建立新專案」。
從給定的選項中選擇 C# 主控台應用程式,然後點擊下一步
為您的新專案設定名稱和位置。例如 "OCRProject"。
![Iris與IronOCR的光學字符識別(OCR)軟體比較:圖3](/static-assets/ocr/blog/ocr-software-by-iris-alternatives/ocr-software-by-iris-alternatives-3.webp)
如需更多信息,請選擇 .NET 6.0 框架,因為它是最穩定的版本。
有多種方法可以安裝 IronOCR 庫。
NuGet 是用於在您的專案中下載和安裝相依性的套件管理器。它的套件包含編譯後的程式碼 (DLL) 並且題示檔案。請使用以下方法存取:
點擊管理解決方案的 NuGet 套件
點擊管理 NuGet 套件
現在,NuGet 套件管理器視窗將會打開。瀏覽 IronOCR 並點擊安裝。
可以直接從 NuGet 官方網站下載。
點擊連結:""。
點擊頁面右側的下載包選項。
打開下載的包後會開始安裝。
只需訪問 Iron Software 官網,並導航至 IronOCR for .NET 網頁。滾動至頁面底部,點擊下載 DLL 或下載 Windows 安裝程式。
下載壓縮檔。解壓縮您的專案檔案或執行 Windows 安裝程式。請按照以下步驟將其新增到您的專案中。
在 Visual Studio 的方案總管中,右鍵點擊專案的相依性。
然後,選擇“新增專案參考”選項。
瀏覽下載的 DLL 檔案位置。
Install-Package IronOcr
這將自動下載並安裝 IronOCR 在您的專案中。
只需添加一個命名空間,並將其添加到需要訪問其功能的源代碼文件的頂部。
using IronOcr;
using IronOcr;
Imports IronOcr
現在,我們已準備好在項目中使用IronOCR。
有許多方法可以使用 Iris OCR。如果您正在尋找適合小型企業或辦公室的解決方案,可以使用 OCR 應用程式。這套軟體可以從這裡下載 連結如果您正在尋找中大型企業解決方案,則需要聯繫Iris團隊獲取根據您的需求提供的報價。SDK和其他文檔僅適用於註冊用戶。要在開發環境中使用SDK,您需要使用此請求訪問權限。 格式在這裡我們將使用 Iris 17 OCR 軟體作為比較用途。它在基本層級提供所有功能,可以用來與 IronOCR 進行比較。以下步驟將幫助您下載和安裝 Iris OCR 軟體:
下載軟體後,雙擊打開設置嚮導。
點擊下一步並選擇安裝模式。
接著,選擇你希望讀取文本的語言。
點擊下一步並安裝 Iris OCR
現在軟體將開始安裝。安裝後,點擊完成並打開 Iris OCR 軟體。
一切完成! 現在讓我們進入比較本身。
從圖片讀取數據是一項相當繁瑣的任務。圖片的解析度和質量在擷取內容時起著重要作用。這兩個程式庫都提供了光學字符識別功能來從圖片中提取文字。
IronOCR 使用其強大的 IronTessaract
類使開發人員能夠非常輕鬆地讀取圖像文件的內容。這裡我們將使用一個 PNG 圖像來 從圖像文件讀取文本 以及程式碼如下:
var OCR = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddImage("test-files/employmentapp.png");
var Result = OCR.Read(Input);
Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddImage("test-files/employmentapp.png");
var Result = OCR.Read(Input);
Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
Using Input = New OcrInput()
Input.AddImage("test-files/employmentapp.png")
Dim Result = OCR.Read(Input)
Console.WriteLine(Result.Text)
End Using
IronOCR 的輸出與提供給它的原始圖像相匹配。代碼簡潔且易於理解,沒有任何技術性問題。
Iris OCR 軟體允許掃描所有紙質文件並用於文字識別。使用 Iris OCR 技術進行文字提取非常簡單。在主選單標籤的“From File”中選擇一個圖像文件。相同的圖像被用來測試和比較兩個軟體的輸出。
您可以對上傳的圖片進行圖像校正。在輸出文件標籤中,您可以選擇任何格式作為輸出。它提供多種輸出格式,如Word、Excel、PDF、文本文件等。只需將文件以任何格式保存並打開以查看提取的文本。
您可以看到,這兩款軟體的輸出有明顯的差異。IronOCR 準確地從圖片中提取了文本和格式。然而,Iris OCR 雖然保留了格式,但全名和電話號碼卻被弄亂了。
IronOCR 在讀取圖像時提供了一個獨特且有用的功能,即它可以讀取條碼和 QR 碼。它可以輕鬆地檢測條碼並顯示其值。
要實現此功能,請將讀取條碼配置設置為 true,然後遍歷 OCR 結果中的每個條碼。讀取條碼的代碼如下所示:
var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
using (var input = new OcrInput()){
input.AddImage("test-files/Barcode.png");
var Result = OCR.Read(input);
foreach (var Barcode in Result.Barcodes){
Console.WriteLine(Barcode.Value);
}
}
var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
using (var input = new OcrInput()){
input.AddImage("test-files/Barcode.png");
var Result = OCR.Read(input);
foreach (var Barcode in Result.Barcodes){
Console.WriteLine(Barcode.Value);
}
}
Dim OCR = New IronTesseract()
OCR.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("test-files/Barcode.png")
Dim Result = OCR.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
Next Barcode
End Using
輸入圖像中的三個條碼都被成功讀取,並顯示其隱藏的文字。
Iris OCR 也提供從圖像或 PDF 文件中提取條碼數據的功能。然而,對於條碼,我們必須手動選擇要檢測的條碼區域。移動到區域選項卡並選擇要識別的條碼。
右鍵點擊選定的區域並將其作為數據複製,然後將其保存到文字處理文件中以查看數據。
在這種情況下,Iris OCR 軟體無法檢測到圖片中條碼後面的隱藏文字。
讀取 PDF 文件在 IronOCR 中就像讀取圖像文件一樣簡單。您只需要將圖像讀取代碼中的 AddImage
方法更改為 AddPDF
。代碼如下所示:
var OCR = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddPdf("test-files/example.pdf");
var Result = OCR.Read(Input);
Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddPdf("test-files/example.pdf");
var Result = OCR.Read(Input);
Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
Using Input = New OcrInput()
Input.AddPdf("test-files/example.pdf")
Dim Result = OCR.Read(Input)
Console.WriteLine(Result.Text)
End Using
提取的文本格式與 PDF 文件相同。
使用 Iris 軟體讀取 PDF 檔也是非常簡單的。它支援所有的數位格式,其中也包含 PDF。你也可以使用 Iris OCR 軟體製作可搜尋的格式。PDF 是一種紙本文件,且每一頁都被視為單獨的圖像檔。使用「From File」選項開啟紙本文件。選擇你想要提取文字的頁面範圍,並從提供的選項中將其儲存為任何可編輯的格式。
IronOCR 可免費用於開發用途,但商業使用需要獲得許可。它還提供免費試用來測試您所需的所有潛力。精簡版的套餐從 $749 起,有30天退款保證。IronOCR 提供1年的免費產品支持和更新,之後每年價格為 $399。所有許可證都是永久性的,意味著只需一次購買,且無隱藏費用。您還可以選擇無版稅的重分發覆蓋,用於 SaaS 和 OEM 產品,只需一次性購買 $1999。如需了解更多有關許可證套餐和定價計劃的信息,請訪問 這裡.
Iris是一個提供10天免費試用版本的OCR解決方案。其專業版本起價為$99,企業版本起價為$199。要在生產模式中使用其SDK,我們需要從他們的銷售代表那裡獲取報價。如果您想為C#或任何其他語言開發進行授權,請從他們那裡獲取報價。 這裡更多信息和專業版與合作版的比較可以查看 這裡.
IronOCR 提供 C# 開發人員我們所知最先進的平台無關 Tesseract API。IronOCR 可以在 Windows、Linux、Mac、Azure、AWS 和 Lambda 上部署,並支援 .NET Framework 專案以及 .NET Standard 和 .NET Core。我們還可以在 OCR 掃描中讀取條碼,甚至將我們的 OCR 匯出為 HTML 和可搜尋的 PDF。
Iris OCR 軟體具有 AI 功能,與 Windows 和 Mac 相容。其 SDK 可供多種編程語言使用。Iris Pro 具有 Iris OCR SDK 的功能,適用於 Windows 和 Mac 作為 GUI 應用程式。您可以從圖像和 PDF 中讀取文本,並將其輸出為其他格式。您還可以使用 Iris 軟體自訂所有的紙質文件,只需幾下點擊即可完成。
IronOCR 授權是基於開發人員的,這意味著您應該根據將要使用該產品的開發人數量來購買授權。Iris OCR 開發許可不在 Iris 網站上發布。您必須請求報價以獲取授權資訊。此外,IronOCR 許可是一種一次性購買,可以終身使用。
總體而言,這兩種軟體都提供幾乎所有的 OCR 功能,並具有 AI 技術,但 IronOCR 在某些方面略勝一籌。在速度、準確性和整體性能方面,IronOCR 在生產環境中更優。它只需幾行代碼即可製作高層次的文本識別應用程式。API 文件也隨時可用,使開發人員喜愛這個庫,並使其在 OCR 解決方案中成為首選。您可以測試其全部功能,配有一 免費試用現在,您可以用兩個的價格購買五個Iron產品。欲了解更多資訊,請訪問此 連結從 下載 IronOCR 這裡 試試看。