IronOCR 功能
This article was translated from English: Does it need improvement?
TranslatedView the article in English
IronOCR是一個.NET函式庫,允許開發人員從圖像中掃描和讀取文字或條碼。
相容性
.NET語言
- C# (教程 API 參考
- 在 C# 中從圖像(jpg、png、gif、tiff、bmp)中掃描和讀取文本或條形碼。
- VB.NET
- 在 VB.NET 中從圖像(jpg、png、gif、tiff、bmp)掃描和讀取文本或條碼。
F#
- 在 F# 中從圖像(jpg、png、gif、tiff、bmp)中掃描和讀取文字或條碼。
平台
- .NET 5, 6, 7 和 8 (教程)
- IronOCR 支持 .NET 5、6、7 和 8。
.NET Core 2 和 3 (教程)
IronOCR 支援 .NET Core 2 和 3。
- 當前版本支持在 Linux、Unix 和 macOS 客戶端操作系統以及 Mono 上運行的 .NET Core。
- 未來的版本將支持MAUI和Xamarin。
- .NET Standard 2+(API 參考)
- IronOCR 與 .NET Standard 2 及以上版本兼容。
.NET Framework 4.6.2+ (程式碼範例 API 參考
- 掃描並從 .NET Framework 4.6.2 及以上版本的圖像中讀取文本或條碼。
應用程式類型
作業系統
集成開發環境
- Microsoft Visual Studio(教程)
- Jetbrains ReSharper 和 Rider
證書
Microsoft Authenticode
- DigiCert Trusted G4 Code Signing RSA4096 SHA384 2021 CA1
OCR 引擎
底層OCR引擎
- Tesseract 5 (教程 程式碼範例
- Tesseract 是一款開源的文字識別(OCR)引擎,根據 Apache 2.0 許可證提供。 C#.NET 的其中一個最精確和快速的庫。 目前,Tesseract 5 是最穩定的版本。
詳細配置(程式碼範例)
IronTesseract.Configuration
物件在 C# / .NET 中提供存取底層 Tesseract API 的功能,以便進行進階用戶的設定配置。安裝可以在執行OCR後改善輸出效果。
- 為了提高 OCR 的速度,請查看此代碼範例以獲取快速 OCR 配置。
國際語言
文字和條碼讀取
專業文件
此方法使用機器學習來增強文字識別。
- 掃描文件 (操作指南 程式碼範例
- 適用於閱讀掃描文件或包含大量文字的紙質文件照片。
- 文件中的表格 (操作指南 代碼範例
- 專為包含清晰輪廓表格的文件進行優化。
- 車牌 (操作指南 範例程式碼
- 針對從照片中讀取車牌進行了優化。
- 護照 (怎麼做 代碼範例
- 優化為通過掃描機器可讀區(MRZ)的內容來閱讀和提取護照資訊的照片。
- 照片 (使用方法 程式碼範例
- 優化用於讀取包含難以識別文字的圖像。
- 優化了讀取包含難以閱讀文字的截圖功能。
並發性
- 單線程與多線程 (如何使用 程式碼範例
- 非同步支援 (操作指南 API 參考
- 中止令牌 (代碼範例)
- 允許用戶在讀取大型輸入文件且程序或應用程序運行時出現卡頓的情況下,將當前線程暫停指定的毫秒數。
超時 (代碼範例)
- 提供可選的超時毫秒數,在此之後OCR讀取將被取消。
電腦視覺
- 使用進階訓練模型的電腦視覺技術來尋找文字。 IronOCR 使用 OpenCV 利用计算机视觉来检测图像中存在文本的区域。 這對於包含大量噪音的圖像、文字分佈在許多不同位置的圖像,以及文字扭曲的圖像非常有用。 IronOCR 中使用計算機視覺將確定文本區域的位置,然後使用 Tesseract 嘗試讀取這些區域。
OCR 輸入
支持多種格式讀取
- 圖片 (jpg, png, gif, tiff, bmp) (操作指南 程式碼範例
- 多頁和框架的 TIFF 和 GIF 文件 (操作指南) 程式碼範例)
- System.Drawing 物件 (如何操作 程式碼範例
- Streams(操作指南) 程式碼範例)
- PDFs(操作指南) 程式碼範例
過濾器
- 過濾精靈 (程式碼範例 API 參考)
- 如果不知道應該對圖像應用哪個過濾器,Filter Wizard 會使用暴力法,提供適用於 OcrInput 的過濾器列表,返回最高信心度的組合。
- 高級形態學。 腐蝕會移除物件邊界上的像素。 縮小
- 按比例縮放 OcrInput 頁面。
應用裁剪區域
OCR結果
簡單資料輸出
- .NET 文字字串
- 條碼和 QR 數據
- 圖片
結構化數據輸出
- 頁面
- 區塊
- 段落
- 行
- 文字
- 字元
導出文件
在頁面上突顯文字以進行除錯
- 在偵測到的字元/單詞/行/段落周圍繪製紅色方框作為突出顯示,並將其保存為.png以供調試。