使用 IronOCR 讀取身份文件

This article was translated from English: Does it need improvement?
Translated
View the article in English

識別文件在設計上對於OCR引擎來說非常難以閱讀,因為為了防偽/防篡改,卡片背景添加了全息圖、浮水印圖像、可變數位雜訊等。

這並不是說這是不可能的。 結果很可能會依賴於圖像質量。建議使用較少數字噪點的圖像格式,如 TIFF 或 PNG,而不是

lossy 圖像格式,例如 JPEG。

請嘗試以下方法圖像優化過濾器:

-降噪(); -- 移除數字噪聲。此過濾器應僅在預期有噪聲的情況下使用。 將 Alpha 通道壓平為白色。

-深度清理背景噪音()-- 重度背景噪音移除。 僅在已知文件背景噪音極端的情況下使用此過濾器,因為這種過濾器也可能降低清晰文件的OCR準確性,且非常耗費CPU資源。

您也可以嘗試裁剪矩形:

https://ironsoftware.com/csharp/ocr/examples/net-tesseract-content-area-rectangle-crop/