身分證件

This article was translated from English: Does it need improvement?
Translated
View the article in English

由於防止複製/欺詐的保護(例如全息圖、水印圖像、可變的數位噪點等)被加到卡片背景上,身分證件被設計得非常難以被OCR引擎識別。

這並不是說這是不可能的。結果可能取決於圖像質量。建議使用數位噪點較少的圖像格式,如TIFF或PNG,而不是有損的圖像格式,如JPEG。

請試試以下方法 圖像優化過濾器:

:

降噪(); -- 去除數位噪音。此濾鏡僅應在預期有噪音時使用。將 Alpha 通道展平為白色。

  • 深度清理背景噪音() -- 重度背景噪音移除。僅在已知極端文件背景噪音情況下使用此過濾器,因為此過濾器也會有降低乾淨文件 OCR 精度的風險,並且非常耗費 CPU 資源。

您也可以嘗試裁剪矩形:

https://ironsoftware.com/csharp/ocr/examples/net-tesseract-content-area-rectangle-crop/