身分證件
由於防止複製/欺詐的保護(例如全息圖、水印圖像、可變的數位噪點等)被加到卡片背景上,身分證件被設計得非常難以被OCR引擎識別。
這並不是說這是不可能的。結果可能取決於圖像質量。建議使用數位噪點較少的圖像格式,如TIFF或PNG,而不是有損的圖像格式,如JPEG。
請試試以下方法 圖像優化過濾器:
:
降噪(); -- 去除數位噪音。此濾鏡僅應在預期有噪音時使用。將 Alpha 通道展平為白色。
- 深度清理背景噪音() -- 重度背景噪音移除。僅在已知極端文件背景噪音情況下使用此過濾器,因為此過濾器也會有降低乾淨文件 OCR 精度的風險,並且非常耗費 CPU 資源。
您也可以嘗試裁剪矩形:
https://ironsoftware.com/csharp/ocr/examples/net-tesseract-content-area-rectangle-crop/