Converter Imagem em Texto de Documentos de Identidade com IronOCR
Documentos de identidade são, por design, muito difíceis para motores de OCR lerem devido às proteções anti-cópia/fraude -- hologramas, marcas d'água, ruído digital variável, etc. -- adicionadas aos fundos do cartão.
Isto não significa que seja impossível. Os resultados provavelmente dependerão da qualidade da imagem. Formatos de imagem com menos ruído digital, como TIFF ou PNG, são recomendados sobre formatos de imagem com perdas, como JPEG.
Por favor, também experimente os seguintes filtros de otimização de imagem:
- DeNoise(): Remove ruído digital. Este filtro deve ser usado apenas onde o ruído é esperado. Ele achata os canais Alpha para branco.
- DeepCleanBackgroundNoise(): Executa a remoção pesada de ruído de fundo. Use este filtro apenas em casos onde o ruído de fundo do documento extremo é conhecido, pois este filtro também correrá o risco de reduzir a precisão do OCR de documentos limpos e é muito caro em termos de CPU.
Você também pode tentar recortar retângulos: Exemplo de Recorte de Retângulos.

