Converter Imagem em Texto de Documentos de Identidade com IronOCR

Atualizado:junho 1, 2025

Translated

View the article in English

Documentos de identidade são, por design, muito difíceis para motores de OCR lerem devido às proteções anti-cópia/fraude -- hologramas, marcas d'água, ruído digital variável, etc. -- adicionadas aos fundos do cartão.

Isto não significa que seja impossível. Os resultados provavelmente dependerão da qualidade da imagem. Formatos de imagem com menos ruído digital, como TIFF ou PNG, são recomendados sobre formatos de imagem com perdas, como JPEG.

Por favor, também experimente os seguintes filtros de otimização de imagem:

DeNoise(): Remove ruído digital. Este filtro deve ser usado apenas onde o ruído é esperado. Ele achata os canais Alpha para branco.
DeepCleanBackgroundNoise(): Executa a remoção pesada de ruído de fundo. Use este filtro apenas em casos onde o ruído de fundo do documento extremo é conhecido, pois este filtro também correrá o risco de reduzir a precisão do OCR de documentos limpos e é muito caro em termos de CPU.

Você também pode tentar recortar retângulos: Exemplo de Recorte de Retângulos.

Curtis Chau

Converse agora mesmo com a equipe de engenharia.

Redator Técnico

Curtis Chau é bacharel em Ciência da Computação (Universidade Carleton) e se especializa em desenvolvimento front-end, com experiência em Node.js, TypeScript, JavaScript e React. Apaixonado por criar interfaces de usuário intuitivas e esteticamente agradáveis, Curtis gosta de trabalhar com frameworks modernos e criar manuais ...