Lendo Documentos de Identidade com IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

Documentos de identidade são, por design, muito difíceis para motores de OCR lerem devido às proteções anti-cópia/fraude -- hologramas, marcas d'água, ruído digital variável, etc. -- adicionadas aos fundos do cartão.

Isto não significa que seja impossível. Os resultados provavelmente dependerão da qualidade da imagem. Formatos de imagem com menos ruído digital, como TIFF ou PNG, são recomendados sobre formatos de imagem com perdas, como JPEG.

Por favor, também experimente os seguintes filtros de otimização de imagem:

  • DeNoise(): Remove ruído digital. Este filtro deve ser usado apenas onde o ruído é esperado. Ele achata os canais Alpha para branco.
  • DeepCleanBackgroundNoise(): Executa a remoção pesada de ruído de fundo. Use este filtro apenas em casos onde o ruído de fundo do documento extremo é conhecido, pois este filtro também correrá o risco de reduzir a precisão do OCR de documentos limpos e é muito caro em termos de CPU.

Você também pode tentar recortar retângulos: Exemplo de Recorte de Retângulos.

Curtis Chau
Redator Técnico

Curtis Chau é bacharel em Ciência da Computação (Universidade Carleton) e se especializa em desenvolvimento front-end, com experiência em Node.js, TypeScript, JavaScript e React. Apaixonado por criar interfaces de usuário intuitivas e esteticamente agradáveis, Curtis gosta de trabalhar com frameworks modernos e criar manuais ...

Leia mais
Pronto para começar?
Nuget Downloads 5,525,971 | Versão: 2026.3 acaba de ser lançado
Still Scrolling Icon

Ainda está rolando a tela?

Quer provas rápidas? PM > Install-Package IronOcr
executar um exemplo Veja sua imagem se transformar em texto pesquisável.