Ir para o conteúdo do rodapé
UTILIZANDO O IRONOCR

SDK de OCR para passaporte (Tutorial para desenvolvedores)

Um passaporte é a identidade de um indivíduo; usamos passaportes para viajar e registrar aspectos essenciais das nossas vidas. No entanto, o formato do passaporte nem sempre é fácil de ler. Imagine muitos viajantes aparecendo de repente durante a temporada de férias para viajar e lazer. Como os agentes de imigração podem lidar com essa grande quantidade de dados com entrada de dados manual e recuperar a informação correta manualmente?

Portanto, muitos aplicativos e empresas estão aderindo ao reconhecimento óptico de caracteres (OCR), que permite aos desenvolvedores extrair rapidamente texto impresso e imagens digitais.

Da mesma forma, o Passport OCR é uma tecnologia que utiliza software de reconhecimento óptico de caracteres (OCR) para extrair informações significativas dos passaportes; também utiliza a zona de leitura por máquina de todos os passaportes para recuperar informações e identificar rapidamente o indivíduo que está tentando passar pela imigração. Em cenários onde você precisa reconhecer rapidamente as informações do passaporte ou em um processo que envolve a automação da extração de dados do passaporte, o Passport OCR é vital e é a pedra angular da eficiência e rapidez em aeroportos e fronteiras de imigração.

Embora o software e a tecnologia do Passport OCR tenham se desenvolvido cada vez mais ao longo dos anos, vários fatores podem afetar o processo de digitalização de documentos. Imagens digitais com ruído ou manchas no passaporte podem afetar bastante a precisão do passaporte. Além disso, bibliotecas de OCR podem, às vezes, ser confusas ao operar em um passaporte, pois a zona de leitura por máquina é um conjunto de dados estruturado único. Desenvolvedores podem ser capazes de extrair dados, mas precisam ordenar os parâmetros de forma independente. No entanto, com o IronOCR, métodos especializados estão otimizados para leitura de passaportes; seus resultados permitem que os desenvolvedores obtenham e manipulem as informações rapidamente, o que é ideal para digitalização e automação em grande volume.

Neste artigo, discutiremos brevemente o uso do IronOCR para obter e manipular informações de passaporte para automatizar a extração de dados e fornecer mais detalhes sobre como o IronOCR interage com o passaporte.

IronOCR: Uma Biblioteca de OCR em C#

SDK de OCR de Passaporte (Tutorial para Desenvolvedores): Figura 1 - IronOCR: Uma Biblioteca OCR em C#

IronOCR é uma biblioteca em C# que oferece métodos fáceis de usar e funcionalidade flexível para todas as necessidades relacionadas a OCR. Além das técnicas padrão, IronOCR permite que os desenvolvedores utilizem e personalizem totalmente uma versão do Tesseract para realizar todas as tarefas relacionadas.

Aqui está um resumo rápido de suas características mais notáveis abaixo:

  1. Compatibilidade cruzada: IronOCR é compatível com a maioria das plataformas .NET, incluindo .NET 8, 7, 6 e 5, e suporta .NET Framework 4.6.2 em diante. Com esta biblioteca, os desenvolvedores não precisam se preocupar com compatibilidade cruzada, pois ela também suporta todos os sistemas operacionais, desde Windows, macOS até Azure, e mesmo Linux.
  2. Flexibilidade: A entrada OCR vem em muitos formatos, então uma biblioteca precisa lidar com todos os tipos de formatos para ser verdadeiramente flexível. IronOCR aceita todos os formatos de imagem populares (jpg, png e gif) enquanto suporta o nativo "System.Drawing.Objects" do C#, permitindo uma integração mais fácil em bases de código existentes.
  3. Suporte e facilidade de uso: IronOCR está bem documentado, com uma API extensa e tutoriais que indicam todas as formas de funcionalidade. Além disso, há suporte 24/5, garantindo que os desenvolvedores estejam sempre apoiados.
  4. Suporte a múltiplos idiomas: IronOCR suporta até 125 idiomas e também suporta idiomas personalizados, tornando-o versátil para todo o processamento internacional de documentos.

Lendo o Passaporte com IronOCR

Chave de licença

Por favor, lembre-se de que o IronOCR requer uma chave de licenciamento para operação. Você pode obter uma chave como parte de um teste gratuito visitando este link .

// Replace the license key variable with the trial key you obtained
IronOcr.License.LicenseKey = "REPLACE-WITH-YOUR-KEY";
// Replace the license key variable with the trial key you obtained
IronOcr.License.LicenseKey = "REPLACE-WITH-YOUR-KEY";
$vbLabelText   $csharpLabel

Após receber uma chave de teste, defina esta variável em seu projeto.

Exemplo de código

O código abaixo demonstra como o IronOCR pega uma imagem de passaporte e extrai todas as informações relevantes usando o SDK de OCR de passaporte da biblioteca.

Imagem de entrada

SDK de OCR de Passaporte (Tutorial para Desenvolvedores): Figura 2 - Imagem de entrada

using IronOcr;
using System;

class Program {
    public static void Main() {
        // Instantiate OCR engine
        var ocr = new IronTesseract();
        using var inputPassport = new OcrInput();
        inputPassport.AddImage("Passport.jpg");

        // Perform OCR to read the passport
        OcrResult result = ocr.Read(inputPassport);

        // Output passport information
        Console.WriteLine("Given Names: " + result.Passport?.GivenNames);
        Console.WriteLine("Country: " + result.Passport?.Country);
        Console.WriteLine("Passport Number: " + result.Passport?.PassportNumber);
        Console.WriteLine("Surname: " + result.Passport?.Surname);
        Console.WriteLine("Date of Birth: " + result.Passport?.DateOfBirth.ToString("yyyy-MM-dd"));
        Console.WriteLine("Date of Expiry: " + result.Passport?.DateOfExpiry.ToString("yyyy-MM-dd"));
    }
}
using IronOcr;
using System;

class Program {
    public static void Main() {
        // Instantiate OCR engine
        var ocr = new IronTesseract();
        using var inputPassport = new OcrInput();
        inputPassport.AddImage("Passport.jpg");

        // Perform OCR to read the passport
        OcrResult result = ocr.Read(inputPassport);

        // Output passport information
        Console.WriteLine("Given Names: " + result.Passport?.GivenNames);
        Console.WriteLine("Country: " + result.Passport?.Country);
        Console.WriteLine("Passport Number: " + result.Passport?.PassportNumber);
        Console.WriteLine("Surname: " + result.Passport?.Surname);
        Console.WriteLine("Date of Birth: " + result.Passport?.DateOfBirth.ToString("yyyy-MM-dd"));
        Console.WriteLine("Date of Expiry: " + result.Passport?.DateOfExpiry.ToString("yyyy-MM-dd"));
    }
}
$vbLabelText   $csharpLabel

Explicação do código

  1. Importar Bibliotecas: Primeiro, importamos o IronOCR para a base de código e outras bibliotecas necessárias.
  2. Instanciar o Motor de OCR: Criamos um novo objeto IronTesseract para inicializar o motor OCR.
  3. Carregar a Imagem do Passaporte: Em seguida, criamos um novo OcrInput e carregamos a imagem contendo o passaporte usando AddImage().
  4. Ler Passaporte Usando OCR: Usamos o método Read() para realizar a operação de OCR na imagem de entrada e salvar o resultado.
  5. Produzir Resultados: Exibimos as informações extraídas do passaporte, como nomes dados, país, número do passaporte, sobrenome, data de nascimento e data de validade.

Saída do console

SDK de OCR de Passaporte (Tutorial para Desenvolvedores): Figura 3 - Saída do console

Zona Legível por Máquina

IronOCR pode extrair as informações da Zona Legível por Máquina (MRZ) das duas linhas inferiores de qualquer passaporte de acordo com o padrão da Organização da Aviação Civil Internacional (ICAO). Os dados MRZ são compostos por duas linhas, cada uma contendo informações únicas.

Aqui está uma breve tabela sobre isso:

SDK de OCR de Passaporte (Tutorial para Desenvolvedores): Figura 4 - Tabela de MRZ

Desafios para OCR de Passaporte e Depuração

A qualidade da imagem é sempre um problema ao escanear imagens digitais. Uma qualidade de imagem distorcida obscureceria as informações e tornaria mais difícil confirmar a precisão dos dados. Além disso, os desenvolvedores devem considerar a segurança dos dados e a conformidade ao lidar com informações críticas, como um passaporte.

IronOCR também oferece uma maneira de depurar e mostrar o conceito para informações de interação. Esses métodos permitem que os desenvolvedores solucionem problemas e tenham confiança nos dados extraídos.

Aqui está um breve exemplo disso:

using IronOcr;
using System;

class DebugExample {
    public static void Main() {
        // Instantiate OCR engine
        var ocr = new IronTesseract();
        using var inputPassport = new OcrInput();
        inputPassport.AddImage("Passport.jpg");

        // Perform OCR
        OcrResult result = ocr.Read(inputPassport);

        // Output Confidence level and raw extracted text
        Console.WriteLine("OCR Confidence: " + result.Confidence);
        Console.WriteLine("Extracted Text: ");
        Console.WriteLine(result.Text);
    }
}
using IronOcr;
using System;

class DebugExample {
    public static void Main() {
        // Instantiate OCR engine
        var ocr = new IronTesseract();
        using var inputPassport = new OcrInput();
        inputPassport.AddImage("Passport.jpg");

        // Perform OCR
        OcrResult result = ocr.Read(inputPassport);

        // Output Confidence level and raw extracted text
        Console.WriteLine("OCR Confidence: " + result.Confidence);
        Console.WriteLine("Extracted Text: ");
        Console.WriteLine(result.Text);
    }
}
$vbLabelText   $csharpLabel

Explicação do Código de Depuração

  1. Confiança: A propriedade Confidence no OcrResult é um número de ponto flutuante representando a confiança de precisão estatística do OCR, calculada como uma média de cada caractere. Um valor mais baixo indica que a imagem do passaporte pode estar borrada ou conter informações extras. Um representa o maior nível de confiança, enquanto zero representa o menor.
  2. Texto: A propriedade Text no OcrResult mantém o texto não processado extraído da imagem do passaporte. Os desenvolvedores podem usá-lo em testes de unidade para validar o texto extraído da imagem do passaporte realizando asserções de igualdade.

Conclusão

SDK de OCR de Passaporte (Tutorial para Desenvolvedores): Figura 5 - IronOCR

A tecnologia OCR de passaporte melhora significativamente o processamento de documentos, automatizando a extração de dados e aumentando a eficiência operacional. Ela simplifica a verificação de identidade e os processos de KYC, garantindo alta precisão ao lidar com informações pessoais sensíveis. Fronteiras de imigração e aeroportos podem reduzir o tempo de processamento e melhorar a eficiência do fluxo de trabalho escolhendo o IronOCR como sua API de OCR de Passaporte.

IronOCR oferece aos desenvolvedores flexibilidade e escalabilidade através de seus métodos fáceis de usar. Permite que os desenvolvedores classifiquem informações rapidamente através do objeto OcrResult. Além disso, IronOCR fornece ferramentas de depuração, incluindo níveis de confiança e texto bruto não processado, para que os desenvolvedores usem em testes de unidade de produto. IronOCR também minimiza o ruído digital manualmente para um uso mais avançado ao limpar a entrada da imagem do passaporte antes de passá-la pelo método.

Sinta-se à vontade para aproveitar a página de licença de teste gratuita do IronOCR.

Perguntas frequentes

Como posso usar OCR para extrair informações de passaportes em C#?

Você pode usar o IronOCR para extrair informações de passaportes processando imagens e extraindo dados da área legível por máquina, utilizando seus poderosos recursos de OCR.

Quais são os benefícios de usar OCR para o processamento de dados de passaporte?

O OCR para processamento de dados de passaporte automatiza a extração de informações, aumentando significativamente a eficiência e a precisão em áreas de grande movimento, como aeroportos e controles de fronteira.

É possível processar vários idiomas com a tecnologia OCR?

Sim, o IronOCR suporta até 125 idiomas e permite a adição de idiomas personalizados, tornando-o versátil para o processamento de documentos internacionais.

Como o IronOCR garante a extração precisa de dados de passaportes?

O IronOCR fornece uma propriedade chamada 'Confiança' no OcrResult para indicar a precisão estatística, permitindo que os desenvolvedores verifiquem a confiabilidade dos dados extraídos.

Quais formatos de imagem são suportados pelo IronOCR para digitalização de passaportes?

O IronOCR suporta todos os formatos de imagem populares, incluindo jpg, png e gif, e também pode funcionar com objetos nativos do C# System.Drawing.Objects para facilitar a integração.

Quais desafios os desenvolvedores podem enfrentar com a implementação do OCR do Passport?

Os desafios incluem lidar com imagens de baixa qualidade, garantir a segurança dos dados e cumprir as normas relativas ao tratamento de informações sensíveis de passaportes.

Como os desenvolvedores podem começar a usar o IronOCR para OCR de passaportes?

Os desenvolvedores podem começar a usar o IronOCR obtendo uma chave de licença de avaliação no site do fornecedor e seguindo a documentação detalhada para integrá-lo em seus aplicativos C#.

Quais plataformas são compatíveis com o IronOCR?

O IronOCR é compatível com a maioria das plataformas .NET, incluindo .NET 8, 7, 6 e 5, bem como com o .NET Framework 4.6.2 e versões superiores, e oferece suporte aos principais sistemas operacionais, como Windows, macOS, Azure e Linux.

Kannaopat Udonpant
Engenheiro de Software
Antes de se tornar Engenheiro de Software, Kannapat concluiu um doutorado em Recursos Ambientais pela Universidade de Hokkaido, no Japão. Durante o doutorado, Kannapat também integrou o Laboratório de Robótica Veicular, que faz parte do Departamento de Engenharia de Bioprodução. Em 2022, ele utilizou suas habilidades ...
Leia mais

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me