Ir para o conteúdo do rodapé
UTILIZANDO O IRONOCR

Desempenho otimizado para processamento OCR mais rápido e eficiente.

Em 2024.12, IronOCR introduziu um recurso que reduziu significativamente o tamanho do arquivo de PDFs pesquisáveis gerados ao processar imagens TIFF de várias páginas. Enquanto essa melhoria alcançou arquivos de saída menores, também introduziu desafios de desempenho na velocidade de processamento e uso de memória.

Otimizações iniciais em 2025.1 começaram a abordar esses problemas de desempenho. As melhorias abrangentes de desempenho foram posteriormente entregues na versão 2025.2, que manteve os tamanhos menores de arquivo enquanto resolvia os desafios de velocidade e memória ao lidar com documentos de várias páginas.


Identificando o Gargalo: Rotação de Página e Tempo de Processamento

Um dos principais gargalos de desempenho era a rotação de página. Cada operação criava uma nova instância em vez de reutilizar as existentes, levando a um tempo de processamento e consumo de memória desnecessários. Essa ineficiência resultou em aumento do tempo de processamento e consumo de memória, especialmente ao converter grandes TIFFs em PDFs pesquisáveis.

Versão de Otimização (IronOCR 2025.2)

A correção inicial no IronOCR 2025.1 focou em otimizar a reutilização de instâncias para rotação de página. Isso levou a uma melhoria modesta de 10%, reduzindo o tempo de processamento de 63 segundos para 57 segundos. Mas isso foi apenas o começo.

À medida que nos aprofundamos mais, identificamos várias outras áreas para melhoria.


Melhorias Sistemáticas de Desempenho

Principais Áreas de Melhoria

  • Reutilização de Instâncias para Operações Repetidas
  • Otimização de Processamento Concorrente
  • Alocação de Memória e Gerenciamento do Ciclo de Vida do Objeto
  • Melhorias na Renderização de PDFs Pesquisáveis

Cada uma dessas otimizações se baseou na anterior, levando às melhorias inovadoras no IronOcr 2025.2.


Principais Observações: O que Mudou?

Com essas melhorias, a atualização do IronOcr 2025.2 entregou melhorias significativas de desempenho:

Processamento Mais Rápido:

  • Agora, PDFs pesquisáveis de 24 páginas são processados 49% mais rápido (63s → 32s).
  • O processamento de múltiplos documentos melhorou em 45%.
  • O OCR de imagem única está 35% mais rápido.

Uso de Memória Mais Eficiente:

  • Alocações de objetos reduzidas em até 63%.
  • Menor fragmentação de memória levou a um desempenho mais suave.

Resultados de Benchmarks

ReadSimpleImage:

  • Versão 2025.2: 867,1 ms, 16,27% mais rápido que a versão 2024.11, 34,83% mais rápido que a versão 2025.1.

Processamento de OCR Otimizado 1

  • Memória: 81,65 MB, 31,27% menos que a versão 2024.11, 42,12% menos que a versão 2024.12.

Processamento de OCR Otimizado 2

ReadMultipleDocs:

Versão Otimizada (2025.2): 20706,6 ms, 15,61% mais rápido que a versão (2024.11).

Processamento de OCR Otimizado 3

  • Memória: 1,2 GB, 4,76% menos que Legado.
  • Versão do Pdfium: Falhou no benchmark

Processamento de OCR Otimizado 4

Aplicações no Mundo Real: Como as Empresas se Beneficiam

Jurídico e Conformidade: Digitalização de Documentos Mais Rápida

Um escritório de advocacia digitalizando contratos legais anteriormente enfrentava processamento OCR lento ao lidar com contratos escaneados de múltiplas páginas. Com o IronOcr 2025.2, eles agora podem converter contratos em PDFs pesquisáveis quase 50% mais rápido, agilizando a pesquisa de casos e as verificações de conformidade.

Saúde: Processamento Eficiente de Registros Médicos

Hospitais e clínicas muitas vezes lidam com grandes digitalizações TIFF de registros de pacientes. Antes, converter um documento de histórico médico de 24 páginas em um PDF pesquisável levava mais de um minuto. Agora, com melhor gerenciamento de memória e processamento concorrente, essa tarefa é concluída em apenas 32 segundos, permitindo acesso mais rápido a dados críticos de pacientes.

Finanças e Auditoria: Lidando com Relatórios em Lote

Firmas contábeis escaneando centenas de páginas de relatórios financeiros precisavam de uma solução para manter os tamanhos de arquivo gerenciáveis enquanto garantiam que o texto permanecesse pesquisável. Com o refinamento de renderização do IronOCR, eles agora podem processar digitalizações de vários documentos de maneira mais eficiente, reduzindo tanto o tempo de processamento quanto os tamanhos finais dos arquivos.

Pesquisa e Arquivos: Preservando Documentos Históricos

Arquivistas trabalhando com artigos de pesquisa digitalizados e documentos históricos requerem reconhecimento de texto altamente preciso enquanto mantêm os arquivos leves para armazenamento. As otimizações mais recentes permitem que eles lidem com conversões de documentos em larga escala com uma carga de processamento significativamente menor.


A Evolução dos PDFs Pesquisáveis: Um Processo, Não Apenas um Salto

A otimização não é um único salto à frente, é um processo passo a passo moldado por desafios do mundo real.

  1. 2024.11:**** Introduzida a redução de tamanho de arquivo para PDFs pesquisáveis, mas encontrou limitações de desempenho.
  2. 2024.12:**** Melhorias na renderização reduziram os tamanhos dos arquivos PDF, mas revelaram problemas de velocidade e memória com grandes TIFFs.
  3. 2025.1:** Abordou o primeiro gargalo no processamento de rotação de página, melhorando o tempo de processamento em 10%**.
  4. 2025.2: Otimizações abrangentes entregaram um aumento de desempenho de 49%, melhoraram a eficiência da memória e um manejo mais suave de grandes PDFs pesquisáveis.

Cada atualização se baseia nas lições da anterior, resultando em um mecanismo OCR que é mais rápido, mais eficiente e pronto para cargas de trabalho de alta demanda.


Experimente o Poder da Mais Recente Atualização do IronOcr

Se o seu negócio depende de processamento OCR rápido, eficiente e preciso, esta atualização IronOCR 2025.2 proporciona a velocidade e otimização necessárias.

Experimente a Chave de Teste Gratuita por 30 dias e experimente o processo!

Perguntas frequentes

Quais são os benefícios de usar a reutilização de instâncias no processamento de OCR?

A reutilização de instâncias no processamento OCR, implementada no IronOCR 2025.2, reduz a sobrecarga de criação de novas instâncias para cada operação, resultando em velocidades de processamento mais rápidas e menor consumo de memória.

Como o processamento simultâneo melhora o desempenho do OCR?

O processamento simultâneo no IronOCR 2025.2 permite que várias tarefas de OCR sejam processadas ao mesmo tempo, melhorando significativamente a velocidade e a eficiência geral do processamento de documentos.

Quais otimizações foram feitas na renderização de PDF na atualização mais recente do OCR?

A atualização mais recente do IronOCR 2025.2 inclui melhorias na renderização de PDFs, o que aumenta a qualidade e a velocidade de conversão de imagens em documentos PDF pesquisáveis.

Como o uso de memória foi aprimorado na versão mais recente do software OCR?

O uso de memória foi aprimorado no IronOCR 2025.2 por meio da otimização da alocação de memória e da redução da fragmentação, o que diminui o consumo geral de memória em até 63%.

Quais problemas foram abordados para melhorar a velocidade de processamento no software OCR?

O IronOCR 2025.2 resolveu gargalos de desempenho anteriores, como processos ineficientes de rotação de páginas, resultando em tempos de processamento significativamente mais rápidos.

Como os escritórios de advocacia podem se beneficiar da atualização mais recente do software OCR?

Escritórios de advocacia podem se beneficiar do IronOCR 2025.2, convertendo documentos jurídicos em PDFs pesquisáveis quase 50% mais rápido, o que auxilia na pesquisa eficiente e na gestão de conformidade.

Quais as vantagens que a atualização de OCR oferece para o processamento de TIFFs com várias páginas?

A atualização do IronOCR 2025.2 oferece um processamento eficiente de arquivos TIFF grandes com várias páginas, com velocidade de processamento até 49% maior e gerenciamento de memória aprimorado, tornando-o adequado para o processamento de grandes volumes de documentos.

Como o setor de saúde se beneficia do processamento OCR mais rápido?

O setor de saúde se beneficia do IronOCR 2025.2 ao processar registros de pacientes e grandes digitalizações TIFF mais rapidamente, permitindo acesso mais ágil a informações médicas essenciais.

Que melhorias foram feitas na leitura de múltiplos documentos?

O IronOCR 2025.2 aprimorou a função ReadMultipleDocs , resultando em tempos de processamento mais rápidos e uso de memória mais eficiente ao lidar com conversões em lote de documentos.

Como a atualização do OCR ajuda no arquivamento e na pesquisa?

Arquivistas e pesquisadores se beneficiam do IronOCR 2025.2 ao converter grandes volumes de documentos com sobrecarga de processamento reduzida, preservando a integridade dos documentos e garantindo um armazenamento eficiente.

Kannaopat Udonpant
Engenheiro de Software
Antes de se tornar Engenheiro de Software, Kannapat concluiu um doutorado em Recursos Ambientais pela Universidade de Hokkaido, no Japão. Durante o doutorado, Kannapat também integrou o Laboratório de Robótica Veicular, que faz parte do Departamento de Engenharia de Bioprodução. Em 2022, ele utilizou suas habilidades ...
Leia mais

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me