Passer au contenu du pied de page
UTILISATION D'IRONOCR

Performances optimisées pour un traitement OCR plus rapide et plus efficace

En 2024.12, IronOCR a introduit une fonctionnalité qui a significativement réduit la taille des fichiers des PDF générés lors du traitement des images TIFF multipages. Bien que cette amélioration ait permis de réduire la taille des fichiers sortis, elle a également introduit des défis de performance concernant la vitesse de traitement et l'utilisation de la mémoire.

Les optimisations initiales en 2025.1 ont commencé à résoudre ces problèmes de performance. Les améliorations de performance complètes ont été livrées dans la version 2025.2, qui a conservé les tailles de fichier réduites tout en résolvant les défis de vitesse et de mémoire lors du traitement des documents multipages.


Identifier le goulot d'étranglement : Rotation des pages et temps de traitement

Un des principaux goulots d'étranglement de la performance était la rotation des pages. Chaque opération créait une nouvelle instance au lieu de réutiliser les existantes, entraînant un temps de traitement et une consommation de mémoire inutiles. Cette inefficacité résultait en un temps de traitement et une consommation de mémoire accrus, en particulier lors de la conversion de grands TIFF en PDF consultables.

Version d'optimisation (IronOCR 2025.2)

La correction initiale dans IronOCR 2025.1 a porté sur l'optimisation de la réutilisation des instances pour la rotation des pages. Cela a conduit à une amélioration modeste de 10%, réduisant le temps de traitement de 63 secondes à 57 secondes. Mais ce n'était que le début.

En approfondissant, nous avons identifié plusieurs autres domaines d'amélioration.


Améliorations systématiques des performances

Principaux domaines d'amélioration

  • Réutilisation des instances pour les opérations répétées
  • Optimisation du traitement concurrent
  • Gestion de l'allocation mémoire et du cycle de vie des objets
  • Améliorations du rendu des PDF consultables

Chacune de ces optimisations s'est construite sur la précédente, menant aux améliorations révolutionnaires dans IronOcr 2025.2.


Observations clés : Qu'est-ce qui a changé ?

Avec ces améliorations, la mise à jour IronOcr 2025.2 a apporté des améliorations significatives de performance :

Traitement plus rapide :

  • Les PDF consultables de 24 pages sont désormais traités 49% plus vite (63s → 32s).
  • Le traitement de multi-documents a été amélioré de 45%.
  • L'OCR d'une seule image est 35% plus rapide.

Utilisation de la mémoire plus efficace :

  • Les allocations d'objets ont été réduites jusqu'à 63%.
  • Moins de fragmentation mémoire a conduit à des performances plus fluides.

Résultats des benchmarks

ReadSimpleImage :

  • Version 2025.2 : 867,1 ms, soit 16,27% plus rapide que la version 2024.11, 34,83% plus rapide que la version 2025.1.

Optimisation du traitement OCR 1

  • Mémoire : 81,65 Mo, 31,27% de moins que la version 2024.11, 42,12% de moins que la version 2024.12.

Optimisation du traitement OCR 2

ReadMultipleDocs :

Version optimisée (2025.2) : 20706,6 ms, 15,61% plus rapide que la version (2024.11).

Optimisation du traitement OCR 3

  • Mémoire : 1,2 Go, 4,76% de moins que Legacy.
  • Version Pdfium : N'a pas réussi le benchmark

Optimisation du traitement OCR 4

Applications du monde réel : Comment les entreprises en bénéficient

Légal et conformité : Numérisation plus rapide des documents

Un cabinet d'avocats numérisant des contrats légaux rencontrait auparavant un traitement OCR lent lors de la gestion d'accords scannés multipages. Avec IronOcr 2025.2, ils peuvent désormais convertir les contrats en PDF consultables près de 50% plus vite, rationalisant la recherche de cas et les vérifications de conformité.

Santé : Traitement efficace des dossiers médicaux

Les hôpitaux et cliniques traitent souvent de grandes numérisations TIFF de dossiers patients. Auparavant, convertir un document d'historique médical de 24 pages en PDF consultable prenait plus d'une minute. Désormais, avec une gestion de la mémoire et un traitement concurrent améliorés, cette tâche est réalisée en seulement 32 secondes, permettant un accès plus rapide aux données critiques des patients.

Finance et audit : Gestion des rapports en vrac

Les cabinets comptables scannant des centaines de pages de rapports financiers avaient besoin d'une solution pour garder les tailles de fichiers gérables tout en assurant la consultabilité du texte. Avec le rendu affiné d'IronOCR, ils peuvent désormais traiter plus efficacement les numérisations de plusieurs documents, réduisant à la fois le temps de traitement et les tailles finales des fichiers.

Recherche et archives : Préservation des documents historiques

Les archivistes travaillant avec des articles de recherche scannés et des documents historiques nécessitent une reconnaissance de texte très précise tout en gardant les fichiers légers pour le stockage. Les dernières optimisations leur permettent de gérer les conversions de documents à grande échelle avec des charges de traitement significativement réduites.


L'évolution des PDF consultables : Un processus, pas seulement un bond en avant

L'optimisation n'est pas un bond en avant singulier, c'est un processus étape par étape façonné par les défis du monde réel.

  1. 2024.11 : Introduction de la réduction de taille de fichier pour les PDF consultables, mais des limitations de performance ont été rencontrées.
  2. 2024.12 : Des améliorations de rendu ont réduit les tailles de fichiers PDF mais ont révélé des problèmes de vitesse et de mémoire avec les grands TIFF.
  3. 2025.1 : Solution du premier goulot d'étranglement dans le traitement de la rotation des pages, améliorant le temps de traitement de 10%.
  4. 2025.2 : Optimisations complètes offrant une amélioration de performance de 49%, une plus grande efficacité de la mémoire, et une gestion plus fluide des grands PDF consultables.

Chaque mise à jour s'appuie sur les leçons de la précédente, résultant en un moteur OCR plus rapide, plus efficace, et prêt pour les charges de travail exigeantes.


Découvrez la puissance de la dernière mise à jour IronOcr

Si votre entreprise dépend d'un traitement OCR rapide, efficace et précis, cette mise à jour IronOCR 2025.2 fournit la vitesse et l'optimisation nécessaires.

Essayez la clé d'essai gratuite pendant 30 jours et découvrez le processus !

Questions Fréquemment Posées

Quels sont les avantages de l'utilisation de la réutilisation des instances dans le traitement OCR ?

La réutilisation des instances dans le traitement OCR, telle qu'implémentée dans IronOCR 2025.2, réduit les frais généraux de création de nouvelles instances pour chaque opération, conduisant à des vitesses de traitement plus rapides et une consommation de mémoire réduite.

Comment le traitement simultané améliore-t-il la performance OCR ?

Le traitement simultané dans IronOCR 2025.2 permet de traiter plusieurs tâches OCR simultanément, améliorant considérablement la vitesse et l'efficacité globales du traitement des documents.

Quelles optimisations ont été apportées au rendu PDF dans la dernière mise à jour OCR ?

La dernière mise à jour d'IronOCR 2025.2 inclut un meilleur rendu PDF, ce qui améliore la qualité et la vitesse de conversion des images en documents PDF consultables.

Comment l'utilisation de la mémoire est-elle améliorée dans la dernière version du logiciel OCR ?

L'utilisation de la mémoire est améliorée dans IronOCR 2025.2 en optimisant l'allocation de la mémoire et en réduisant la fragmentation, ce qui diminue la consommation globale de mémoire jusqu'à 63 %.

Quels problèmes ont été résolus pour améliorer la vitesse de traitement dans le logiciel OCR ?

IronOCR 2025.2 a résolu des goulots d'étranglement de performance, tels que les processus de rotation de pages inefficaces, ce qui a entraîné des temps de traitement significativement plus rapides.

Comment les cabinets d'avocats peuvent-ils bénéficier de la dernière mise à jour du logiciel OCR ?

Les cabinets d'avocats peuvent bénéficier d'IronOCR 2025.2 en convertissant des documents juridiques en PDF consultables presque 50 % plus rapidement, ce qui aide à la recherche efficace et à la gestion de la conformité.

Quels avantages la mise à jour OCR offre-t-elle pour le traitement des TIFFs multi-pages ?

La mise à jour d'IronOCR 2025.2 offre une gestion efficace des grands TIFFs multi-pages, avec un traitement jusqu'à 49 % plus rapide et une meilleure gestion de la mémoire, ce qui le rend adapté au traitement de documents à haut volume.

Comment le secteur de la santé profite-t-il du traitement OCR plus rapide ?

Le secteur de la santé bénéficie d'IronOCR 2025.2 en traitant plus rapidement les dossiers des patients et les grandes numérisations TIFF, permettant un accès plus rapide aux informations médicales critiques.

Quelles améliorations ont été apportées à la lecture de plusieurs documents ?

IronOCR 2025.2 a amélioré la fonction ReadMultipleDocs, entraînant des temps de traitement plus rapides et une utilisation plus efficace de la mémoire lors de la gestion de conversions de documents en masse.

Comment la mise à jour OCR aide-t-elle dans l'archivage et la recherche ?

Les archivistes et les chercheurs bénéficient d'IronOCR 2025.2 en convertissant de grands volumes de documents avec une surcharge de traitement réduite, préservant l'intégrité des documents tout en assurant un stockage efficace.

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Pendant qu'il poursuivait son diplôme, Kannapat est également devenu membre du laboratoire de robotique de véhicules, qui fait partie du département de bioproduction. En 2022, il a utilisé ses compé...
Lire la suite