Passer au contenu du pied de page
UTILISATION D'IRONOCR

Performances optimisées pour un traitement OCR plus rapide et plus efficace

In 2024.12, IronOCR introduced a feature that significantly reduced the file size of generated searchable PDFs when processing multi-page TIFF images. Si cette amélioration a permis d'obtenir des fichiers de sortie plus petits, elle a également posé des problèmes de performance en termes de vitesse de traitement et d'utilisation de la mémoire.

Les optimisations initiales dans 2025.1 ont commencé à résoudre ces problèmes de performance. Les améliorations globales des performances ont été apportées ultérieurement dans la version 2025.2, qui a maintenu la taille réduite des fichiers tout en résolvant les problèmes de vitesse et de mémoire lors de la gestion de documents multipages.


Identifier le goulot d'étranglement : Rotation des pages et temps de traitement

L'un des principaux goulets d'étranglement en matière de performances était la rotation des pages. Chaque opération créait une nouvelle instance au lieu de réutiliser les instances existantes, ce qui entraînait un temps de traitement et une consommation de mémoire inutiles. Cette inefficacité a entraîné une augmentation du temps de traitement et de la consommation de mémoire, en particulier lors de la conversion de fichiers TIFF volumineux en PDF consultables.

Version d'optimisation (IronOcr 2025.2)

Le correctif initial dans IronOCR 2025.1 s'est concentré sur l'optimisation de la réutilisation des instances pour la rotation des pages. Cela a permis une amélioration modeste de 10 %, réduisant le temps de traitement de 63 à 57 secondes. Mais ce n'était que le début.

En approfondissant la question, nous avons identifié plusieurs autres domaines susceptibles d'être améliorés.


Améliorations systématiques des performances

Principaux domaines d'amélioration

  • Réutilisation d'instances pour des opérations répétées
  • Optimiser le traitement simultané
  • Allocation de mémoire et gestion du cycle de vie des objets
  • Amélioration du rendu des PDF consultables

Chacune de ces optimisations s'est appuyée sur la précédente, ce qui a conduit aux améliorations révolutionnaires d'IronOcr 2025.2.


Observations clés : Qu'est-ce qui a changé ?

Grâce à ces améliorations, la mise à jour IronOcr 2025.2 a permis d'améliorer considérablement les performances :

Traitement plus rapide :

  • <Les PDF de 24 pages interrogeables sont désormais traités 49% plus rapidement (63s → 32s).
  • Traitement multi-documents amélioré de 45%.
  • <L'OCR d'une seule image est 35% plus rapide.

Utilisation plus efficace de la mémoire :

  • Les attributions d'objets ont été réduites jusqu'à 63 %.
  • La réduction de la fragmentation de la mémoire a permis d'améliorer les performances.

Résultats du benchmarking

LireSimpleImage:

  • version 2025.2 : 867.1 ms, 16.27% plus rapide que la version 2024.11, 34.83% plus rapide que la version 2025.1.

Traitement OCR optimisé 1

  • Mémoire : 81.65 MB, 31.27% de moins que la version 2024.11, 42.12% de moins que la version 2024.12.

Traitement OCR optimisé 2

LireMultipleDocs:

Version optimisée (2025.2) : 20706.6 ms, 15,61% plus rapide que la version (2024.11).

Traitement OCR optimisé 3

  • Mémoire : 1,2 Go, soit 4,76 % de moins que l'ancienne version.
  • Version Pdfium : Échec au test de référence

Traitement OCR optimisé 4

Applications dans le monde réel : Les avantages pour les entreprises

Juridique et conformité : Numérisation plus rapide des documents

Un cabinet d'avocats qui numérise des contrats juridiques se heurtait auparavant à la lenteur du traitement OCR lorsqu'il traitait des accords numérisés de plusieurs pages. Avec IronOcr 2025.2, ils peuvent désormais convertir les contrats en PDF consultables près de 50 % plus rapidement, ce qui simplifie la recherche de cas et les contrôles de conformité.

Santé : Traitement efficace des dossiers médicaux

Les hôpitaux et les cliniques ont souvent affaire à des scans TIFF de grande taille de dossiers de patients. Auparavant, la conversion d'un document de 24 pages sur les antécédents médicaux en un PDF interrogeable prenait plus d'une minute. Aujourd'hui, grâce à une meilleure gestion de la mémoire et à un traitement simultané, cette tâche est réalisée en seulement 32 secondes, ce qui permet un accès plus rapide aux données critiques des patients.

Finances et audit : Traitement des rapports en masse

Les cabinets comptables qui numérisent des centaines de pages de rapports financiers avaient besoin d'une solution permettant de gérer la taille des fichiers tout en garantissant que le texte reste consultable. Grâce au rendu affiné d'IronOcr, ils peuvent désormais traiter plus efficacement les numérisations de plusieurs documents, ce qui réduit à la fois le temps de traitement et la taille des fichiers finaux.

Recherche et archives : Préserver les documents historiques

Les archivistes qui travaillent avec des documents de recherche et des documents historiques numérisés ont besoin d'une reconnaissance de texte très précise tout en conservant des fichiers légers pour le stockage. Les dernières optimisations leur permettent de gérer des conversions de documents à grande échelle avec des frais généraux de traitement considérablement réduits.


L'évolution des PDF consultables : Un processus, pas seulement un saut

L'optimisation n'est pas un simple bond en avant, c'est un processus progressif façonné par les défis du monde réel.

  1. 2024.11: Introduction de la réduction de la taille des fichiers pour les PDF consultables, mais limitation des performances.
  2. 2024.12:Les améliorations apportées au rendu ont permis de réduire la taille des fichiers PDF, mais ont révélé des problèmes de vitesse et de mémoire avec les grands fichiers TIFF.
  3. 2025.1:Le premier goulot d'étranglement dans le traitement de la rotation des pages a été résolu, ce qui a permis d'améliorer le temps de traitement de 10 %.
  4. 2025.2: Des optimisations complètes ont permis d'augmenter les performances de 49%, d'améliorer l'efficacité de la mémoire et de mieux gérer les PDF de grande taille pouvant faire l'objet d'une recherche.

Chaque mise à jour s'appuie sur les enseignements de la précédente, ce qui permet d'obtenir un moteur d'OCR plus rapide, plus efficace et prêt pour les charges de travail à forte demande.


Expérimentez la puissance de la dernière mise à jour d'IronOcr

Si votre entreprise s'appuie sur un traitement OCR rapide, efficace et précis, cette mise à jour d'IronOcr 2025.2 vous offre la vitesse et l'optimisation dont vous avez besoin.

Essayez la clé d'essai gratuite pendant 30 jours et découvrez le processus !

Questions Fréquemment Posées

Quels sont les avantages de l'utilisation de la réutilisation des instances dans le traitement OCR ?

La réutilisation des instances dans le traitement OCR, telle qu'implémentée dans IronOCR 2025.2, réduit les frais généraux de création de nouvelles instances pour chaque opération, conduisant à des vitesses de traitement plus rapides et une consommation de mémoire réduite.

Comment le traitement simultané améliore-t-il la performance OCR ?

Le traitement simultané dans IronOCR 2025.2 permet de traiter plusieurs tâches OCR simultanément, améliorant considérablement la vitesse et l'efficacité globales du traitement des documents.

Quelles optimisations ont été apportées au rendu PDF dans la dernière mise à jour OCR ?

La dernière mise à jour d'IronOCR 2025.2 inclut un meilleur rendu PDF, ce qui améliore la qualité et la vitesse de conversion des images en documents PDF consultables.

Comment l'utilisation de la mémoire est-elle améliorée dans la dernière version du logiciel OCR ?

L'utilisation de la mémoire est améliorée dans IronOCR 2025.2 en optimisant l'allocation de la mémoire et en réduisant la fragmentation, ce qui diminue la consommation globale de mémoire jusqu'à 63 %.

Quels problèmes ont été résolus pour améliorer la vitesse de traitement dans le logiciel OCR ?

IronOCR 2025.2 a résolu des goulots d'étranglement de performance, tels que les processus de rotation de pages inefficaces, ce qui a entraîné des temps de traitement significativement plus rapides.

Comment les cabinets d'avocats peuvent-ils bénéficier de la dernière mise à jour du logiciel OCR ?

Les cabinets d'avocats peuvent bénéficier d'IronOCR 2025.2 en convertissant des documents juridiques en PDF consultables presque 50 % plus rapidement, ce qui aide à la recherche efficace et à la gestion de la conformité.

Quels avantages la mise à jour OCR offre-t-elle pour le traitement des TIFFs multi-pages ?

La mise à jour d'IronOCR 2025.2 offre une gestion efficace des grands TIFFs multi-pages, avec un traitement jusqu'à 49 % plus rapide et une meilleure gestion de la mémoire, ce qui le rend adapté au traitement de documents à haut volume.

Comment le secteur de la santé profite-t-il du traitement OCR plus rapide ?

Le secteur de la santé bénéficie d'IronOCR 2025.2 en traitant plus rapidement les dossiers des patients et les grandes numérisations TIFF, permettant un accès plus rapide aux informations médicales critiques.

Quelles améliorations ont été apportées à la lecture de plusieurs documents ?

IronOCR 2025.2 a amélioré la fonction ReadMultipleDocs, entraînant des temps de traitement plus rapides et une utilisation plus efficace de la mémoire lors de la gestion de conversions de documents en masse.

Comment la mise à jour OCR aide-t-elle dans l'archivage et la recherche ?

Les archivistes et les chercheurs bénéficient d'IronOCR 2025.2 en convertissant de grands volumes de documents avec une surcharge de traitement réduite, préservant l'intégrité des documents tout en assurant un stockage efficace.

Kannaopat Udonpant
Ingénieur logiciel
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Pendant qu'il poursuivait son diplôme, Kannapat est également devenu membre du laboratoire de robotique de véhicules, qui fait partie du département de bioproduction. En 2022, il a utilisé ses compé...
Lire la suite