Im 2024.12 führte IronOCR eine Funktion ein, die die Dateigröße der generierten durchsuchbaren PDFs bei der Verarbeitung von mehrseitigen TIFF-Bildern erheblich reduzierte. Während diese Verbesserung kleinere Ausgabedateien ermöglichte, brachte sie auch Leistungsherausforderungen in Bezug auf Verarbeitungsgeschwindigkeit und Speicherverbrauch mit sich.
Erste Optimierungen in 2025.1 begannen, diese Leistungsprobleme zu beheben. Die umfassenden Leistungsverbesserungen wurden später in der 2025.2-Version geliefert, die die kleineren Dateigrößen beibehielt und die Geschwindigkeits- und Speicherherausforderungen beim Umgang mit mehrseitigen Dokumenten löste.
Identifizierung des Engpasses: Seitenrotation & Verarbeitungszeit
Ein großer Leistungsengpass war die Seitenrotation. Jede Operation erstellte eine neue Instanz anstatt bestehende wiederzuverwenden, was zu unnötiger Verarbeitungszeit und Speicherverbrauch führte. Diese Ineffizienz resultierte in erhöhter Verarbeitungszeit und Speicherverbrauch, insbesondere beim Umwandeln großer TIFFs in durchsuchbare PDFs.
Optimierungsversion (IronOCR 2025.2)
Der anfängliche Fix in IronOCR 2025.1 konzentrierte sich auf die Optimierung der Instanzwiederverwendung für die Seitenrotation. Dies führte zu einer bescheidenen Verbesserung von 10 %, wodurch die Verarbeitungszeit von 63 Sekunden auf 57 Sekunden reduziert wurde. Aber das war nur der Anfang.
Als wir tiefer eintauchten, identifizierten wir mehrere weitere Bereiche zur Verbesserung.
#
Systematische Leistungsverbesserungen
Wichtige Verbesserungsbereiche
Wichtige Beobachtungen: Was hat sich geändert?
Mit diesen Verbesserungen hat das IronOCR 2025.2 Update bedeutende Leistungsverbesserungen gebracht:
✔ Schnellere Verarbeitung:
- 24-seitige durchsuchbare PDFs werden jetzt 49% schneller verarbeitet (63s → 32s).
- Mehrdokumentenverarbeitung um 45% verbessert.
Einzelbild-OCR ist 35 % schneller.
✔ Effizientere Speichernutzung:
- Objektzuweisungen um bis zu 63 % reduziert.
Weniger Speicherfragmentierung führte zu einer reibungsloseren Leistung.
Benchmark-Ergebnisse
ReadSimpleImage:
Version 2025.2: 867,1 ms, 16,27 % schneller als Version 2024.11, 34,83 % schneller als Version 2025.1.

Speicher: 81,65 MB, 31,27 % weniger als die Version 2024.11, 42,12 % weniger als die Version 2024.12.

ReadMultipleDocs:
Optimierte Version (2025.2): 20706,6 ms, 15,61 % schneller als Version (2024.11).

- Speicher: 1,2 GB, 4,76 % weniger als bei Legacy.
Pdfium-Version: Benchmark nicht bestanden

Echte Anwendungen: Wie Unternehmen profitieren
Rechtliches & Compliance: Schnellere Digitalisierung von Dokumenten
Eine Anwaltskanzlei, die digitale Verträge erstellte, sah sich zuvor mit langsamer OCR-Verarbeitung konfrontiert, wenn sie mehrseitige gescannte Vereinbarungen bearbeitete. Mit IronOCR 2025.2 können sie Verträge nun fast 50 % schneller in durchsuchbare PDFs umwandeln und so die Fallrecherche und Compliance-Prüfungen optimieren.
Gesundheitswesen: Effiziente Verarbeitung medizinischer Unterlagen
Krankenhäuser und Kliniken haben oft mit großen TIFF-Scans von Patientenakten zu tun. Zuvor dauerte es über eine Minute, ein 24-seitiges medizinisches Verlaufsdokument in ein durchsuchbares PDF zu konvertieren. Jetzt wird diese Aufgabe dank verbesserter Speichermanagement und gleichzeitiger Verarbeitung in nur 32 Sekunden abgeschlossen, was einen schnelleren Zugriff auf wichtige Patientendaten ermöglicht.
Finanzen & Prüfung: Umgang mit Massenberichten
Buchhaltungsfirmen, die Hunderte von Seiten mit Finanzberichten scannen, benötigten eine Lösung, um die Dateigrößen überschaubar zu halten, während der Text durchsuchbar blieb. Mit der verbesserten Rendering-Technologie von IronOCR können nun Mehrfachdokument-Scans effizienter verarbeitet werden, wodurch sowohl die Verarbeitungszeit als auch die endgültigen Dateigrößen reduziert werden.
Forschung & Archive: Erhaltung historischer Dokumente
Archivare, die mit gescannten Forschungsarbeiten und historischen Dokumenten arbeiten, benötigen eine äußerst präzise Texterkennung, während die Dateien für die Speicherung platzsparend bleiben. Die neuesten Optimierungen ermöglichen es ihnen, groß angelegte Dokumentenkonvertierungen mit deutlich geringerer Verarbeitungsauslastung durchzuführen.
Die Evolution von durchsuchbaren PDFs: Ein Prozess, nicht nur ein Sprung
Optimierung ist kein einzelner großer Schritt, sondern ein schrittweiser Prozess, der durch Herausforderungen in der realen Welt geprägt wird.
2024.11: Einführung der Dateigrößenreduzierung für durchsuchbare PDFs, jedoch auf Leistungsbeschränkungen gestoßen.
2024.12: Verbesserungen beim Rendering reduzierten die PDF-Dateigrößen, deckten jedoch Geschwindigkeits- und Speicherprobleme bei großen TIFFs auf.
2025.1: Das erste Nadelöhr bei der Seitenrotation verarbeitet, wodurch die Verarbeitungszeit um 10% verbessert wurde.
2025.2: Umfangreiche Optimierungen haben einen 49% Leistungszuwachs geliefert, die Speichereffizienz verbessert und die Verarbeitung großer durchsuchbarer PDFs reibungsloser gestaltet.
Jedes Update baut auf den Erkenntnissen des letzten auf und führt zu einer OCR-Engine, die schneller, effizienter und bereit für hochbelastete Arbeitslasten ist.
Erleben Sie die Leistungsfähigkeit des neuesten IronOCR-Updates
Wenn Ihr Unternehmen auf schnelle, effiziente und genaue OCR-Verarbeitung angewiesen ist, bietet dieses IronOCR 2025.2-Update die Geschwindigkeit und Optimierung, die Sie benötigen.
Kostenlosen Testschlüssel für 30 Tage ausprobieren und den Prozess erleben! 🚀