Zum Fußzeileninhalt springen
VERWENDUNG VON IRONOCR

Optimierte Leistung für schnellere, effizientere OCR-Verarbeitung

In 2024.12, IronOCR introduced a feature that significantly reduced the file size of generated searchable PDFs when processing multi-page TIFF images. Diese Verbesserung führte zwar zu kleineren Ausgabedateien, aber auch zu Leistungsproblemen bei der Verarbeitungsgeschwindigkeit und der Speichernutzung.

Erste Optimierungen in 2025.1 begannen, diese Leistungsprobleme anzugehen. Die umfassenden Leistungsverbesserungen wurden später in der Version 2025.2 umgesetzt, in der die kleineren Dateigrößen beibehalten und gleichzeitig die Geschwindigkeits- und Speicherprobleme bei der Bearbeitung mehrseitiger Dokumente gelöst wurden.


Identifizierung des Engpasses: Seitendrehung und Verarbeitungszeit

Ein großer Leistungsengpass war die Seitenrotation. Bei jedem Vorgang wurde eine neue Instanz erstellt, anstatt die vorhandenen wiederzuverwenden, was zu unnötiger Verarbeitungszeit und Speicherverbrauch führte. Diese Ineffizienz führte zu einer erhöhten Verarbeitungszeit und einem höheren Speicherverbrauch, insbesondere bei der Konvertierung großer TIFF-Dateien in durchsuchbare PDF-Dateien.

Optimierungsversion (IronOCR 2025.2)

Die erste Korrektur in IronOCR 2025.1 konzentrierte sich auf die Optimierung der Instanzwiederverwendung für die Seitenrotation. Dies führte zu einer bescheidenen Verbesserung von 10 %, wodurch die Bearbeitungszeit von 63 Sekunden auf 57 Sekunden reduziert werden konnte. Aber das war nur der Anfang.

Als wir tiefer in die Materie eindrangen, entdeckten wir mehrere andere Bereiche, die verbessert werden sollten.


Systematische Leistungsverbesserungen

Schlüsselbereiche für Verbesserungen

  • Wiederverwendung von Instanzen für wiederholte Operationen
  • Optimierung der gleichzeitigen Verarbeitung
  • Speicherzuweisung und Verwaltung des Lebenszyklus von Objekten
  • Durchsuchbare PDF-Rendering-Verbesserungen

Jede dieser Optimierungen baute auf der vorherigen auf und führte zu den bahnbrechenden Verbesserungen in IronOcr 2025.2.


Schlüsselbeobachtungen: Was hat sich geändert?

Mit diesen Erweiterungen bietet das IronOcr 2025.2-Update erhebliche Leistungsverbesserungen:

Schnellere Verarbeitung:

  • 24-seitige durchsuchbare PDFs werden jetzt 49% schneller verarbeitet (63s → 32s).
  • die Multi-Dokumenten-Verarbeitung wurde um 45% verbessert.
  • Einzelbild-OCR ist 35% schneller.

Effizientere Speichernutzung:

  • Objektzuweisungen um bis zu 63 % reduziert.
  • Weniger Speicherfragmentierung führte zu einer reibungsloseren Leistung.

Benchmark-Ergebnisse

EinfachesBild lesen:

  • version 2025.2: 867,1 ms, 16,27 % schneller als Version 2024.11, 34,83 % schneller als Version 2025.1.

Optimierte OCR-Verarbeitung 1

  • Speicher: 81,65 MB, 31,27 % weniger als Version 2024.11, 42,12 % weniger als Version 2024.12.

Optimierte OCR-Verarbeitung 2

MehrereDokumenteLesen:

Optimierte Version (2025.2): 20706.6 ms, 15,61 % schneller als die Version (2024.11).

Optimierte OCR-Verarbeitung 3

  • Speicher: 1,2 GB, 4,76 % weniger als Legacy.
  • Pdfium-Version: Den Benchmark nicht bestanden

Optimierte OCR-Verarbeitung 4

Real-World-Anwendungen: Wie Unternehmen davon profitieren

Rechtliche & Compliance: Schnelleres Digitalisieren von Dokumenten

Eine Anwaltskanzlei, die juristische Verträge digitalisiert, hatte bisher mit einer langsamen OCR-Verarbeitung zu kämpfen, wenn es um mehrseitige gescannte Verträge ging. Mit IronOcr 2025.2 können sie nun Verträge fast 50 % schneller in durchsuchbare PDFs umwandeln und so die Fallrecherche und die Überprüfung der Einhaltung von Vorschriften rationalisieren.

Gesundheitswesen: Effiziente Verarbeitung von Krankenakten

Krankenhäuser und Kliniken haben oft mit großen TIFF-Scans von Patientenakten zu tun. Früher dauerte die Konvertierung eines 24-seitigen Dokuments zur Krankengeschichte in eine durchsuchbare PDF-Datei über eine Minute. Dank verbesserter Speicherverwaltung und gleichzeitiger Verarbeitung wird diese Aufgabe nun in nur 32 Sekunden erledigt, was einen schnelleren Zugriff auf wichtige Patientendaten ermöglicht.

Finanzen und Rechnungsprüfung: Umgang mit Massenberichten

Buchhaltungsunternehmen, die Hunderte von Seiten an Finanzberichten scannen, benötigten eine Lösung, um die Dateigrößen überschaubar zu halten und gleichzeitig sicherzustellen, dass der Text durchsuchbar bleibt. Mit dem verfeinerten Rendering von IronOCR können sie nun Scans von mehreren Dokumenten effizienter verarbeiten, was sowohl die Verarbeitungszeit als auch die endgültige Dateigröße reduziert.

Forschung und Archive: Bewahrung historischer Dokumente

Archivare, die mit gescannten Forschungspapieren und historischen Dokumenten arbeiten, benötigen eine hochpräzise Texterkennung, wobei die Dateien für die Speicherung leicht sein müssen. Dank der neuesten Optimierungen können sie umfangreiche Dokumentenkonvertierungen mit deutlich geringerem Verarbeitungsaufwand durchführen.


Die Entwicklung von durchsuchbaren PDFs: Ein Prozess, nicht nur ein Sprung

Die Optimierung ist kein einmaliger Sprung nach vorn, sondern ein schrittweiser Prozess, der von realen Herausforderungen geprägt ist.

  1. 2024.11: Die Dateigrößenreduzierung für durchsuchbare PDFs wurde eingeführt, stieß jedoch auf Leistungseinschränkungen.
  2. 2024.12: Rendering-Verbesserungen reduzierten die Größe von PDF-Dateien, zeigten aber Geschwindigkeits- und Speicherprobleme bei großen TIFF-Dateien.
  3. 2025.1: Behebung des ersten Engpasses bei der Verarbeitung der Seitenrotation, Verbesserung der Verarbeitungszeit um 10%.
  4. 2025.2: Umfassende Optimierungen brachten eine 49%ige Leistungssteigerung, eine verbesserte Speichereffizienz und einen reibungsloseren Umgang mit großen durchsuchbaren PDFs.

Jede Aktualisierung baut auf den Erkenntnissen der letzten auf und führt zu einer OCR-Engine, die schneller, effizienter und bereit für hohe Arbeitslasten ist.


Erleben Sie die Leistungsfähigkeit des neuesten IronOcr Updates

Wenn Ihr Unternehmen auf eine schnelle, effiziente und genaue OCR-Verarbeitung angewiesen ist, bietet dieses IronOCR 2025.2 Update die Geschwindigkeit und Optimierung, die Sie benötigen.

Testen Sie den kostenlosen Testschlüssel für 30 Tage und erleben Sie den Prozess!

Häufig gestellte Fragen

Welche Vorteile bietet die Instanzwiederverwendung in der OCR-Verarbeitung?

Die Instanzwiederverwendung in der OCR-Verarbeitung, wie in IronOCR 2025.2 implementiert, reduziert den Aufwand für das Erstellen neuer Instanzen für jede Operation, was zu schnelleren Verarbeitungszeiten und geringerer Speicherbelastung führt.

Wie verbessert die gleichzeitige Verarbeitung die OCR-Leistung?

Die gleichzeitige Verarbeitung in IronOCR 2025.2 ermöglicht die gleichzeitige Verarbeitung mehrerer OCR-Aufgaben, was die Geschwindigkeit und Effizienz der Dokumentverarbeitung erheblich verbessert.

Welche Optimierungen wurden in der neuesten OCR-Aktualisierung an der PDF-Darstellung vorgenommen?

Das neueste Update in IronOCR 2025.2 umfasst eine verbesserte PDF-Darstellung, die die Qualität und Geschwindigkeit der Umwandlung von Bildern in darstellbare PDF-Dokumente verbessert.

Wie wird in der neuesten Version der OCR-Software die Speichernutzung verbessert?

Die Speichernutzung wird in IronOCR 2025.2 durch Optimierung der Speicherzuweisung und Reduzierung der Fragmentierung verbessert, wodurch der Gesamtverbrauch um bis zu 63 % gesenkt wird.

Welche Probleme wurden behandelt, um die Verarbeitungsgeschwindigkeit in der OCR-Software zu verbessern?

IronOCR 2025.2 hat frühere Leistungsengpässe, wie ineffiziente Seitenrotation, behoben, was zu deutlich schnelleren Verarbeitungszeiten führte.

Wie können Rechtsanwälte von der neuesten OCR-Softwareaktualisierung profitieren?

Rechtsanwälte können von IronOCR 2025.2 profitieren, indem sie juristische Dokumente nahezu 50 % schneller in durchsuchbare PDFs umwandeln, was bei effizienter Recherche und Compliance-Management hilft.

Welche Vorteile bietet das OCR-Update für die Verarbeitung von mehrseitigen TIFFs?

Das Update in IronOCR 2025.2 bietet effiziente Handhabung großer mehrseitiger TIFFs, mit bis zu 49 % schnellerer Verarbeitung und verbesserter Speicherverwaltung, was es für die Bearbeitung großer Dokumentenmengen geeignet macht.

Wie profitiert die Gesundheitsbranche von der schnelleren OCR-Verarbeitung?

Die Gesundheitsbranche profitiert von IronOCR 2025.2, indem Patientenakten und große TIFF-Scans schneller verarbeitet werden, was einen schnelleren Zugriff auf wichtige medizinische Informationen ermöglicht.

Welche Verbesserungen wurden beim Lesen mehrerer Dokumente vorgenommen?

IronOCR 2025.2 hat die ReadMultipleDocs-Funktion verbessert, was zu schnelleren Verarbeitungszeiten und effizienterer Speichernutzung bei der Bearbeitung von Massendokumentkonvertierungen führt.

Wie hilft das OCR-Update beim Archivieren und der Forschung?

Archivare und Forscher profitieren von IronOCR 2025.2, indem sie große Dokumentmengen mit reduziertem Verarbeitungsaufwand umwandeln, die Integrität der Dokumente bewahren und gleichzeitig eine effiziente Speicherung sicherstellen.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen