IRONOCR VERWENDEN

Optimierte Leistung für schnellere, effizientere OCR-Verarbeitung

Veröffentlicht 19. Februar 2025
Teilen Sie:

Im 2024.12,IronOCRführte eine Funktion ein, die die Dateigröße der erzeugten durchsuchbaren PDFs bei der Verarbeitung erheblich verringertemehrseitige TIFF-Bilder. Während diese Verbesserung kleinere Ausgabedateien ermöglichte, brachte sie auch Leistungsherausforderungen in Bezug auf Verarbeitungsgeschwindigkeit und Speicherverbrauch mit sich.

Anfängliche Optimierungen in2025.1begann mit der Bearbeitung dieser Leistungsprobleme. Die umfassenden Leistungsverbesserungen wurden später in der 2025.2-Version geliefert, die die kleineren Dateigrößen beibehielt und die Geschwindigkeits- und Speicherherausforderungen beim Umgang mit mehrseitigen Dokumenten löste.


Identifizierung des Engpasses: Seitenrotation & Verarbeitungszeit

Ein großer Leistungsengpass war die Seitenrotation. Jeder Vorgang erzeugte eine neue Instanz, anstatt bestehende wiederzuverwenden, was zu unnötiger Verarbeitungszeit und Speicherverbrauch führte. Diese Ineffizienz führte zu erhöhter Verarbeitungszeit und Speicherverbrauch, insbesondere beim Konvertieren großer TIFFs.durchsuchbare PDFs.

Optimierungsversion (IronOCR 2025.2)

Die anfängliche Korrektur in IronOCR 2025.1 konzentrierte sich auf die Optimierung der Wiederverwendung von Instanzen für die Seitenrotation. Dies führte zu einer bescheidenen Verbesserung von 10 %, wodurch die Verarbeitungszeit von 63 Sekunden auf 57 Sekunden reduziert wurde. Aber das war nur der Anfang.

Als wir tiefer eintauchten, identifizierten wir mehrere weitere Bereiche zur Verbesserung.


Systematische Leistungsverbesserungen

Wichtige Verbesserungsbereiche

  • Instanzwiederverwendung für wiederholte Operationen
  • Optimierung der gleichzeitigen Verarbeitung
  • Speicherzuteilung und Objektlebenszyklusverwaltung
  • Verbesserungen bei der Erstellung durchsuchbarer PDFs

    Jede dieser Optimierungen baute auf der vorhergehenden auf und führte zu den bahnbrechenden Verbesserungen in IronOcr 2025.2.


Wichtige Beobachtungen: Was hat sich geändert?

Mit diesen Verbesserungen hat das IronOCR 2025.2 Update bedeutende Leistungsverbesserungen gebracht:

Schnellere Verarbeitung:

  • 24-seitige durchsuchbare PDFs werden jetzt 49% schneller verarbeitet(63s → 32s).
  • Mehrdokumentenverarbeitung um 45 % verbessert.
  • Einzelbild-OCR ist 35 % schneller.

    Effizientere Speichernutzung:

  • Objektzuweisungen um bis zu 63 % reduziert.
  • Weniger Speicherfragmentierung führte zu einer reibungsloseren Leistung.


Benchmark-Ergebnisse

ReadSimpleImage

  • Version 2025.2: 867,1 ms, 16,27 % schneller als Version 2024.11, 34,83 % schneller als Version 2025.1.

    Optimized Ocr Processing 1 related to Benchmark-Ergebnisse

  • Speicher: 81,65 MB, 31,27 % weniger als die Version 2024.11, 42,12 % weniger als die Version 2024.12.

    Optimized Ocr Processing 2 related to Benchmark-Ergebnisse

    ReadMultipleDocs:

    Optimierte Version(2025.2): 20706.6 ms, 15.61% faster than (2024.11) version.

    Optimized Ocr Processing 3 related to Benchmark-Ergebnisse

  • Speicher: 1,2 GB, 4,76 % weniger als bei Legacy.
  • Pdfium-Version: Benchmark nicht bestanden

    Optimized Ocr Processing 4 related to Benchmark-Ergebnisse

Reale Anwendungen: Wie Unternehmen profitieren

Recht & Compliance: Schnellere Dokumentendigitalisierung

Eine Anwaltskanzlei, die digitale Verträge erstellte, sah sich zuvor mit langsamer OCR-Verarbeitung konfrontiert, wenn sie mehrseitige gescannte Vereinbarungen bearbeitete. Mit IronOCR 2025.2 können sie Verträge nun fast 50 % schneller in durchsuchbare PDFs umwandeln und so die Fallrecherche und Compliance-Prüfungen optimieren.

Gesundheitswesen: Effiziente Verarbeitung von medizinischen Unterlagen

Krankenhäuser und Kliniken haben oft mit großen TIFF-Scans von Patientenakten zu tun. Zuvor dauerte es über eine Minute, ein 24-seitiges medizinisches Verlaufsdokument in ein durchsuchbares PDF zu konvertieren. Jetzt wird diese Aufgabe dank verbesserter Speichermanagement und gleichzeitiger Verarbeitung in nur 32 Sekunden abgeschlossen, was einen schnelleren Zugriff auf wichtige Patientendaten ermöglicht.

Finanzen & Prüfung: Umgang mit Massenberichten

Buchhaltungsfirmen, die Hunderte von Seiten mit Finanzberichten scannen, benötigten eine Lösung, um die Dateigrößen überschaubar zu halten, während der Text durchsuchbar blieb. Mit der verbesserten Rendering-Technologie von IronOCR können nun Mehrfachdokument-Scans effizienter verarbeitet werden, wodurch sowohl die Verarbeitungszeit als auch die endgültigen Dateigrößen reduziert werden.

Forschung & Archive: Bewahrung historischer Dokumente

Archivare, die mit gescannten Forschungsarbeiten und historischen Dokumenten arbeiten, benötigen eine äußerst präzise Texterkennung, während die Dateien für die Speicherung platzsparend bleiben. Die neuesten Optimierungen ermöglichen es ihnen, groß angelegte Dokumentenkonvertierungen mit deutlich geringerer Verarbeitungsauslastung durchzuführen.


Die Entwicklung durchsuchbarer PDFs: Ein Prozess, nicht nur ein Sprung

Optimierung ist kein einzelner großer Schritt, sondern ein schrittweiser Prozess, der durch Herausforderungen in der realen Welt geprägt wird.

  1. 2024.11: Einführung der Dateigrößenreduzierung für durchsuchbare PDFs, aber auf Leistungsbeschränkungen gestoßen.

  2. 2024.12Die Verbesserungen der Rendering-Prozesse reduzierten die PDF-Dateigrößen, offenbarten jedoch Geschwindigkeits- und Speicherprobleme bei großen TIFFs.

  3. 2025.1Behandelte den ersten Engpass bei der Seitenrotation und verbesserte die Verarbeitungszeit um 10%.

  4. 2025.2: Umfassende Optimierungen führten zu einem 49% Leistungssteigerung, verbesserte Speichereffizienz und eine reibungslosere Handhabung großer durchsuchbarer PDFs.

    Jedes Update baut auf den Erfahrungen aus dem letzten auf und führt zu einer OCR-Engine, die schneller, effizienter und bereit für hoch beanspruchte Arbeitslasten ist.


Erleben Sie die Leistung des neuesten IronOCR-Updates

Wenn Ihr Unternehmen auf schnelle, effiziente und genaue OCR-Verarbeitung angewiesen ist, liefert dieses IronOCR 2025.2-Update die Geschwindigkeit und Optimierung, die Sie benötigen.

Testen Sie den kostenlosen Testschlüssel für 30 Tageund erleben Sie den Prozess! 🚀

Jordi Bardia

Jordi Bardia

Software-Ingenieur

 LinkedIn |  Website

Jordi beherrscht vor allem Python, C# und C++. Wenn er seine Fähigkeiten bei Iron Software nicht einsetzt, programmiert er Spiele. Durch seine Mitverantwortung für Produkttests, Produktentwicklung und Forschung trägt Jordi wesentlich zur kontinuierlichen Produktverbesserung bei. Die vielseitigen Erfahrungen, die er sammelt, bieten ihm immer wieder neue Herausforderungen, und er sagt, dass dies einer seiner Lieblingsaspekte bei Iron Software ist. Jordi wuchs in Miami, Florida, auf und studierte Informatik und Statistik an der University of Florida.
NÄCHSTES >
OCR-Rechnungsverarbeitung in C# (Entwickler-Tutorial)