在生產環境中測試,無水印。
在任何需要的地方都能運行。
獲得 30 天的全功能產品。
在幾分鐘內上手運行。
試用產品期間完全訪問我們的支援工程團隊
在2024.12,IronOCR 引入了一項功能,顯著減少了在處理多頁TIFF圖像時生成的可搜索PDF的文件大小。 雖然此改進實現了較小的輸出文件,但也在處理速度和記憶體使用方面引入了性能挑戰。
初步優化在2025.1開始解決這些性能問題。 全面性的性能改進在2025.2版本中推出,該版本在處理多頁文件時保持了較小的文件大小,同時解決了速度和內存的問題。
一個主要的效能瓶頸是頁面旋轉。 每個操作都創建了一個新的實例,而不是重用現有的實例,導致不必要的處理時間和記憶體消耗。這種低效率特別在將大型 TIFF 轉換為可搜尋 PDF 時,導致處理時間和記憶體消耗增加。
IronOCR 2025.1 的初始修正重點在於優化實例重用以進行頁面旋轉。 這導致了10%的小幅改善,將處理時間從63秒減少到57秒。 但這只是開始。
隨著我們深入探索,我們發現了其他幾個需改進的地方。
可搜索 PDF 渲染改進
每一個這些優化都是在上一個基礎上構建的,從而帶來了IronOcr 2025.2的突破性改進。
這些改進使 IronOCR 2025.2 更新帶來了顯著的性能提升:
✔ 更快的處理:
單張影像的OCR**速度提升35%**。
✔ 更高效的記憶體使用:
較少的記憶體碎片化導致更順暢的性能。
ReadSimpleImage:
2025.2 版本:867.1 毫秒,比 2024.11 版本快 16.27%,比 2025.1 版本快 34.83%。
記憶體:81.65 MB,比2024.11版本少31.27%,比2024.12版本少42.12%。
ReadMultipleDocs:
優化版本 (2025.2): 20706.6 毫秒,比 (2024.11) 版本快 15.61%。
Pdfium 版本:未通過基準測試
一家律師事務所數位化法律合同時,之前在處理多頁掃描協議時面臨慢速的OCR處理。 利用 IronOCR 2025.2,他們現在可以將合約轉換為可搜尋的 PDF,其速度快近 50%,從而簡化案件研究和合規檢查。
醫院和診所經常處理患者記錄的大型 TIFF 掃描檔。 以前,將一份24頁的病歷文檔轉換為可搜尋的PDF需要超過一分鐘。 現在,透過改進的記憶體管理和並行處理,這項任務僅需 32 秒即可完成,從而更快地訪問關鍵的患者數據。
會計公司掃描數百頁的財務報告需要一個解決方案來保持文件大小的可控,同時確保文字保持可搜尋。 透過IronOCR的精細渲染,他們現在可以更有效率地處理多文件掃描,減少處理時間和最終檔案大小。
從事掃描研究論文和歷史文件的檔案管理員需要高度準確的文字識別,同時保持文件存儲的輕量化。 最新的優化使他們能夠處理大規模的文件轉換,並顯著降低處理開銷。
優化不是一個單一的飛躍,而是一個由現實世界的挑戰塑造的逐步過程。
2024.11:引入了可搜索 PDF 文件的大小減少功能,但遇到了性能限制。
2024.12:渲染改進減少了 PDF 檔案大小,但暴露了大 TIFF 文件的速度和記憶體問題。
2025.1:解決了頁面旋轉處理中的第一個瓶頸,處理時間提高了10%。
2025.2:全面的優化帶來了49% 的效能提升,提高了記憶體效能,並對大型可搜索 PDF 的處理更為流暢。
每次更新都建立在上一次的經驗教訓之上,從而打造出一個速度更快、更高效,並準備好應對高需求工作負載的OCR引擎。
如果您的業務依賴於快速、高效和準確的OCR處理,這次IronOCR 2025.2更新提供您所需的速度和優化。
嘗試30天免費試用金鑰,體驗這個過程! 🚀