在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
在2024.12,IronOCR引入了一項功能,在處理時顯著減少生成的可搜尋 PDF 的文件大小多頁TIFF影像. 雖然此改進實現了較小的輸出文件,但也在處理速度和記憶體使用方面引入了性能挑戰。
初步優化在2025.1開始解決這些性能問題。 全面性的性能改進在2025.2版本中推出,該版本在處理多頁文件時保持了較小的文件大小,同時解決了速度和內存的問題。
一個主要的效能瓶頸是頁面旋轉。 每次操作都創建了一個新實例,而不是重用現有的實例,導致不必要的處理時間和記憶體消耗。這種效率低下尤其在將大型TIFF文件轉換為其他格式時導致了處理時間和記憶體消耗的增加。可搜索的PDF檔.
IronOCR 2025.1 的初始修正重點在於優化實例重用以進行頁面旋轉。 這導致了10%的小幅改善,將處理時間從63秒減少到57秒。 但這只是開始。
隨著我們深入探索,我們發現了其他幾個需改進的地方。
可搜索 PDF 渲染改進
這些優化中的每一項都是建立在上一項的基礎上,從而帶來了IronOcr 2025.2的突破性改進。
這些改進使 IronOCR 2025.2 更新帶來了顯著的性能提升:
✔ 更快的處理速度:
單張影像OCR快35%。
✔ 更有效的記憶體使用:
較少的記憶體碎片化導致更順暢的性能。
ReadSimpleImage(读取简单图像):
2025.2 版本:867.1 毫秒,比 2024.11 版本快 16.27%,比 2025.1 版本快 34.83%。
記憶體:81.65 MB,比2024.11版本少31.27%,比2024.12版本少42.12%。
讀取多個文件
優化版本(2025.2): 20706.6 毫秒,比快 15.61%(2024.11)版本。
Pdfium 版本:未通過基準測試
一家律師事務所數位化法律合同時,之前在處理多頁掃描協議時面臨慢速的OCR處理。 利用 IronOCR 2025.2,他們現在可以將合約轉換為可搜尋的 PDF,其速度快近 50%,從而簡化案件研究和合規檢查。
醫院和診所經常處理患者記錄的大型 TIFF 掃描檔。 以前,將一份24頁的病歷文檔轉換為可搜尋的PDF需要超過一分鐘。 現在,透過改進的記憶體管理和並行處理,這項任務僅需 32 秒即可完成,從而更快地訪問關鍵的患者數據。
會計公司掃描數百頁的財務報告需要一個解決方案來保持文件大小的可控,同時確保文字保持可搜尋。 透過IronOCR的精細渲染,他們現在可以更有效率地處理多文件掃描,減少處理時間和最終檔案大小。
從事掃描研究論文和歷史文件的檔案管理員需要高度準確的文字識別,同時保持文件存儲的輕量化。 最新的優化使他們能夠處理大規模的文件轉換,並顯著降低處理開銷。
優化不是一個單一的飛躍,而是一個由現實世界的挑戰塑造的逐步過程。
2024.11引入搜尋式 PDF 文件大小減少功能,但遇到了效能限制。
2.2024.12渲染改進減少了 PDF 文件的大小,但暴露了大型 TIFF 圖像的速度和記憶體問題。
2025.1改進了頁面旋轉處理的第一個瓶頸,將處理時間提高了10%。
2025.2: 全面的優化提升了 49% 的性能,改善了記憶體效率,並使大容量可搜索 PDF 的處理更加順暢。
每次更新都建立在先前的經驗之上,從而使得 OCR 引擎變得更快、更高效,並為高需求的工作負載做好準備。
如果您的業務依賴於快速、高效且準確的 OCR 處理,此IronOCR 2025.2 更新將提供您所需的速度和優化。
試用免費試用密鑰30天並體驗過程! 🚀