在生产环境中测试,无水印。
随时随地满足您的需求。
获得30天的全功能产品。
几分钟内就能启动并运行。
在您的产品试用期间,全面访问我们的支持工程团队。
在 2024.12,IronOCR 引入了一项功能,在处理多页 TIFF 图像时显著减少生成的可搜索 PDF 文件的大小。 虽然此改进实现了更小的输出文件,但也带来了处理速度和内存使用方面的性能挑战。
在2025.1中的初步优化开始解决这些性能问题。 全面的性能改进后来在2025.2版本中发布,该版本在解决处理多页文档时的速度和内存挑战的同时保持了较小的文件大小。
一个主要的性能瓶颈是页面旋转。 每次操作都会创建一个新的实例,而不是重用现有的实例,导致不必要的处理时间和内存消耗。这种低效导致了处理时间和内存消耗的增加,特别是在将大型TIFF转换为可搜索PDF时。
IronOCR 2025.1的初始修复专注于优化页面旋转的实例重用。 这导致了适度的10%改进,将处理时间从63秒减少到57秒。 但这只是个开始。
随着我们更深入地研究,我们发现了几个其他需要改进的领域。
可搜索PDF渲染改进
所有这些优化都是在前一个优化的基础上进行的,从而在IronOcr 2025.2中实现了突破性的改进。
通过这些增强功能,IronOCR 2025.2 更新带来了显著的性能提升:
✔ 更快的处理:
单张图像OCR快35%。
✔ 更高效的内存使用:
较少的内存碎片化导致更流畅的性能。
ReadSimpleImage:
2025.2 版本:867.1 毫秒,比 2024.11 版本快 16.27%,比 2025.1 版本快 34.83%。
内存:81.65 MB,比2024.11版本少31.27%,比2024.12版本少42.12%。
读取多个文档:
优化版本 (2025.2):20706.6 毫秒,比 (2024.11) 版本快 15.61%。
Pdfium版本:未通过基准测试
一家律师事务所在数字化法律合同时,之前在处理多页扫描协议时面临着缓慢的OCR处理问题。 使用IronOCR 2025.2,他们现在可以将合同转换为可搜索的PDF,其速度几乎提高了50%,从而简化了案件研究和合规检查。
医院和诊所经常处理大量患者记录的TIFF扫描件。 以前,将一份24页的医疗历史文件转换为可搜索的PDF需要一分钟以上。 现在,通过改进的内存管理和并发处理,该任务只需32秒即可完成,从而更快地访问关键的病人数据。
会计公司扫描数百页财务报告,需要一种解决方案,以保持文件大小可控,同时确保文本可被搜索。 通过IronOCR的精细渲染,他们现在可以更高效地处理多文档扫描,减少处理时间和最终文件大小。
档案员在处理扫描的研究论文和历史文件时,需要高度准确的文本识别,同时保持文件存储轻量化。 最新的优化使他们能够以显著较低的处理开销处理大型文档转换。
优化不是一次飞跃,而是一个由现实挑战塑造的循序渐进的过程。
2024.11:引入了可搜索PDF的文件大小缩减功能,但遇到了性能限制。
2024.12: 渲染改进减少了PDF文件大小,但在处理大型TIFF文件时暴露了速度和内存问题。
2025.1:解决了页面旋转处理中的第一个瓶颈,将处理时间提高了10%。
2025.2:全面优化带来了49%的性能提升,提高了内存效率,并更加流畅地处理大量可搜索的PDF。
每次更新都建立在以前的经验之上,从而打造出一个更快、更高效并为高需求工作负载做好准备的OCR引擎。
如果您的企业依赖于快速、高效且准确的OCR处理,那么此IronOCR 2025.2更新将提供您所需的速度和优化。
试用30天免费试用密钥,体验整个过程! 🚀