变更日志:更新、里程碑、路线图

This article was translated from English: Does it need improvement?
Translated
View the article in English

[{hpt:chngLogFrm}]

IronOCR 路线图

我们开发了IronOCR来填补市场需求,它已成为我们的主打产品之一。 今天,我们不断根据社区需求推出新的功能请求。

我们积极使用谷歌最新的Tesseract技术以提高稳定性和高准确性。

这确保了我们的客户受益于最先进的OCR读取引擎。

我们的每月发布中,IronOCR不断证明其价值,并推动我们的使命,帮助终端用户推动.NET语言的发展。

我们知道IronOCR是开发人员的首选之一。 为了将IronOCR确立为同类产品中的领导者,我们正在应用最新技术来改进图像过滤器、计算机视觉和机器学习。

我们的下一个重大目标是推出适用于多种编程语言的IronOCR。 ¹ 基于 2022 年 6 月进行的客户调查。


2024年12月

IronOCR v2024.12.2

024年12月3日
版本 2024.12.2
查看 IronOCR v2024.12.2 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2024.12.2

发布说明:

  • IronSoftware.System.Drawing 依赖项更新到 2024.12.3

2024年11月

IronOCR v2024.11.3

024年10月11日
版本 2024.11.3
查看 IronOCR v2024.11.3 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2024.11.3

发布说明:

  • IronSoftware.System.Drawing 依赖项更新到 2024.9.15。
  • 减少可搜索PDF文件在大多数用例中的文件大小。
  • 修复了可搜索PDF中尺寸不一致的问题。
  • 添加了一个新的 Tesseract 配置 AutoRotateDetectionForRenderSearchablePdf,使用户可以禁用自动旋转并手动调整输入文件的方向。

2024年10月

IronOCR v2024.10.3

024年10月3日
版本2024.10.3
查看 IronOCR v2024.10.3 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2024.10.3

发布说明:

  • 改进了对旋转输入的 ReadPassport
  • 更新 IronSoftware.System.Drawing 依赖项至 2024.9.11

2024年9月

IronOCR v2024.9.6

024年9月9日
版本 2024.9.6
查看 IronOCR v2024.9.6 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2024.9.6

发布说明:

  • 添加了一种新的读取方法 ReadDocumentAdvanced,专门用于表格数据读取。
  • IronSoftware.System.Drawing 依赖项更新为 2024.9.10

2024年8月

IronOCR v2024.8.21

024年7月31日
版本 2024.8.21
查看 IronOCR v2024.8.21 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2024.8.21

发布说明:

  • 修复临时文件在读取完成后未被清理的问题
  • 更新 IronSoftware.System.Drawing 依赖项至 2024.8.1

2024 年 7 月

IronOCR v2024.7.13

024 年 7 月 10 日
版本 2024.7.13
查看 IronOCR v2024.7.13 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2024.7.13

发布说明:

  • 修复了DetectPageOrientation仅返回第一页内容结果的问题。
  • 修复ConvertToSearchablePdf重载问题。
  • 减少从 Tiff 输入文件生成的可搜索 PDF 输出文件的大小。
  • 更新IronSoftware.System.Drawing依赖项至2024.7.2

2024 年 6 月

IronOCR v2024.6.3

024 年 6 月 4 日
版本 2024.6.3
查看 IronOCR v2024.6.3 API 参考

功能与升级

https://www.nuget.org/packages/IronOcr/2024.6.3

发布说明:

  • 改进对扫描字符的控制:在高级扫描过程中获得对捕获字符的更多控制。
  • 增强的文档扫描:高级扫描模式现在支持包含中文、繁体中文、日语、韩语和拉丁语在内的更多语言,使您能够扫描更多语言的文档。
  • 修复可搜索PDF文本重叠问题:此次更新解决了可搜索PDF在扫描后出现文本重叠的问题。
  • 修复部署到 Azure Function 时的问题:此更新解决了将 IronOCR 部署到 Azure Functions 时导致错误的问题。
  • IronSoftware.System.Drawing 依赖项更新到 2024.6.1

2024 年 5 月

IronOCR v2024.5.25

024 年 4 月 29 日
版本 2024.5.25
查看 IronOCR v2024.5.25 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2024.5.25

发布说明:

  • 引入新的 Read 方法,需单独安装 IronOcr.Extension.AdvancedScan 包。
  • 新高级方法:ReadPhoto()[参见IronOcr.Extension.AdvancedScan` NuGet 软件包].
  • 新高级方法:ReadScreenshot()[参见IronOcr.Extension.AdvancedScan` NuGet 软件包].
  • 新高级方法:ReadPassport()[参见IronOcr.Extension.AdvancedScan` NuGet 软件包].
  • 新高级方法:ReadLicensePlate()[参见IronOcr.Extension.AdvancedScan` NuGet 软件包].
  • IronSoftware.System.Drawing 依赖项更新到 2024.5.1

2024 年 4 月

IronOCR v2024.4.6

024 年 4 月 9 日
版本 2024.4.6
查看 IronOCR v2024.4.6 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2024.4.6

发布说明:

  • 移除与OCR过程无关的公共日志。
  • 更新 IronSoftware.System.Drawing 依赖到 2024.4.1

2024 年 3 月

IronOCR v2024.3.4

024 年 3 月 8 日
版本 2024.3.4
查看IronOCR v2024.3.4 API参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2024.3.4

发布说明:

  • 实现 DetectPageOrientation 以检测输入的方向。
  • 修复了在 .NET Framework 中无法从 web.config 文件中获取许可证密钥的错误。
  • 更新 IronSoftware.System.Drawing 依赖项至 2024.3.4

2024 年 2 月

IronOCR v2024.2.41

024 年 1 月 29 日
版本 2024.2.41
查看 IronOCR v2024.2.41 API 参考

功能与升级

https://www.nuget.org/packages/IronOcr/2024.2.41

发布说明:

  • 将所有 OcrInput 方法的前缀从 Add 改为 Load。 请尝试 .Load(), .LoadImage(), .LoadPdf()
  • 在大PDF输入环境中,总体速度提高最多可达90%,使用的分配和活动对象减少多达80%。
  • 在IronCV上下文中改进了位图的内存管理。
  • SearchablePdf 移至其自身的标志。 请查看 Configuration.RenderSearchablePdf,该选项默认开启。
  • 从默认标志中移除hOCR输出。 使用 Configuration.RenderhOCR = true 来明确使用
  • 更新 IronSoftware.System.Drawing 依赖关系到 2024.2.2

2024 年 1 月

IronOCR v2024.1.17

023 年 12 月 29 日
版本 2024.1.17
查看 IronOCR v2024.1.17 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2024.1.17

发布说明:

  • 更新 IronSoftware.System.Drawing 到 v2024.4.1
  • 修复旋转在输出可搜索 PDF 中被忽略的问题。
  • 将输出的可搜索PDF的尺寸调整为相对于输入图像的尺寸。
  • 修复16 BPP bmp导出为空白可搜索PDF的问题。

2023 年 12 月

IronOCR v2023.12.34

023 年 11 月 27 日
版本 2023.12.34
查看 IronOCR v2023.12.34 API 参考资料

功能与升级

https://www.nuget.org/packages/IronOcr/2023.12.34

发布说明:

  • 更新 IronSoftware.System.Drawing 至 v2023.12.1

2023 年 11 月

IronOCR v2023.11.35

023 年 10 月 27 日
版本 2023.11.35
查看 IronOCR v2023.11.35 API 参考

功能与升级

https://www.nuget.org/packages/IronOcr/2023.11.35

发布说明:

  • 现在,保存可搜索的 PDF 时,将正确输出原始图像尺寸,而不是 A4。
  • 解决了预旋转 PDF 文档保存为正方形输出可搜索 PDF 的问题。
  • OcrResult.Barcode的位置数据现在基于原始图像而不是相对于裁剪区域。
  • 支持UTF-8编码的OcrResult.SaveAsTextFile
  • StampCropRectangle 现在可以接受一个矩形列表进行盖章
  • StampCropRectangle 有一个静态重载,可以返回已加盖的 OcrInput 以供进一步处理。

2023 年 10 月

IronOCR v2023.10.9

023 年 10 月 5 日
版本 2023.10.9
查看IronOCR v2023.10.9 API参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2023.10.9

发布说明:

  • 将 IronSoftware.System.Drawing 更新至 2023.10.1 版。
  • 已将 IronSoftware.Common 更新至 2023.10.2 版。

2023 年 9 月

IronOCR v2023.9.4

023 年 9 月 19 日
版本 2023.9.4
查看 IronOCR v2023.9.4 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2023.9.4

发布说明:

  • 修复在安装多个 Iron 软件产品时导致崩溃的错误
  • 已将 IronSoftware.Common 添加为新的依赖关系
  • 已将 IronSoftware.System.Drawing 更新至 2023.9.2 版
  • 已更新 IronSoftware.Native.PdfModel 至版本 2023.9.18570

2023 年 8 月

IronOCR v2023.8.34

023 年 8 月 1 日
版本 2023.8.34
查看 IronOCR v2023.8.34 API 参考资料

功能与升级

https://www.nuget.org/packages/IronOcr/2023.8.34

发布说明:

  • 可搜索 PDF 现在可保留书签、注释、页面方向等(使用 OcrPdfInput)
  • 可搜索 PDF 文件现在所需的磁盘空间更少
  • 添加了 OcrPdfInput 类,可简化 PDF 文档的 OCR 处理
  • 已添加 OcrImageInput 类,可简化图像的 OCR 处理
  • 已弃用的 OcrInput 类,但在可预见的将来仍可使用
  • 修复裁剪矩形的冲压显示不正确的问题

2023 年 7 月

IronOCR v2023.7.28

023 年 7 月 3 日
版本 2023.7.28
查看 IronOCR v2023.7.28 API 参考

功能与升级

https://www.nuget.org/packages/IronOcr/2023.7.28

发布说明:

  • 已添加 EnableTesseractWarnings(魔方警告),默认设置为 false,以抑制控制台中的魔方警告
  • 使用 IronSoftware.Native.PdfModel 读写 PDF
  • 将 IronSoftware.System.Drawing 更新至 2023.7.1

2023 年 6 月

IronOCR v2023.6.6

023 年 5 月 29 日
版本 2023.6.6
查看 IronOCR v2023.6.6 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2023.6.6

发布说明:

主要变化:

  • PostBuildEvent 运行时文件夹复制修复:解决了在 PostBuildEvent 期间复制运行时文件夹的相关问题
  • 将 IronSoftware.System.Drawing 更新至 2023.6.1

2023 年 5 月

IronOCR v2023.5.35

023 年 5 月 1 日
版本 2023.5.35
查看 IronOCR v2023.5.35 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2023.5.35

发布说明:

主要变化:

  • 修复了在某些 .NET Framework ASP.NET 项目中无法从 web.config 中检索许可证密钥的问题
  • 将 IronSoftware.System.Drawing 更新至 2023.4.4

2023 年 4 月

IronOCR v2023.4.13

023 年 4 月 6 日
版本 2023.4.13
查看 IronOCR v2023.4.13 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2023.4.13

发布说明:

主要变化:

  • 将 IronSoftware.System.Drawing 更新至 2023.3.3
  • 包括 IronTesseract 上新的 ReadPdfAndOverlayText 方法,可添加文本并保留原始 PDF 书签/注释
  • 解决了导致包含大量图像的可搜索 PDF 文件变大的问题
  • 修复了 "二值化"(Binarize)筛选器使可搜索 PDF 文件变为空白的问题
  • 修复了 "读取 "方法会创建临时文件而不清理的问题
  • 增加了对 IronSuite 许可证密钥的支持
  • 修复了 IronOCR 无法获取 .config 和 .json 文件中存储的许可证密钥的问题
  • 新增对存储在应用程序子文件夹中 .config 和 .json 文件中的许可证密钥的支持

2023 年 3 月

IronOCR v2023.3.2

023 年 3 月 1 日
版本 2023.3.2
查看IronOCR v2023.3.2 API参考

功能与升级

https://www.nuget.org/packages/IronOcr/2023.3.2

发布说明:

主要变化:

  • 增加了对 AWS(亚马逊 Linux)的兼容性
  • 增加了对各种旧版 Linux 发行版的兼容性
  • 提高从 PDF 阅读文本的可靠性
  • 提高创建可搜索 PDF 文件的速度和保真度
  • 改进查找语言文件的逻辑
  • 移除对 System.Drawing

2023 年 1 月

IronOCR v2023.1.11644

023 年 1 月 18 日
版本 2023.1.11644
查看 IronOCR v2023.1.11644 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2023.1.11644

发布说明:

主要变化:

  • 添加 Installation.LanguagePackDirectory 用于指定 .ocrdata 文件的路径
  • 修复 IronOcr,以便与 ClickOnce 发布和 "dotnet 发布 "命令配合使用
  • 修复了某些语言包无法加载的情况
  • 修复从 TIFF 图像读取时忽略裁剪矩形的问题
  • 修复试用版用户无法从图像中读取文字的问题
  • 允许单线程 OCR 读取(见 IronTesseract.Multithreaded)

2022 年 12 月

IronOCR v2022.12.10830

022 年 12 月 5 日
版本 2022.12.10830
查看 IronOCR v2022.12.10830 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2022.12.10830

发布说明:

主要变化:

  • 添加 IronSoftware.System.Drawing 以取代 System.Drawing.Common 在 IronOCR 中
  • 移除对 System.Drawing.Common (更多信息见脚注[1])。
  • 增加了对 .NET 7 的支持
  • 移除对 .NET Framework 4 的支持。现在支持的 .NET Framework 最低版本为 4.6.2

其他变化:

  • 改进对许多 Linux 发行版的支持
  • 改善 OcrFilters.DeNoise :现在可以减少斑点噪声。
  • 增加了全新的 OcrFilters 以改善嘈杂图像的阅读效果:
  • 开放 :滤波器:用于去除噪音。
  • 关闭 :滤镜:用于封闭前景物体内部的小孔。
  • 自适应阈值 :对图像应用布拉德利自适应阈值。

[1] 关于删除 System.Drawing.Common:

  • 微软已停止支持 System.Drawing.Common 在非 Windows 环境下,.NET 6 和 .NET 7 可以完全兼容: ;https://docs.microsoft.com/en-us/dotnet/core/compatibility/core-libraries/6.0/system-drawing-common-windows-only
  • 为了解决这个问题,我们开发了一个名为 IronSoftware.System.Drawing 它可以轻松地在所有常见类型和格式之间进行转换。 System.Drawing.Common 它将被取代
  • 仍希望使用 System.Drawing.Common 使用 IronOCR 的用户仍然可以这样做。 IronSoftware.System.Drawing 可以使用这种格式,但由于 System.Drawing.Common 不再是依赖项,使用时客户需要在代码中添加 "using System.Drawing.Common; "调用。

2022年10月

IronOCR v2022.11.10109

022 年 10 月 26 日
版本 2022.11.10109
查看IronOCR v2022.11.10109 API参考

功能与升级

https://www.nuget.org/packages/IronOcr/2022.11.10109

发布说明:

  • 修复 MAUI 支持
  • 修复 "缺少运行时文件夹 "错误
  • 修复 "缺少 libtesseract "错误
  • 在许多平台上的兼容性和部署得到极大改善
  • 添加 "Installation.MachineLearningModelsDirectory",用于指定 .onnx 文件的路径
  • 小错误修复
  • 现在支持通过压缩文件或安装程序进行安装

2022 年 9 月

IronOCR v2022.10.9390

022 年 9 月 27 日
版本 2022.10.9390
查看IronOCR v2022.10.9390 API参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2022.10.9390

发布说明:

  • 支持使用机器学习技术检测可能包含文本的区域
  • 添加 OcrInput 方法 FindTextRegion 和 FindMultipleTextRegions - 为您的平台添加 IronOcr.ComputerVision NuGet 软件包
  • 添加 OcrResult 方法 SaveAsSearchablePdfStream,用于将结果保存为 PDF 流
  • 更新 Windows 构建,以减少所需的依赖性和磁盘空间
  • 更新图像加载功能,在执行 OCR 之前始终删除图像中的颜色表,从而提高准确性
  • 修复了 GetCropRectangleImage,使其能在所有源图像格式下正常工作
  • 修复了 Installation.LoggingMode 和 LogFilePath 无法正确应用的问题

2022 年 8 月

IronOCR v2022.8.8198

022 年 8 月 18 日
版本 2022.8.8198
查看 IronOCR v2022.8.8198 API 参考资料

功能与升级

https://www.nuget.org/packages/IronOcr/2022.8.8198

发布说明:

  • 添加了在图像上可视化裁剪矩形的新方法。请参见 OcrInput.StampCropRectangleAndSaveAs()
  • 添加了一次性应用多个过滤器的新方法。请参见 OcrInput.ApplyMultipleFilters()
  • 更改纠偏过滤器,不再在失败时抛出异常
  • 提高 Windows 系统的兼容性,因为 Windows 系统可能未安装 Microsoft C++ 可再分发软件
  • 改善可能缺少某些图像库的 MacOs 系统(包括英特尔和苹果硅)的兼容性

2022 年 7 月

IronOCR v2022.8.7804

022 年 7 月 26 日
版本 2022.8.7804
查看 IronOCR v2022.8.7804 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2022.8.7804

发布说明:

  • 将 Tesseract 更新至 5.1 版
  • 新增对 Apple Silicon 设备(ARM 处理器上的 MacOs)的支持
  • 添加 OcrInput.SaveAsImages(),用于将输入项保存为图像
  • 添加了 CropRectangle 类,该类允许使用毫米值或像素值进行裁剪
  • 移除 MinimumDpi。请使用 TargetDpi 来提高 OCR 输入的分辨率
  • 将 TargetDpi 设置为空,现在可防止 IronOcr 放大图像,从而使可搜索的 PDF 大幅缩小
  • 修复了 "侵蚀 "过滤器应用 "拨号 "和 "拨号 "过滤器应用 "侵蚀 "的错误
  • 修复了 PDF 页码编号不正确的错误
  • 提高各种 Linux 发行版的兼容性

2022 年 3 月

IronOCR v2022.3.0

022 年 3 月 10 日
版本 2022.3.0
查看 IronOCR v2022.3.0 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2022.3.0

发布说明:

  • 改进:支持 .NET 6
  • 改进:安全性和性能

2022 年 1 月

IronOCR v2022.1.0

022 年 1 月 17 日
版本 2022.1.0
查看 IronOCR v2022.1.0 API 参考

功能与升级

https://www.nuget.org/packages/IronOcr/2022.1.0

发布说明:

  • 改进:多线程和性能
  • 改进:PDF OCR 性能
  • 功能: OCR 进度跟踪
  • 改进:方向和脚本检测(OSD)
  • 改进:纠偏方法
  • 改进:安全性和性能

2021 年 12 月

IronOCR v2021.12.0

021 年 12 月 21 日
版本 2021.12.0
查看 IronOCR v2021.12.0 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2021.12.0

发布说明:

  • 改进:速度和稳定性
  • 改进:支持 .NET 5 和 .NET 6 测试版
  • 改进:日志记录

2021 年 10 月

IronOCR v2021.11.0

021 年 10 月 29 日
版本 2021.11.0
查看 IronOCR v2021.11.0 API 参考文档

功能与升级

https://www.nuget.org/packages/IronOcr/2021.11.0

发布说明:

  • 错误已修复:Azure 函数兼容性
  • 修正了错误:可使用只读 OCR 字典
  • 修正的错误:现在可与 .NET 5.07 兼容
  • 修正的错误:从项目配置文件读取许可证密钥(边缘情况)
  • 功能: 为 OcrInput 添加颜色替换方法
  • 功能 从 TIFF 和 PDF 文件加载特定帧
  • 已改进:更新了 System.Drawing.Common