更新日志:更新、里程碑、路线图

This article was translated from English: Does it need improvement?
Translated
View the article in English

[{hpt:chngLogFrm}]

IronOCR 路线图

我们开发 IronOCR 是为了满足市场需求,它已成为我们的领先产品之一。如今,在社区需求的推动下,我们不断推出新的功能要求。

我们积极与谷歌最新的 Tesseract 技术合作,以提高稳定性和准确性。

这将确保我们的客户受益于最先进的 OCR 阅读引擎。

我们每月发布的 IronOCR 不断证明其价值,并推动我们帮助最终用户推动 .NET 语言发展的使命。

我们知道 IronOCR 是开发人员的首选之一¹。为了巩固 IronOCR 在同类产品中的领先地位,我们正在应用最新技术来改进图像过滤器、计算机视觉和机器学习。

我们的下一个目标是推出适用于多种编程语言的 IronOCR。

¹ 基于 2022 年 6 月进行的客户调查。


2024年9月

IronOCR v2024.9.6

2024年9月9日
版本 2024.9.6

功能与升级

https://www.nuget.org/packages/IronOcr/2024.9.6

发布说明:

  • 增加了一个新的阅读方法 ReadDocumentAdvanced,专门用于表格数据读取。
  • IronSoftware.System.Drawing 依赖性更新为2024.9.10。

2024年8月

IronOCR v2024.8.21

2024年7月31日
版本 2024.8.21

功能与升级

https://www.nuget.org/packages/IronOcr/2024.8.21

发布说明:

  • 修复了临时文件在读取完成后未被清除的问题
  • 更新了IronSoftware.System.Drawing依赖项至2024.8.1版本

2024 年 7 月

IronOCR v2024.7.13

2024 年 7 月 10 日
版本 2024.7.13

功能与升级

https://www.nuget.org/packages/IronOcr/2024.7.13

发布说明:

  • 修正了 DetecPageOrientation 只返回第一页内容的结果。
  • 修正 ConvertToSearchablePdf 超重问题。
  • 从 Tiff 输入文件减小可搜索 PDF 输出文件大小。
  • 将 IronSoftware.System.Drawing 依赖关系更新至 2024.7.2

2024 年 6 月

IronOCR v2024.6.3

2024 年 6 月 4 日
版本 2024.6.3

功能与升级

https://www.nuget.org/packages/IronOcr/2024.6.3

发布说明:

  • 改进了对扫描字符的控制:对高级扫描过程中捕获的字符获得更多控制。
  • 增强文档扫描功能:高级扫描模式现在支持更多语言,包括中文、繁体中文、日文、韩文和拉丁文,让您可以扫描更多语言的文档。
  • 修复了可搜索 PDF 返回重叠文本的问题:此更新解决了可搜索 PDF 中的文本在扫描后出现重叠的问题。
  • 修复部署到 Azure 功能时的问题:此更新解决了将 IronOCR 部署到 Azure 函数时会导致错误的问题。

  • IronSoftware.System.Drawing 依赖关系更新至 2024.6.1

2024 年 5 月

IronOCR v2024.5.25

2024 年 4 月 29 日
版本 2024.5.25

功能与升级

https://www.nuget.org/packages/IronOcr/2024.5.25

发布说明:

  • 引入新的读取方法,需要单独安装 IronOcr.Extension.AdvancedScan 软件包。
  • 新的高级方法:读取照片() [参见 IronOcr.Extension.AdvancedScan NuGet 软件包].
  • 新的高级方法: 读取屏幕截图() [参见 IronOcr.Extension.AdvancedScan NuGet 软件包].
  • 新的高级方法: 读取护照() [参见 IronOcr.Extension.AdvancedScan NuGet 软件包].
  • 新的高级方法: ReadLicensePlate() [参见 IronOcr.Extension.AdvancedScan NuGet 软件包].
  • 将 "IronSoftware.System.Drawing "依赖关系更新至 2024.5.1

2024 年 4 月

IronOCR v2024.4.6

2024 年 4 月 9 日
版本 2024.4.6

功能与升级

https://www.nuget.org/packages/IronOcr/2024.4.6

发布说明:

  • 删除与 OCR 处理无关的公共日志。
  • 将 "IronSoftware.System.Drawing "依赖关系更新至 2024.4.1

2024 年 3 月

IronOCR v2024.3.4

2024 年 3 月 8 日
版本 2024.3.4

功能与升级

https://www.nuget.org/packages/IronOcr/2024.3.4

发布说明:

  • 实现 DetectPageOrientation 以检测输入的方向。
  • 修正了在 .NET Framework 中无法从 web.config 文件中获取许可证密钥的错误。

  • 将 IronSoftware.System.Drawing 依赖关系更新至 2024.3.4

2024 年 2 月

IronOCR v2024.2.41

2024 年 1 月 29 日
版本 2024.2.41

功能与升级

https://www.nuget.org/packages/IronOcr/2024.2.41

发布说明:

  • 全面修改所有 OcrInput 方法,以使用 Load 代替 Add 前缀。请尝试 .Load(), .LoadImage(), .LoadPdf()
  • 在大型 PDF 输入上下文中,整体速度最多可提高 90%,使用的分配和实时对象最多可减少 80
  • 改进了 IronCV 上下文中位图的内存管理
  • SearchablePdf 移至其自己的标志。请参阅默认开启的 Configuration.RenderSearchablePdf
  • 将 hOCR 输出从默认标志中移除。使用 Configuration.RenderhOCR = true 明确使用
  • IronSoftware.System.Drawing依赖关系更新至 2024.2.2

2024 年 1 月

IronOCR v2024.1.17

2023 年 12 月 29 日
版本 2024.1.17

功能与升级

https://www.nuget.org/packages/IronOcr/2024.1.17

发布说明:

  • 将 "IronSoftware.System.Drawing "更新至 v2024.4.1
  • 修复输出可搜索 PDF 时忽略旋转的问题
  • 修正输出可搜索 PDF 的尺寸为相对于输入图像的尺寸
  • 修复 16 BPP bmp 输出为空白可搜索 PDF 的问题

2023 年 12 月

IronOCR v2023.12.34

2023 年 11 月 27 日
版本 2023.12.34

功能与升级

https://www.nuget.org/packages/IronOcr/2023.12.34

发布说明:

  • 将 "IronSoftware.System.Drawing "更新至 v2023.12.1

2023 年 11 月

IronOCR v2023.11.35

2023 年 10 月 27 日
版本 2023.11.35

功能与升级

https://www.nuget.org/packages/IronOcr/2023.11.35

发布说明:

  • 保存可搜索 PDF 现在可正确输出原始图像尺寸,而不是 A4 尺寸
  • 解决了预旋转 PDF 文档保存为正方形输出可搜索 PDF 的问题
  • OcrResult.Barcode "的位置数据现在基于原始图像,而不是相对于裁剪区域
  • OcrResult.SaveAsTextFile支持UTF-8编码
  • 现在,StampCropRectangle 可接受要盖印的矩形列表
  • 静态重载StampCropRectangle可返回已加盖戳记的OcrInput供进一步处理

2023 年 10 月

IronOCR v2023.10.9

2023 年 10 月 5 日
版本 2023.10.9

功能与升级

https://www.nuget.org/packages/IronOcr/2023.10.9

发布说明:

  • 将 IronSoftware.System.Drawing 更新至 2023.10.1 版。
  • 已将 IronSoftware.Common 更新至 2023.10.2 版。

2023 年 9 月

IronOCR v2023.9.4

2023 年 9 月 19 日
版本 2023.9.4

功能与升级

https://www.nuget.org/packages/IronOcr/2023.9.4

发布说明:

  • 修复在安装多个 Iron 软件产品时导致崩溃的错误
  • 已将 IronSoftware.Common 添加为新的依赖关系
  • 已将 IronSoftware.System.Drawing 更新至 2023.9.2 版
  • 已更新 IronSoftware.Native.PdfModel 至版本 2023.9.18570

2023 年 8 月

IronOCR v2023.8.34

2023 年 8 月 1 日
版本 2023.8.34

功能与升级

https://www.nuget.org/packages/IronOcr/2023.8.34

发布说明:

  • 可搜索 PDF 现在可保留书签、注释、页面方向等(使用 OcrPdfInput)
  • 可搜索 PDF 文件现在所需的磁盘空间更少
  • 添加了 OcrPdfInput 类,可简化 PDF 文档的 OCR 处理
  • 已添加 OcrImageInput 类,可简化图像的 OCR 处理
  • 已弃用的 OcrInput 类,但在可预见的将来仍可使用
  • 修复裁剪矩形的冲压显示不正确的问题

2023 年 7 月

IronOCR v2023.7.28

2023 年 7 月 3 日
版本 2023.7.28

功能与升级

https://www.nuget.org/packages/IronOcr/2023.7.28

发布说明:

  • 已添加 EnableTesseractWarnings(魔方警告),默认设置为 false,以抑制控制台中的魔方警告
  • 使用 IronSoftware.Native.PdfModel 读写 PDF
  • 将 IronSoftware.System.Drawing 更新至 2023.7.1

2023 年 6 月

IronOCR v2023.6.6

2023 年 5 月 29 日
版本 2023.6.6

功能与升级

https://www.nuget.org/packages/IronOcr/2023.6.6

发布说明:

主要变化:

  • PostBuildEvent 运行时文件夹复制修复:解决了在 PostBuildEvent 期间复制运行时文件夹的相关问题
  • 将 IronSoftware.System.Drawing 更新至 2023.6.1

2023 年 5 月

IronOCR v2023.5.35

2023 年 5 月 1 日
版本 2023.5.35

功能与升级

https://www.nuget.org/packages/IronOcr/2023.5.35

发布说明:

主要变化:

  • 修复了在某些 .NET Framework ASP.NET 项目中无法从 web.config 中检索许可证密钥的问题
  • 将 IronSoftware.System.Drawing 更新至 2023.4.4

2023 年 4 月

IronOCR v2023.4.13

2023 年 4 月 6 日
版本 2023.4.13

功能与升级

https://www.nuget.org/packages/IronOcr/2023.4.13

发布说明:

主要变化:

  • 将 IronSoftware.System.Drawing 更新至 2023.3.3
  • 包括 IronTesseract 上新的 ReadPdfAndOverlayText 方法,可添加文本并保留原始 PDF 书签/注释
  • 解决了导致包含大量图像的可搜索 PDF 文件变大的问题
  • 修复了 "二值化"(Binarize)筛选器使可搜索 PDF 文件变为空白的问题
  • 修复了 "读取 "方法会创建临时文件而不清理的问题
  • 增加了对 IronSuite 许可证密钥的支持
  • 修复了 IronOCR 无法获取 .config 和 .json 文件中存储的许可证密钥的问题
  • 新增对存储在应用程序子文件夹中 .config 和 .json 文件中的许可证密钥的支持

2023 年 3 月

IronOCR v2023.3.2

2023 年 3 月 1 日
版本 2023.3.2

功能与升级

https://www.nuget.org/packages/IronOcr/2023.3.2

发布说明:

主要变化:

  • 增加了对 AWS(亚马逊 Linux)的兼容性
  • 增加了对各种旧版 Linux 发行版的兼容性
  • 提高从 PDF 阅读文本的可靠性
  • 提高创建可搜索 PDF 文件的速度和保真度
  • 改进查找语言文件的逻辑
  • 移除对 系统.绘图

2023 年 1 月

IronOCR v2023.1.11644

2023 年 1 月 18 日
版本 2023.1.11644

功能与升级

https://www.nuget.org/packages/IronOcr/2023.1.11644

发布说明:

主要变化:

  • 添加 安装语言包目录 用于指定 .ocrdata 文件的路径
  • 修复 IronOcr,以便与 ClickOnce 发布和 "dotnet 发布 "命令配合使用
  • 修复了某些语言包无法加载的情况
  • 修复从 TIFF 图像读取时忽略裁剪矩形的问题
  • 修复试用版用户无法从图像中读取文字的问题
  • 允许单线程 OCR 读取(见 IronTesseract.多线程)

2022 年 12 月

IronOCR v2022.12.10830

2022 年 12 月 5 日
版本 2022.12.10830

功能与升级

https://www.nuget.org/packages/IronOcr/2022.12.10830

发布说明:

主要变化:

  • 添加 IronSoftware.System.Drawing 以取代 System.Drawing.Common 在 IronOCR 中
  • 移除对 System.Drawing.Common (更多信息见脚注[1])。
  • 添加 support for .NET 7
  • 移除对 .NET Framework 4 的支持。现在支持的 .NET Framework 最低版本为 4.6.2

其他变化:

  • 改进对许多 Linux 发行版的支持
  • 改善 OcrFilters.DeNoise :现在可以减少斑点噪声。
  • 添加 brand new OcrFilters 以改善嘈杂图像的阅读效果:
  • 开放 :滤波器:用于去除噪音。
  • 关闭 :滤镜:用于封闭前景物体内部的小孔。
  • 自适应阈值 :对图像应用布拉德利自适应阈值。

[1] 关于删除 System.Drawing.Common:

  • 微软已停止支持 System.Drawing.Common 在非 Windows 环境下,.NET 6 和 .NET 7 可以完全兼容: ;https://docs.microsoft.com/en-us/dotnet/core/compatibility/core-libraries/6.0/system-drawing-common-windows-only
  • 为了解决这个问题,我们开发了一个名为 IronSoftware.System.Drawing 它可以轻松地在所有常见类型和格式之间进行转换。 System.Drawing.Common 它将被取代
  • 仍希望使用 System.Drawing.Common 使用 IronOCR 的用户仍然可以这样做。 IronSoftware.System.Drawing 可以使用这种格式,但由于 System.Drawing.Common 不再是依赖项,使用时客户需要在代码中添加 "using System.Drawing.Common; "调用。

2022年10月

IronOCR v2022.11.10109

2022 年 10 月 26 日
版本 2022.11.10109

功能与升级

https://www.nuget.org/packages/IronOcr/2022.11.10109

发布说明:

  • 修复 MAUI 支持
  • 修复 "缺少运行时文件夹 "错误
  • 修复 "缺少 libtesseract "错误
  • 在许多平台上的兼容性和部署得到极大改善
  • 添加 "Installation.MachineLearningModelsDirectory",用于指定 .onnx 文件的路径
  • 小错误修复
  • 现在支持通过压缩文件或安装程序进行安装

2022 年 9 月

IronOCR v2022.10.9390

2022 年 9 月 27 日
版本 2022.10.9390

功能与升级

https://www.nuget.org/packages/IronOcr/2022.10.9390

发布说明:

  • 支持使用机器学习技术检测可能包含文本的区域
  • 添加 OcrInput 方法 FindTextRegion 和 FindMultipleTextRegions - 为您的平台添加 IronOcr.ComputerVision NuGet 软件包
  • 添加 OcrResult 方法 SaveAsSearchablePdfStream,用于将结果保存为 PDF 流
  • 更新 Windows 构建,以减少所需的依赖性和磁盘空间
  • 更新图像加载功能,在执行 OCR 之前始终删除图像中的颜色表,从而提高准确性
  • 修复了 GetCropRectangleImage,使其能在所有源图像格式下正常工作
  • 修复了 Installation.LoggingMode 和 LogFilePath 无法正确应用的问题

2022 年 8 月

IronOCR v2022.8.8198

2022 年 8 月 18 日
版本 2022.8.8198

功能与升级

https://www.nuget.org/packages/IronOcr/2022.8.8198

发布说明:

  • 添加了在图像上可视化裁剪矩形的新方法。请参见 OcrInput.StampCropRectangleAndSaveAs()
  • 添加了一次性应用多个过滤器的新方法。请参见 OcrInput.ApplyMultipleFilters()
  • 更改纠偏过滤器,不再在失败时抛出异常
  • 提高 Windows 系统的兼容性,因为 Windows 系统可能未安装 Microsoft C++ 可再分发软件
  • 改善可能缺少某些图像库的 MacOs 系统(包括英特尔和苹果硅)的兼容性

2022 年 7 月

IronOCR v2022.8.7804

2022 年 7 月 26 日
版本 2022.8.7804

功能与升级

https://www.nuget.org/packages/IronOcr/2022.8.7804

发布说明:

  • 将 Tesseract 更新至 5.1 版
  • 新增对 Apple Silicon 设备(ARM 处理器上的 MacOs)的支持
  • 添加 OcrInput.SaveAsImages(),用于将输入项保存为图像
  • 添加了 CropRectangle 类,该类允许使用毫米值或像素值进行裁剪
  • 移除 MinimumDpi。请使用 TargetDpi 来提高 OCR 输入的分辨率
  • 将 TargetDpi 设置为空,现在可防止 IronOcr 放大图像,从而使可搜索的 PDF 大幅缩小
  • 修复了 "侵蚀 "过滤器应用 "拨号 "和 "拨号 "过滤器应用 "侵蚀 "的错误
  • 修复了 PDF 页码编号不正确的错误
  • 提高各种 Linux 发行版的兼容性

2022 年 3 月

IronOCR v2022.3.0

2022 年 3 月 10 日
版本 2022.3.0

功能与升级

https://www.nuget.org/packages/IronOcr/2022.3.0

发布说明:

  • 改进:支持 .NET 6
  • 改进:安全性和性能

2022 年 1 月

IronOCR v2022.1.0

2022 年 1 月 17 日
版本 2022.1.0

功能与升级

https://www.nuget.org/packages/IronOcr/2022.1.0

发布说明:

  • 改进:多线程和性能
  • 改进:PDF OCR 性能
  • 功能: OCR 进度跟踪
  • 改进:方向和脚本检测(OSD)
  • 改进:纠偏方法
  • 改进:安全性和性能

2021 年 12 月

IronOCR v2021.12.0

2021 年 12 月 21 日
版本 2021.12.0

功能与升级

https://www.nuget.org/packages/IronOcr/2021.12.0

发布说明:

  • 改进:速度和稳定性
  • 改进:支持 .NET 5 和 .NET 6 测试版
  • 改进:日志记录

2021 年 10 月

IronOCR v2021.11.0

2021 年 10 月 29 日
版本 2021.11.0

功能与升级

https://www.nuget.org/packages/IronOcr/2021.11.0

发布说明:

  • 错误已修复:Azure 函数兼容性
  • 修正了错误:可使用只读 OCR 字典
  • 修正的错误:现在可与 .NET 5.07 兼容
  • 修正的错误:从项目配置文件读取许可证密钥(边缘情况)
  • 功能: 为 OcrInput 添加颜色替换方法
  • 功能 从 TIFF 和 PDF 文件加载特定帧
  • 已改进:更新了 System.Drawing.Common