更新日志:更新、里程碑、路线图
[{hpt:chngLogFrm}]
IronOCR 路线图
我们开发 IronOCR 是为了满足市场需求,它已成为我们的领先产品之一。如今,在社区需求的推动下,我们不断推出新的功能要求。
我们积极与谷歌最新的 Tesseract 技术合作,以提高稳定性和准确性。
这将确保我们的客户受益于最先进的 OCR 阅读引擎。
我们每月发布的 IronOCR 不断证明其价值,并推动我们帮助最终用户推动 .NET 语言发展的使命。
我们知道 IronOCR 是开发人员的首选之一¹。为了巩固 IronOCR 在同类产品中的领先地位,我们正在应用最新技术来改进图像过滤器、计算机视觉和机器学习。
我们的下一个目标是推出适用于多种编程语言的 IronOCR。
¹ 基于 2022 年 6 月进行的客户调查。
2024年9月
IronOCR v2024.9.6
功能与升级
https://www.nuget.org/packages/IronOcr/2024.9.6
发布说明:
- 增加了一个新的阅读方法
ReadDocumentAdvanced
,专门用于表格数据读取。 - 将
IronSoftware.System.Drawing
依赖性更新为2024.9.10。
2024年8月
IronOCR v2024.8.21
功能与升级
https://www.nuget.org/packages/IronOcr/2024.8.21
发布说明:
- 修复了临时文件在读取完成后未被清除的问题
- 更新了IronSoftware.System.Drawing依赖项至2024.8.1版本
2024 年 7 月
IronOCR v2024.7.13
功能与升级
https://www.nuget.org/packages/IronOcr/2024.7.13
发布说明:
- 修正了 DetecPageOrientation 只返回第一页内容的结果。
- 修正 ConvertToSearchablePdf 超重问题。
- 从 Tiff 输入文件减小可搜索 PDF 输出文件大小。
- 将 IronSoftware.System.Drawing 依赖关系更新至 2024.7.2
2024 年 6 月
IronOCR v2024.6.3
功能与升级
https://www.nuget.org/packages/IronOcr/2024.6.3
发布说明:
- 改进了对扫描字符的控制:对高级扫描过程中捕获的字符获得更多控制。
- 增强文档扫描功能:高级扫描模式现在支持更多语言,包括中文、繁体中文、日文、韩文和拉丁文,让您可以扫描更多语言的文档。
- 修复了可搜索 PDF 返回重叠文本的问题:此更新解决了可搜索 PDF 中的文本在扫描后出现重叠的问题。
- 修复部署到 Azure 功能时的问题:此更新解决了将 IronOCR 部署到 Azure 函数时会导致错误的问题。
- 将
IronSoftware.System.Drawing
依赖关系更新至 2024.6.1
2024 年 5 月
IronOCR v2024.5.25
功能与升级
https://www.nuget.org/packages/IronOcr/2024.5.25
发布说明:
- 引入新的读取方法,需要单独安装
IronOcr.Extension.AdvancedScan
软件包。 - 新的高级方法:
读取照片()
[参见IronOcr.Extension.AdvancedScan
NuGet 软件包]. - 新的高级方法:
读取屏幕截图()
[参见IronOcr.Extension.AdvancedScan
NuGet 软件包]. - 新的高级方法:
读取护照()
[参见IronOcr.Extension.AdvancedScan
NuGet 软件包]. - 新的高级方法:
ReadLicensePlate()
[参见IronOcr.Extension.AdvancedScan
NuGet 软件包]. - 将 "IronSoftware.System.Drawing "依赖关系更新至 2024.5.1
2024 年 4 月
IronOCR v2024.4.6
功能与升级
https://www.nuget.org/packages/IronOcr/2024.4.6
发布说明:
- 删除与 OCR 处理无关的公共日志。
- 将 "IronSoftware.System.Drawing "依赖关系更新至 2024.4.1
2024 年 3 月
IronOCR v2024.3.4
功能与升级
https://www.nuget.org/packages/IronOcr/2024.3.4
发布说明:
- 实现 DetectPageOrientation 以检测输入的方向。
- 修正了在 .NET Framework 中无法从 web.config 文件中获取许可证密钥的错误。
- 将 IronSoftware.System.Drawing 依赖关系更新至 2024.3.4
2024 年 2 月
IronOCR v2024.2.41
功能与升级
https://www.nuget.org/packages/IronOcr/2024.2.41
发布说明:
- 全面修改所有
OcrInput
方法,以使用 Load 代替 Add 前缀。请尝试.Load()
,.LoadImage()
,.LoadPdf()
- 在大型 PDF 输入上下文中,整体速度最多可提高 90%,使用的分配和实时对象最多可减少 80
- 改进了 IronCV 上下文中位图的内存管理
- 将
SearchablePdf
移至其自己的标志。请参阅默认开启的Configuration.RenderSearchablePdf
。 - 将 hOCR 输出从默认标志中移除。使用
Configuration.RenderhOCR = true
明确使用 - 将
IronSoftware.System.Drawing
依赖关系更新至 2024.2.2
2024 年 1 月
IronOCR v2024.1.17
功能与升级
https://www.nuget.org/packages/IronOcr/2024.1.17
发布说明:
- 将 "IronSoftware.System.Drawing "更新至 v2024.4.1
- 修复输出可搜索 PDF 时忽略旋转的问题
- 修正输出可搜索 PDF 的尺寸为相对于输入图像的尺寸
- 修复 16 BPP bmp 输出为空白可搜索 PDF 的问题
2023 年 12 月
IronOCR v2023.12.34
功能与升级
https://www.nuget.org/packages/IronOcr/2023.12.34
发布说明:
- 将 "IronSoftware.System.Drawing "更新至 v2023.12.1
2023 年 11 月
IronOCR v2023.11.35
功能与升级
https://www.nuget.org/packages/IronOcr/2023.11.35
发布说明:
- 保存可搜索 PDF 现在可正确输出原始图像尺寸,而不是 A4 尺寸
- 解决了预旋转 PDF 文档保存为正方形输出可搜索 PDF 的问题
- OcrResult.Barcode "的位置数据现在基于原始图像,而不是相对于裁剪区域
- 为
OcrResult.SaveAsTextFile
支持UTF-8编码 - 现在,
StampCropRectangle
可接受要盖印的矩形列表 - 静态重载
StampCropRectangle
可返回已加盖戳记的OcrInput
供进一步处理
2023 年 10 月
IronOCR v2023.10.9
功能与升级
https://www.nuget.org/packages/IronOcr/2023.10.9
发布说明:
- 将 IronSoftware.System.Drawing 更新至 2023.10.1 版。
- 已将 IronSoftware.Common 更新至 2023.10.2 版。
2023 年 9 月
IronOCR v2023.9.4
功能与升级
https://www.nuget.org/packages/IronOcr/2023.9.4
发布说明:
- 修复在安装多个 Iron 软件产品时导致崩溃的错误
- 已将 IronSoftware.Common 添加为新的依赖关系
- 已将 IronSoftware.System.Drawing 更新至 2023.9.2 版
- 已更新 IronSoftware.Native.PdfModel 至版本 2023.9.18570
2023 年 8 月
IronOCR v2023.8.34
功能与升级
https://www.nuget.org/packages/IronOcr/2023.8.34
发布说明:
- 可搜索 PDF 现在可保留书签、注释、页面方向等(使用 OcrPdfInput)
- 可搜索 PDF 文件现在所需的磁盘空间更少
- 添加了 OcrPdfInput 类,可简化 PDF 文档的 OCR 处理
- 已添加 OcrImageInput 类,可简化图像的 OCR 处理
- 已弃用的 OcrInput 类,但在可预见的将来仍可使用
- 修复裁剪矩形的冲压显示不正确的问题
2023 年 7 月
IronOCR v2023.7.28
功能与升级
https://www.nuget.org/packages/IronOcr/2023.7.28
发布说明:
- 已添加 EnableTesseractWarnings(魔方警告),默认设置为 false,以抑制控制台中的魔方警告
- 使用 IronSoftware.Native.PdfModel 读写 PDF
- 将 IronSoftware.System.Drawing 更新至 2023.7.1
2023 年 6 月
IronOCR v2023.6.6
功能与升级
https://www.nuget.org/packages/IronOcr/2023.6.6
发布说明:
主要变化:
- PostBuildEvent 运行时文件夹复制修复:解决了在 PostBuildEvent 期间复制运行时文件夹的相关问题
- 将 IronSoftware.System.Drawing 更新至 2023.6.1
2023 年 5 月
IronOCR v2023.5.35
功能与升级
https://www.nuget.org/packages/IronOcr/2023.5.35
发布说明:
主要变化:
- 修复了在某些 .NET Framework ASP.NET 项目中无法从 web.config 中检索许可证密钥的问题
- 将 IronSoftware.System.Drawing 更新至 2023.4.4
2023 年 4 月
IronOCR v2023.4.13
功能与升级
https://www.nuget.org/packages/IronOcr/2023.4.13
发布说明:
主要变化:
- 将 IronSoftware.System.Drawing 更新至 2023.3.3
- 包括 IronTesseract 上新的 ReadPdfAndOverlayText 方法,可添加文本并保留原始 PDF 书签/注释
- 解决了导致包含大量图像的可搜索 PDF 文件变大的问题
- 修复了 "二值化"(Binarize)筛选器使可搜索 PDF 文件变为空白的问题
- 修复了 "读取 "方法会创建临时文件而不清理的问题
- 增加了对 IronSuite 许可证密钥的支持
- 修复了 IronOCR 无法获取 .config 和 .json 文件中存储的许可证密钥的问题
- 新增对存储在应用程序子文件夹中 .config 和 .json 文件中的许可证密钥的支持
2023 年 3 月
IronOCR v2023.3.2
功能与升级
https://www.nuget.org/packages/IronOcr/2023.3.2
发布说明:
主要变化:
- 增加了对 AWS(亚马逊 Linux)的兼容性
- 增加了对各种旧版 Linux 发行版的兼容性
- 提高从 PDF 阅读文本的可靠性
- 提高创建可搜索 PDF 文件的速度和保真度
- 改进查找语言文件的逻辑
- 移除对
系统.绘图
2023 年 1 月
IronOCR v2023.1.11644
功能与升级
https://www.nuget.org/packages/IronOcr/2023.1.11644
发布说明:
主要变化:
- 添加
安装语言包目录
用于指定 .ocrdata 文件的路径 - 修复 IronOcr,以便与 ClickOnce 发布和 "dotnet 发布 "命令配合使用
- 修复了某些语言包无法加载的情况
- 修复从 TIFF 图像读取时忽略裁剪矩形的问题
- 修复试用版用户无法从图像中读取文字的问题
- 允许单线程 OCR 读取(见
IronTesseract.多线程
)
2022 年 12 月
IronOCR v2022.12.10830
功能与升级
https://www.nuget.org/packages/IronOcr/2022.12.10830
发布说明:
主要变化:
- 添加
IronSoftware.System.Drawing
以取代System.Drawing.Common
在 IronOCR 中 - 移除对
System.Drawing.Common
(更多信息见脚注[1])。 - 添加 support for .NET 7
- 移除对 .NET Framework 4 的支持。现在支持的 .NET Framework 最低版本为 4.6.2
其他变化:
- 改进对许多 Linux 发行版的支持
- 改善
OcrFilters.DeNoise
:现在可以减少斑点噪声。 - 添加 brand new
OcrFilters
以改善嘈杂图像的阅读效果: 开放
:滤波器:用于去除噪音。关闭
:滤镜:用于封闭前景物体内部的小孔。自适应阈值
:对图像应用布拉德利自适应阈值。
[1] 关于删除 System.Drawing.Common
:
- 微软已停止支持
System.Drawing.Common
在非 Windows 环境下,.NET 6 和 .NET 7 可以完全兼容: ;https://docs.microsoft.com/en-us/dotnet/core/compatibility/core-libraries/6.0/system-drawing-common-windows-only - 为了解决这个问题,我们开发了一个名为
IronSoftware.System.Drawing
它可以轻松地在所有常见类型和格式之间进行转换。System.Drawing.Common
它将被取代 - 仍希望使用
System.Drawing.Common
使用 IronOCR 的用户仍然可以这样做。IronSoftware.System.Drawing
可以使用这种格式,但由于System.Drawing.Common
不再是依赖项,使用时客户需要在代码中添加 "using System.Drawing.Common; "调用。
2022年10月
IronOCR v2022.11.10109
功能与升级
https://www.nuget.org/packages/IronOcr/2022.11.10109
发布说明:
- 修复 MAUI 支持
- 修复 "缺少运行时文件夹 "错误
- 修复 "缺少 libtesseract "错误
- 在许多平台上的兼容性和部署得到极大改善
- 添加 "Installation.MachineLearningModelsDirectory",用于指定 .onnx 文件的路径
- 小错误修复
- 现在支持通过压缩文件或安装程序进行安装
2022 年 9 月
IronOCR v2022.10.9390
功能与升级
https://www.nuget.org/packages/IronOcr/2022.10.9390
发布说明:
- 支持使用机器学习技术检测可能包含文本的区域
- 添加 OcrInput 方法 FindTextRegion 和 FindMultipleTextRegions - 为您的平台添加 IronOcr.ComputerVision NuGet 软件包
- 添加 OcrResult 方法 SaveAsSearchablePdfStream,用于将结果保存为 PDF 流
- 更新 Windows 构建,以减少所需的依赖性和磁盘空间
- 更新图像加载功能,在执行 OCR 之前始终删除图像中的颜色表,从而提高准确性
- 修复了 GetCropRectangleImage,使其能在所有源图像格式下正常工作
- 修复了 Installation.LoggingMode 和 LogFilePath 无法正确应用的问题
2022 年 8 月
IronOCR v2022.8.8198
功能与升级
https://www.nuget.org/packages/IronOcr/2022.8.8198
发布说明:
- 添加了在图像上可视化裁剪矩形的新方法。请参见 OcrInput.StampCropRectangleAndSaveAs()
- 添加了一次性应用多个过滤器的新方法。请参见 OcrInput.ApplyMultipleFilters()
- 更改纠偏过滤器,不再在失败时抛出异常
- 提高 Windows 系统的兼容性,因为 Windows 系统可能未安装 Microsoft C++ 可再分发软件
- 改善可能缺少某些图像库的 MacOs 系统(包括英特尔和苹果硅)的兼容性
2022 年 7 月
IronOCR v2022.8.7804
功能与升级
https://www.nuget.org/packages/IronOcr/2022.8.7804
发布说明:
- 将 Tesseract 更新至 5.1 版
- 新增对 Apple Silicon 设备(ARM 处理器上的 MacOs)的支持
- 添加 OcrInput.SaveAsImages(),用于将输入项保存为图像
- 添加了 CropRectangle 类,该类允许使用毫米值或像素值进行裁剪
- 移除 MinimumDpi。请使用 TargetDpi 来提高 OCR 输入的分辨率
- 将 TargetDpi 设置为空,现在可防止 IronOcr 放大图像,从而使可搜索的 PDF 大幅缩小
- 修复了 "侵蚀 "过滤器应用 "拨号 "和 "拨号 "过滤器应用 "侵蚀 "的错误
- 修复了 PDF 页码编号不正确的错误
- 提高各种 Linux 发行版的兼容性
2022 年 3 月
IronOCR v2022.3.0
功能与升级
https://www.nuget.org/packages/IronOcr/2022.3.0
发布说明:
- 改进:支持 .NET 6
- 改进:安全性和性能
2022 年 1 月
IronOCR v2022.1.0
功能与升级
https://www.nuget.org/packages/IronOcr/2022.1.0
发布说明:
- 改进:多线程和性能
- 改进:PDF OCR 性能
- 功能: OCR 进度跟踪
- 改进:方向和脚本检测(OSD)
- 改进:纠偏方法
- 改进:安全性和性能
2021 年 12 月
IronOCR v2021.12.0
功能与升级
https://www.nuget.org/packages/IronOcr/2021.12.0
发布说明:
- 改进:速度和稳定性
- 改进:支持 .NET 5 和 .NET 6 测试版
- 改进:日志记录
2021 年 10 月
IronOCR v2021.11.0
功能与升级
https://www.nuget.org/packages/IronOcr/2021.11.0
发布说明:
- 错误已修复:Azure 函数兼容性
- 修正了错误:可使用只读 OCR 字典
- 修正的错误:现在可与 .NET 5.07 兼容
- 修正的错误:从项目配置文件读取许可证密钥(边缘情况)
- 功能: 为 OcrInput 添加颜色替换方法
- 功能 从 TIFF 和 PDF 文件加载特定帧
- 已改进:更新了 System.Drawing.Common