变更日志:更新、里程碑、路线图
[{hpt:chngLogFrm}]
IronOCR 路线图
我们开发了IronOCR来填补市场需求,它已成为我们的主打产品之一。 今天,我们不断根据社区需求推出新的功能请求。
我们积极使用谷歌最新的Tesseract技术以提高稳定性和高准确性。
这确保了我们的客户受益于最先进的OCR读取引擎。
我们的每月发布中,IronOCR不断证明其价值,并推动我们的使命,帮助终端用户推动.NET语言的发展。
我们知道IronOCR是开发人员的首选之一。 为了将IronOCR确立为同类产品中的领导者,我们正在应用最新技术来改进图像过滤器、计算机视觉和机器学习。
我们的下一个重大目标是推出适用于多种编程语言的IronOCR。 ¹ 基于 2022 年 6 月进行的客户调查。
2024年12月
IronOCR v2024.12.2
功能与升级
https://www.nuget.org/packages/IronOcr/2024.12.2
发布说明:
- 将
IronSoftware.System.Drawing
依赖项更新到 2024.12.3
2024年11月
IronOCR v2024.11.3
功能与升级
https://www.nuget.org/packages/IronOcr/2024.11.3
发布说明:
- 将
IronSoftware.System.Drawing
依赖项更新到 2024.9.15。 - 减少可搜索PDF文件在大多数用例中的文件大小。
- 修复了可搜索PDF中尺寸不一致的问题。
- 添加了一个新的
Tesseract
配置AutoRotateDetectionForRenderSearchablePdf
,使用户可以禁用自动旋转并手动调整输入文件的方向。
2024年10月
IronOCR v2024.10.3
功能与升级
https://www.nuget.org/packages/IronOcr/2024.10.3
发布说明:
- 改进了对旋转输入的
ReadPassport
。 - 更新
IronSoftware.System.Drawing
依赖项至 2024.9.11
2024年9月
IronOCR v2024.9.6
功能与升级
https://www.nuget.org/packages/IronOcr/2024.9.6
发布说明:
- 添加了一种新的读取方法
ReadDocumentAdvanced
,专门用于表格数据读取。 - 将
IronSoftware.System.Drawing
依赖项更新为 2024.9.10
2024年8月
IronOCR v2024.8.21
功能与升级
https://www.nuget.org/packages/IronOcr/2024.8.21
发布说明:
- 修复临时文件在读取完成后未被清理的问题
- 更新 IronSoftware.System.Drawing 依赖项至 2024.8.1
2024 年 7 月
IronOCR v2024.7.13
功能与升级
https://www.nuget.org/packages/IronOcr/2024.7.13
发布说明:
- 修复了DetectPageOrientation仅返回第一页内容结果的问题。
- 修复ConvertToSearchablePdf重载问题。
- 减少从 Tiff 输入文件生成的可搜索 PDF 输出文件的大小。
- 更新IronSoftware.System.Drawing依赖项至2024.7.2
2024 年 6 月
IronOCR v2024.6.3
功能与升级
https://www.nuget.org/packages/IronOcr/2024.6.3
发布说明:
- 改进对扫描字符的控制:在高级扫描过程中获得对捕获字符的更多控制。
- 增强的文档扫描:高级扫描模式现在支持包含中文、繁体中文、日语、韩语和拉丁语在内的更多语言,使您能够扫描更多语言的文档。
- 修复可搜索PDF文本重叠问题:此次更新解决了可搜索PDF在扫描后出现文本重叠的问题。
- 修复部署到 Azure Function 时的问题:此更新解决了将 IronOCR 部署到 Azure Functions 时导致错误的问题。
- 将
IronSoftware.System.Drawing
依赖项更新到 2024.6.1
2024 年 5 月
IronOCR v2024.5.25
功能与升级
https://www.nuget.org/packages/IronOcr/2024.5.25
发布说明:
- 引入新的 Read 方法,需单独安装
IronOcr.Extension.AdvancedScan
包。 - 新高级方法:
ReadPhoto
()[参见
IronOcr.Extension.AdvancedScan` NuGet 软件包]. - 新高级方法:
ReadScreenshot
()[参见
IronOcr.Extension.AdvancedScan` NuGet 软件包]. - 新高级方法:
ReadPassport
()[参见
IronOcr.Extension.AdvancedScan` NuGet 软件包]. - 新高级方法:
ReadLicensePlate
()[参见
IronOcr.Extension.AdvancedScan` NuGet 软件包]. - 将
IronSoftware.System.Drawing
依赖项更新到 2024.5.1
2024 年 4 月
IronOCR v2024.4.6
功能与升级
https://www.nuget.org/packages/IronOcr/2024.4.6
发布说明:
- 移除与OCR过程无关的公共日志。
- 更新
IronSoftware.System.Drawing
依赖到 2024.4.1
2024 年 3 月
IronOCR v2024.3.4
功能与升级
https://www.nuget.org/packages/IronOcr/2024.3.4
发布说明:
- 实现 DetectPageOrientation 以检测输入的方向。
- 修复了在 .NET Framework 中无法从 web.config 文件中获取许可证密钥的错误。
- 更新 IronSoftware.System.Drawing 依赖项至 2024.3.4
2024 年 2 月
IronOCR v2024.2.41
功能与升级
https://www.nuget.org/packages/IronOcr/2024.2.41
发布说明:
- 将所有
OcrInput
方法的前缀从 Add 改为 Load。 请尝试.Load()
,.LoadImage()
,.LoadPdf()
- 在大PDF输入环境中,总体速度提高最多可达90%,使用的分配和活动对象减少多达80%。
- 在IronCV上下文中改进了位图的内存管理。
- 将
SearchablePdf
移至其自身的标志。 请查看Configuration.RenderSearchablePdf
,该选项默认开启。 - 从默认标志中移除hOCR输出。 使用
Configuration.RenderhOCR = true
来明确使用 - 更新
IronSoftware.System.Drawing
依赖关系到 2024.2.2
2024 年 1 月
IronOCR v2024.1.17
功能与升级
https://www.nuget.org/packages/IronOcr/2024.1.17
发布说明:
- 更新
IronSoftware.System.Drawing
到 v2024.4.1 - 修复旋转在输出可搜索 PDF 中被忽略的问题。
- 将输出的可搜索PDF的尺寸调整为相对于输入图像的尺寸。
- 修复16 BPP bmp导出为空白可搜索PDF的问题。
2023 年 12 月
IronOCR v2023.12.34
功能与升级
https://www.nuget.org/packages/IronOcr/2023.12.34
发布说明:
- 更新
IronSoftware.System.Drawing
至 v2023.12.1
2023 年 11 月
IronOCR v2023.11.35
功能与升级
https://www.nuget.org/packages/IronOcr/2023.11.35
发布说明:
- 现在,保存可搜索的 PDF 时,将正确输出原始图像尺寸,而不是 A4。
- 解决了预旋转 PDF 文档保存为正方形输出可搜索 PDF 的问题。
OcrResult.Barcode
的位置数据现在基于原始图像而不是相对于裁剪区域。- 支持UTF-8编码的
OcrResult.SaveAsTextFile
StampCropRectangle
现在可以接受一个矩形列表进行盖章StampCropRectangle
有一个静态重载,可以返回已加盖的OcrInput
以供进一步处理。
2023 年 10 月
IronOCR v2023.10.9
功能与升级
https://www.nuget.org/packages/IronOcr/2023.10.9
发布说明:
- 将 IronSoftware.System.Drawing 更新至 2023.10.1 版。
- 已将 IronSoftware.Common 更新至 2023.10.2 版。
2023 年 9 月
IronOCR v2023.9.4
功能与升级
https://www.nuget.org/packages/IronOcr/2023.9.4
发布说明:
- 修复在安装多个 Iron 软件产品时导致崩溃的错误
- 已将 IronSoftware.Common 添加为新的依赖关系
- 已将 IronSoftware.System.Drawing 更新至 2023.9.2 版
- 已更新 IronSoftware.Native.PdfModel 至版本 2023.9.18570
2023 年 8 月
IronOCR v2023.8.34
功能与升级
https://www.nuget.org/packages/IronOcr/2023.8.34
发布说明:
- 可搜索 PDF 现在可保留书签、注释、页面方向等(使用 OcrPdfInput)
- 可搜索 PDF 文件现在所需的磁盘空间更少
- 添加了 OcrPdfInput 类,可简化 PDF 文档的 OCR 处理
- 已添加 OcrImageInput 类,可简化图像的 OCR 处理
- 已弃用的 OcrInput 类,但在可预见的将来仍可使用
- 修复裁剪矩形的冲压显示不正确的问题
2023 年 7 月
IronOCR v2023.7.28
功能与升级
https://www.nuget.org/packages/IronOcr/2023.7.28
发布说明:
- 已添加 EnableTesseractWarnings(魔方警告),默认设置为 false,以抑制控制台中的魔方警告
- 使用 IronSoftware.Native.PdfModel 读写 PDF
- 将 IronSoftware.System.Drawing 更新至 2023.7.1
2023 年 6 月
IronOCR v2023.6.6
功能与升级
https://www.nuget.org/packages/IronOcr/2023.6.6
发布说明:
主要变化:
- PostBuildEvent 运行时文件夹复制修复:解决了在 PostBuildEvent 期间复制运行时文件夹的相关问题
- 将 IronSoftware.System.Drawing 更新至 2023.6.1
2023 年 5 月
IronOCR v2023.5.35
功能与升级
https://www.nuget.org/packages/IronOcr/2023.5.35
发布说明:
主要变化:
- 修复了在某些 .NET Framework ASP.NET 项目中无法从 web.config 中检索许可证密钥的问题
- 将 IronSoftware.System.Drawing 更新至 2023.4.4
2023 年 4 月
IronOCR v2023.4.13
功能与升级
https://www.nuget.org/packages/IronOcr/2023.4.13
发布说明:
主要变化:
- 将 IronSoftware.System.Drawing 更新至 2023.3.3
- 包括 IronTesseract 上新的 ReadPdfAndOverlayText 方法,可添加文本并保留原始 PDF 书签/注释
- 解决了导致包含大量图像的可搜索 PDF 文件变大的问题
- 修复了 "二值化"(Binarize)筛选器使可搜索 PDF 文件变为空白的问题
- 修复了 "读取 "方法会创建临时文件而不清理的问题
- 增加了对 IronSuite 许可证密钥的支持
- 修复了 IronOCR 无法获取 .config 和 .json 文件中存储的许可证密钥的问题
- 新增对存储在应用程序子文件夹中 .config 和 .json 文件中的许可证密钥的支持
2023 年 3 月
IronOCR v2023.3.2
功能与升级
https://www.nuget.org/packages/IronOcr/2023.3.2
发布说明:
主要变化:
- 增加了对 AWS(亚马逊 Linux)的兼容性
- 增加了对各种旧版 Linux 发行版的兼容性
- 提高从 PDF 阅读文本的可靠性
- 提高创建可搜索 PDF 文件的速度和保真度
- 改进查找语言文件的逻辑
- 移除对
System.Drawing
2023 年 1 月
IronOCR v2023.1.11644
功能与升级
https://www.nuget.org/packages/IronOcr/2023.1.11644
发布说明:
主要变化:
- 添加
Installation.LanguagePackDirectory
用于指定 .ocrdata 文件的路径 - 修复 IronOcr,以便与 ClickOnce 发布和 "dotnet 发布 "命令配合使用
- 修复了某些语言包无法加载的情况
- 修复从 TIFF 图像读取时忽略裁剪矩形的问题
- 修复试用版用户无法从图像中读取文字的问题
- 允许单线程 OCR 读取(见
IronTesseract.Multithreaded
)
2022 年 12 月
IronOCR v2022.12.10830
功能与升级
https://www.nuget.org/packages/IronOcr/2022.12.10830
发布说明:
主要变化:
- 添加
IronSoftware.System.Drawing
以取代System.Drawing.Common
在 IronOCR 中 - 移除对
System.Drawing.Common
(更多信息见脚注[1])。 - 增加了对 .NET 7 的支持
- 移除对 .NET Framework 4 的支持。现在支持的 .NET Framework 最低版本为 4.6.2
其他变化:
- 改进对许多 Linux 发行版的支持
- 改善
OcrFilters.DeNoise
:现在可以减少斑点噪声。 - 增加了全新的
OcrFilters
以改善嘈杂图像的阅读效果: 开放
:滤波器:用于去除噪音。关闭
:滤镜:用于封闭前景物体内部的小孔。自适应阈值
:对图像应用布拉德利自适应阈值。
[1] 关于删除 System.Drawing.Common
:
- 微软已停止支持
System.Drawing.Common
在非 Windows 环境下,.NET 6 和 .NET 7 可以完全兼容: ;https://docs.microsoft.com/en-us/dotnet/core/compatibility/core-libraries/6.0/system-drawing-common-windows-only - 为了解决这个问题,我们开发了一个名为
IronSoftware.System.Drawing
它可以轻松地在所有常见类型和格式之间进行转换。System.Drawing.Common
它将被取代 - 仍希望使用
System.Drawing.Common
使用 IronOCR 的用户仍然可以这样做。IronSoftware.System.Drawing
可以使用这种格式,但由于System.Drawing.Common
不再是依赖项,使用时客户需要在代码中添加 "using System.Drawing.Common; "调用。
2022年10月
IronOCR v2022.11.10109
功能与升级
https://www.nuget.org/packages/IronOcr/2022.11.10109
发布说明:
- 修复 MAUI 支持
- 修复 "缺少运行时文件夹 "错误
- 修复 "缺少 libtesseract "错误
- 在许多平台上的兼容性和部署得到极大改善
- 添加 "Installation.MachineLearningModelsDirectory",用于指定 .onnx 文件的路径
- 小错误修复
- 现在支持通过压缩文件或安装程序进行安装
2022 年 9 月
IronOCR v2022.10.9390
功能与升级
https://www.nuget.org/packages/IronOcr/2022.10.9390
发布说明:
- 支持使用机器学习技术检测可能包含文本的区域
- 添加 OcrInput 方法 FindTextRegion 和 FindMultipleTextRegions - 为您的平台添加 IronOcr.ComputerVision NuGet 软件包
- 添加 OcrResult 方法 SaveAsSearchablePdfStream,用于将结果保存为 PDF 流
- 更新 Windows 构建,以减少所需的依赖性和磁盘空间
- 更新图像加载功能,在执行 OCR 之前始终删除图像中的颜色表,从而提高准确性
- 修复了 GetCropRectangleImage,使其能在所有源图像格式下正常工作
- 修复了 Installation.LoggingMode 和 LogFilePath 无法正确应用的问题
2022 年 8 月
IronOCR v2022.8.8198
功能与升级
https://www.nuget.org/packages/IronOcr/2022.8.8198
发布说明:
- 添加了在图像上可视化裁剪矩形的新方法。请参见 OcrInput.StampCropRectangleAndSaveAs()
- 添加了一次性应用多个过滤器的新方法。请参见 OcrInput.ApplyMultipleFilters()
- 更改纠偏过滤器,不再在失败时抛出异常
- 提高 Windows 系统的兼容性,因为 Windows 系统可能未安装 Microsoft C++ 可再分发软件
- 改善可能缺少某些图像库的 MacOs 系统(包括英特尔和苹果硅)的兼容性
2022 年 7 月
IronOCR v2022.8.7804
功能与升级
https://www.nuget.org/packages/IronOcr/2022.8.7804
发布说明:
- 将 Tesseract 更新至 5.1 版
- 新增对 Apple Silicon 设备(ARM 处理器上的 MacOs)的支持
- 添加 OcrInput.SaveAsImages(),用于将输入项保存为图像
- 添加了 CropRectangle 类,该类允许使用毫米值或像素值进行裁剪
- 移除 MinimumDpi。请使用 TargetDpi 来提高 OCR 输入的分辨率
- 将 TargetDpi 设置为空,现在可防止 IronOcr 放大图像,从而使可搜索的 PDF 大幅缩小
- 修复了 "侵蚀 "过滤器应用 "拨号 "和 "拨号 "过滤器应用 "侵蚀 "的错误
- 修复了 PDF 页码编号不正确的错误
- 提高各种 Linux 发行版的兼容性
2022 年 3 月
IronOCR v2022.3.0
功能与升级
https://www.nuget.org/packages/IronOcr/2022.3.0
发布说明:
- 改进:支持 .NET 6
- 改进:安全性和性能
2022 年 1 月
IronOCR v2022.1.0
功能与升级
https://www.nuget.org/packages/IronOcr/2022.1.0
发布说明:
- 改进:多线程和性能
- 改进:PDF OCR 性能
- 功能: OCR 进度跟踪
- 改进:方向和脚本检测(OSD)
- 改进:纠偏方法
- 改进:安全性和性能
2021 年 12 月
IronOCR v2021.12.0
功能与升级
https://www.nuget.org/packages/IronOcr/2021.12.0
发布说明:
- 改进:速度和稳定性
- 改进:支持 .NET 5 和 .NET 6 测试版
- 改进:日志记录
2021 年 10 月
IronOCR v2021.11.0
功能与升级
https://www.nuget.org/packages/IronOcr/2021.11.0
发布说明:
- 错误已修复:Azure 函数兼容性
- 修正了错误:可使用只读 OCR 字典
- 修正的错误:现在可与 .NET 5.07 兼容
- 修正的错误:从项目配置文件读取许可证密钥(边缘情况)
- 功能: 为 OcrInput 添加颜色替换方法
- 功能 从 TIFF 和 PDF 文件加载特定帧
- 已改进:更新了 System.Drawing.Common