通过 IronOCR 的更新日志保持更新
IronOCR 路线图
我们开发了IronOCR来填补市场需求,它已成为我们的主打产品之一。 今天,我们不断根据社区需求推出新的功能请求。
我们积极使用谷歌最新的Tesseract技术以提高稳定性和高准确性。
这确保了我们的客户受益于最先进的OCR读取引擎。
我们的每月发布中,IronOCR不断证明其价值,并推动我们的使命,帮助终端用户推动.NET语言的发展。
我们知道IronOCR是开发人员的首选之一。 为了将IronOCR确立为同类产品中的领导者,我们正在应用最新技术来改进图像过滤器、计算机视觉和机器学习。
我们的下一个重大目标是推出适用于多种编程语言的IronOCR。 ¹Based on a customer survey conducted in June 2022.
2025年3月
IronOCR v2025.3.2
功能与升级
https://www.nuget.org/packages/IronOcr/2025.3.2
发布说明:
- 将
IronSoftware.System.Drawing
更新至 2025.3.5。 - 修复从图像输入生成的可搜索PDF页面尺寸不正确的问题。
2025年2月
IronOCR v2025.2.3
功能与升级
https://www.nuget.org/packages/IronOcr/2025.2.3
发布说明:
增强功能:
将 Read 和 SaveAsSearchablePdf 方法的速度性能提升了 30%,并优化了 40% 的内存管理。
错误修复:
- 修复部署过程不尊重设置的安装路径。
- 修复了将多文件类型读取和生成为可搜索PDF的问题。
2025年1月
IronOCR v2025.1.2
功能与升级
https://www.nuget.org/packages/IronOcr/2025.1.2
发布说明:
增强功能:
- 启用
RenderSearchablePdf
和AutoRotateDetectionForRenderSearchablePdf
时提高阅读速度。 - 改进了
Read
方法中边缘情况问题的异常错误信息。 - 更新依赖包以解决已知的安全漏洞。
禁用内部日志消息。
错误修复:
- 修复将
OcrResult
序列化为 JSON 时抛出异常的问题。
2024年12月
IronOCR v2024.12.2
功能与升级
https://www.nuget.org/packages/IronOcr/2024.12.2
发布说明:
- 将
IronSoftware.System.Drawing
依赖项更新到 2024.12.3
2024年11月
IronOCR v2024.11.3
功能与升级
https://www.nuget.org/packages/IronOcr/2024.11.3
发布说明:
- 将
IronSoftware.System.Drawing
依赖项更新到 2024.9.15。 - 减少可搜索PDF文件在大多数用例中的文件大小。
- 修复了可搜索PDF中尺寸不一致的问题。
- 添加了一个新的
Tesseract
配置AutoRotateDetectionForRenderSearchablePdf
,使用户可以禁用自动旋转并手动调整输入文件的方向。
2024年10月
IronOCR v2024.10.3
功能与升级
https://www.nuget.org/packages/IronOcr/2024.10.3
发布说明:
- 改进了对旋转输入的
ReadPassport
。 - 更新
IronSoftware.System.Drawing
依赖项至 2024.9.11
2024年9月
IronOCR v2024.9.6
功能与升级
https://www.nuget.org/packages/IronOcr/2024.9.6
发布说明:
- 添加了一种新的读取方法
ReadDocumentAdvanced
,专门用于读取表格数据。 - 将
IronSoftware.System.Drawing
依赖项更新为 2024.9.10
2024年8月
IronOCR v2024.8.21
功能与升级
https://www.nuget.org/packages/IronOcr/2024.8.21
发布说明:
- 修复临时文件在读取完成后未被清理的问题
- 更新 IronSoftware.System.Drawing 依赖项至 2024.8.1
2024 年 7 月
IronOCR v2024.7.13
功能与升级
https://www.nuget.org/packages/IronOcr/2024.7.13
发布说明:
- 修复了DetectPageOrientation仅返回第一页内容结果的问题。
- 修复ConvertToSearchablePdf重载问题。
- 减少从 Tiff 输入文件生成的可搜索 PDF 输出文件的大小。
- 更新IronSoftware.System.Drawing依赖项至2024.7.2
2024 年 6 月
IronOCR v2024.6.3
功能与升级
https://www.nuget.org/packages/IronOcr/2024.6.3
发布说明:
- 改进对扫描字符的控制:在高级扫描过程中获得对捕获字符的更多控制。
- 增强的文档扫描:高级扫描模式现在支持包含中文、繁体中文、日语、韩语和拉丁语在内的更多语言,使您能够扫描更多语言的文档。
- 修复可搜索PDF文本重叠问题:此次更新解决了可搜索PDF在扫描后出现文本重叠的问题。
- 修复部署到 Azure Function 时的问题:此更新解决了将 IronOCR 部署到 Azure Functions 时导致错误的问题。
- 将
IronSoftware.System.Drawing
依赖项更新到 2024.6.1
2024 年 5 月
IronOCR v2024.5.25
功能与升级
https://www.nuget.org/packages/IronOcr/2024.5.25
发布说明:
- 引入新的 Read 方法,需单独安装
IronOcr.Extension.AdvancedScan
包。 - 新高级方法:
ReadPhoto
()[参见
IronOcr.Extension.AdvancedScan` NuGet 软件包]. - 新高级方法:
ReadScreenshot
()[参见
IronOcr.Extension.AdvancedScan` NuGet 软件包]. - 新高级方法:
ReadPassport
()[参见
IronOcr.Extension.AdvancedScan` NuGet 软件包]. - 新高级方法:
ReadLicensePlate
()[参见
IronOcr.Extension.AdvancedScan` NuGet 软件包]. - 将
IronSoftware.System.Drawing
依赖项更新到 2024.5.1
2024 年 4 月
IronOCR v2024.4.6
功能与升级
https://www.nuget.org/packages/IronOcr/2024.4.6
发布说明:
- 移除与OCR过程无关的公共日志。
- 更新
IronSoftware.System.Drawing
依赖到 2024.4.1
2024 年 3 月
IronOCR v2024.3.4
功能与升级
https://www.nuget.org/packages/IronOcr/2024.3.4
发布说明:
- 实现 DetectPageOrientation 以检测输入的方向。
- 修复了在 .NET Framework 中无法从 web.config 文件中获取许可证密钥的错误。
- 更新 IronSoftware.System.Drawing 依赖项至 2024.3.4
2024 年 2 月
IronOCR v2024.2.41
功能与升级
https://www.nuget.org/packages/IronOcr/2024.2.41
发布说明:
- 将所有
OcrInput
方法的前缀从 Add 改为 Load。 请尝试.Load()
,.LoadImage()
,.LoadPdf()
- 在大PDF输入环境中,总体速度提高最多可达90%,使用的分配和活动对象减少多达80%。
- 在IronCV上下文中改进了位图的内存管理。
- 将
SearchablePdf
移至其自身的标志。 请查看Configuration.RenderSearchablePdf
,该选项默认开启。 - 从默认标志中移除hOCR输出。 使用
Configuration.RenderhOCR = true
来明确使用 - 更新
IronSoftware.System.Drawing
依赖关系到 2024.2.2
2024 年 1 月
IronOCR v2024.1.17
功能与升级
https://www.nuget.org/packages/IronOcr/2024.1.17
发布说明:
- 更新
IronSoftware.System.Drawing
到 v2024.4.1 - 修复旋转在输出可搜索 PDF 中被忽略的问题。
- 将输出的可搜索PDF的尺寸调整为相对于输入图像的尺寸。
- 修复16 BPP bmp导出为空白可搜索PDF的问题。
2023 年 12 月
IronOCR v2023.12.34
功能与升级
https://www.nuget.org/packages/IronOcr/2023.12.34
发布说明:
- 更新
IronSoftware.System.Drawing
至 v2023.12.1
2023 年 11 月
IronOCR v2023.11.35
功能与升级
https://www.nuget.org/packages/IronOcr/2023.11.35
发布说明:
- 现在,保存可搜索的 PDF 时,将正确输出原始图像尺寸,而不是 A4。
- 解决了预旋转 PDF 文档保存为正方形输出可搜索 PDF 的问题。
OcrResult.Barcode
的位置数据现在基于原始图像而不是相对于裁剪区域。- 支持UTF-8编码的
OcrResult.SaveAsTextFile
StampCropRectangle
现在可以接受一个矩形列表进行盖章StampCropRectangle
有一个静态重载,可以返回已加盖的OcrInput
以供进一步处理。
2023 年 10 月
IronOCR v2023.10.9
功能与升级
https://www.nuget.org/packages/IronOcr/2023.10.9
发布说明:
- Updated IronSoftware.System.Drawing to version 2023.10.1.
- Updated IronSoftware.Common to version 2023.10.2.
2023 年 9 月
IronOCR v2023.9.4
功能与升级
https://www.nuget.org/packages/IronOcr/2023.9.4
发布说明:
- Fixes bug causing a crash when multiple Iron Software products are installed
- Added IronSoftware.Common as a new dependency
- Updated IronSoftware.System.Drawing to version 2023.9.2
- Updated IronSoftware.Native.PdfModelto version 2023.9.18570
2023 年 8 月
IronOCR v2023.8.34
功能与升级
https://www.nuget.org/packages/IronOcr/2023.8.34
发布说明:
- 可搜索的PDF现在保留书签、注释、页面方向等功能。(使用OcrPdfInput)
- 可搜索的PDF现在需要更少的磁盘空间
- 新增OcrPdfInput类,用于简化PDF文档的OCR
- 新增OcrImageInput类,用于简化图像的OCR
- 弃用OcrInput类,但在可预见的未来仍可使用
- 修复裁剪矩形的盖章显示不正确的问题
## 2023 年 7 月
IronOCR v2023.7.28
功能与升级 **[https://www.nuget.org/packages/IronOcr/2023.7.28](https://www.nuget.org/packages/IronOcr/2023.7.28)** #### 发布说明:- Added EnableTesseractWarnings set to false by default, to suppress Tesseract warnings in the console
- Using IronSoftware.Native.PdfModel to read and write PDF
- Updates IronSoftware.System.Drawing to 2023.7.1
## 2023 年 6 月
IronOCR v2023.6.6
功能与升级 **[https://www.nuget.org/packages/IronOcr/2023.6.6](https://www.nuget.org/packages/IronOcr/2023.6.6)** #### 发布说明:Major Changes:
- PostBuildEvent Runtime Folder Copy Fix: Resolved an issue related to copying the runtime folder during PostBuildEvent
- Updates IronSoftware.System.Drawing to 2023.6.1
## 2023 年 5 月
IronOCR v2023.5.35
功能与升级 **[https://www.nuget.org/packages/IronOcr/2023.5.35](https://www.nuget.org/packages/IronOcr/2023.5.35)** #### 发布说明:Major Changes:
- Fixes an issue where license keys would not be retrieved from web.config in some .NET Framework ASP.NET projects
- Updates IronSoftware.System.Drawing to 2023.4.4
## 2023 年 4 月
IronOCR v2023.4.13
功能与升级 **[https://www.nuget.org/packages/IronOcr/2023.4.13](https://www.nuget.org/packages/IronOcr/2023.4.13)** #### 发布说明:Major Changes:
- 更新 IronSoftware.System.Drawing 到 2023.3.3
- Includes new ReadPdfAndOverlayText method on IronTesseract to add text and preserve original PDF bookmarks/annotations
- Resolves an issue causing Searchable PDFs with many images to becomes large files
- Fixes an issue where the Binarize filter made Searchable PDFs blank
- Fixes issue where the Read method would create temp files and not clean them up
- Adds support for the Iron Suite license keys
- Fixes issues with license keys stored in .config and .json files not being picked up by IronOCR
- Adds support for license keys stored in .config and .json files in subfolders of the application
## 2023 年 3 月
IronOCR v2023.3.2
功能与升级 **[https://www.nuget.org/packages/IronOcr/2023.3.2](https://www.nuget.org/packages/IronOcr/2023.3.2)** #### 发布说明:主要更改:
- 增加对 AWS(Amazon Linux)的兼容性
- 增加对各种旧版 Linux 发行版的兼容性
- 提高从 PDF 中读取文本的可靠性
- 提高创建可搜索 PDF 的速度和保真度
- 改进查找语言文件的逻辑
- 去除对
System.Drawing
的依赖
## 2023 年 1 月
IronOCR v2023.1.11644
功能与升级 **[https://www.nuget.org/packages/IronOcr/2023.1.11644](https://www.nuget.org/packages/IronOcr/2023.1.11644)** #### 发布说明:Major Changes:
- Adds
Installation.LanguagePackDirectory
for specifying path to .ocrdata files - Fixes IronOcr for use with ClickOnce publishing and 'dotnet publish' command
- Fixes some instances where language packs would fail to load
- Fixes crop rectangle being ignored when reading from TIFF images
- Fixes trial users not being able to read text from images
- Allows single-threaded OCR reads (see
IronTesseract.Multithreaded
)
## 2022 年 12 月
IronOCR v2022.12.10830
功能与升级 **[https://www.nuget.org/packages/IronOcr/2022.12.10830](https://www.nuget.org/packages/IronOcr/2022.12.10830)** #### 发布说明:Major Changes:
- Adds
IronSoftware.System.Drawing
to replaceSystem.Drawing.Common
in IronOCR - Removes internal dependency on
System.Drawing.Common
(see footnote [1] for more info) - Adds support for .NET 7
- Removes support for .NET Framework 4. Minimum supported for .NET Framework is now version 4.6.2
Other Changes:
- Improves support for many Linux Distros
- Improves
OcrFilters.DeNoise
: Now reduces speckle noise. - Adds brand new
OcrFilters
to improve reading from noisy images: Open
: Filter that is useful for removing noise.Close
: Filter that is useful for closing small holes inside foreground objects.AdaptiveThreshold
: Applies a Bradley Adaptive Threshold to the image.
[1] Note about removal of System.Drawing.Common
:
- Microsoft has discontinued support for
System.Drawing.Common
on non-Windows for .NET 6, and completely for .NET 7 : https://docs.microsoft.com/en-us/dotnet/core/compatibility/core-libraries/6.0/system-drawing-common-windows-only - In order to handle this, we have developed an open-source library called
IronSoftware.System.Drawing
which easily translates between all the common types and formats thatSystem.Drawing.Common
did which will replace it - Customers who still want to use
System.Drawing.Common
with IronOCR will still be able to.IronSoftware.System.Drawing
will work with this format but sinceSystem.Drawing.Common
is no longer a dependency, usage will require the customer to add a `using System.Drawing.Common;` call in their code.
## 2022年10月
IronOCR v2022.11.10109
功能与升级 **[https://www.nuget.org/packages/IronOcr/2022.11.10109](https://www.nuget.org/packages/IronOcr/2022.11.10109)** #### 发布说明:- Fixes MAUI support
- Fixes 'missing runtimes folder' error
- Fixes 'missing libtesseract' error
- Greatly improved compatibility and deployment on many platforms
- Adds 'Installation.MachineLearningModelsDirectory' for specifying path to .onnx files
- Minor bug fixes
- Now supports installation via zip file or installer
## 2022 年 9 月
IronOCR v2022.10.9390
功能与升级 **[https://www.nuget.org/packages/IronOcr/2022.10.9390](https://www.nuget.org/packages/IronOcr/2022.10.9390)** #### 发布说明:- Adds support for using machine learning technology to detect regions which may contain text
- Adds OcrInput methods FindTextRegion and FindMultipleTextRegions - add the IronOcr.ComputerVision NuGet package for your platform
- Adds OcrResult method SaveAsSearchablePdfStream for saving a result as a PDF stream
- Updates Windows build to require fewer dependencies and use less disk space
- Updates image loading to always remove color tables from images before performing OCR, improving accuracy
- Fixes GetCropRectangleImage to work properly with all source image formats
- Fixes issue with Installation.LoggingMode and LogFilePath not applying properly
## 2022 年 8 月
IronOCR v2022.8.8198
功能与升级 **[https://www.nuget.org/packages/IronOcr/2022.8.8198](https://www.nuget.org/packages/IronOcr/2022.8.8198)** #### 发布说明:- Added new method for visualizing a crop rectangle on an image. See OcrInput.StampCropRectangleAndSaveAs()
- Added new method for applying multiple filters at once. See OcrInput.ApplyMultipleFilters()
- Changes Deskew filter to no longer throw an exception on failure
- Improves compatibility on Windows systems which may not have Microsoft C++ redistributables installed
- Improves compatibility on MacOs systems (both Intel and Apple Silicon) which may be missing certain imaging libraries
## 2022 年 7 月
IronOCR v2022.8.7804
功能与升级 **[https://www.nuget.org/packages/IronOcr/2022.8.7804](https://www.nuget.org/packages/IronOcr/2022.8.7804)** #### 发布说明:- Updates Tesseract to version 5.1
- Adds support for Apple Silicon devices (MacOs on ARM processor)
- Adds OcrInput.SaveAsImages() for saving input items as an image
- Adds CropRectangle class which allows cropping using millimeter values or pixel values
- Removes MinimumDpi. Please use TargetDpi to upscale your OCR input
- Setting TargetDpi to null now prevents IronOcr from upscaling images, resulting in much smaller searchable PDFs
- Fixes bug where Erosion filter applied Dialation and Dialation filter applied Erosion
- Fixes bug where PDF pages were numbered incorrectly
- Improves compatibility across various Linux distributions
## 2022 年 3 月
IronOCR v2022.3.0
功能与升级 **[https://www.nuget.org/packages/IronOcr/2022.3.0](https://www.nuget.org/packages/IronOcr/2022.3.0)** #### 发布说明:- Improved: .NET 6 Support
- Improved: Secuirty & Performance
## 2022 年 1 月
IronOCR v2022.1.0
功能与升级 **[https://www.nuget.org/packages/IronOcr/2022.1.0](https://www.nuget.org/packages/IronOcr/2022.1.0)** #### 发布说明:- 改进:多线程和性能
- 改进:PDF OCR 性能
- 功能:OCR 进度跟踪
- 改进:方向和脚本检测 (OSD)
- 改进:去斜方法
- 改进:安全性和性能
## 2021 年 12 月
IronOCR v2021.12.0
功能与升级 **[https://www.nuget.org/packages/IronOcr/2021.12.0](https://www.nuget.org/packages/IronOcr/2021.12.0)** #### 发布说明:- Improved: Speed and Stability
- Improved: .NET 5 and .NET 6 Beta support
- Improved: Logging
## 2021 年 10 月
IronOCR v2021.11.0
功能与升级 **[https://www.nuget.org/packages/IronOcr/2021.11.0](https://www.nuget.org/packages/IronOcr/2021.11.0)** #### 发布说明:- Bug Fixed: Azure Function Compatibility
- Bug Fixed: Works with read-only OCR dictionaries
- Bug Fixed: Now works with .NET 5.07
- Bug Fixed: License Keys reading from project configuration files (edge casess)
- Feature: Color replacement methods added to OcrInput
- Feature: Load specfic frames from TIFF and PDF files
- Improved: Updated System.Drawing.Common