IronOCR OCR识别实用工具(Windows)
除了IronOCR API 库之外,还有一个名为IronOCR Utility的 Windows 桌面程序可供下载。 此应用程序可用于:
- 购买前请评估并测试 IronOCR 的功能。
- 可视化 IronOCR 文件,找到合适的滤镜或裁剪区域。
- 找到合适的设置,以便将 C# 代码读取并导出到您的 IDE。
Tesseract桌面实用程序
- 安装免费的 Tesseract 5 桌面实用程序。
- 通过免费试用版评估 OCR 实用程序。
- 将 OCR 库添加到您的项目中。
- 阅读所有文档并导出为可搜索的PDF文件。
演示安装和设置
IronOCR Utility 可以免费安装,并可与任何有效的试用版、IronOCR 或 Suite 许可证密钥一起使用。 如果您没有许可证,您可以在这里获得一个免费的完整功能试用密钥,无需信用卡或创建帐户。
- To install our IronOCR Utility, please download our ZIP here.
-
解压缩 ZIP 文件,然后运行
setup.exe。 你应该看看这个:
- 接下来,如果它没有自动运行,请运行
IronOcrUtility.application。 -
在此应用程序屏幕上,将您的试用版或完整版许可证密钥输入到窗口中。 如果您没有密钥,您可以在这里获得一个免费的完整功能试用密钥,无需信用卡或创建帐户。 输入信息,然后点击
APPLY KEY。
- 您现在将看到此默认视图。 首先,拖入图像文件或 PDF 文件,或者单击视图面板中心的
Browse File。
使用实用程序评估 IronOCR 后,就可以将 IronOCR 添加到您的库或应用程序中了。
IronOCR库安装
IronOCR Utility 提供了一种可视化的交互式方式来使用 IronOCR,而 IronOCR 软件包则提供了更多功能和语言,以及一个直观的 API,用于使用定制和优化的 Tesseract 5,即 Iron Tesseract。 通过使用IronOCR和 IronTesseract 将 Tesseract 添加到您的项目中,您将能够将任何包含文本或扫描文档的文件或图像转换为文本和可搜索的 PDF。
示例用法和演练
设置高亮类型
默认情况下,视图面板不会添加任何高亮显示。 要启用高亮显示,请从 Highlight Settings 菜单中选择一项设置。 推荐设置是 Word:

这将高亮显示IronOCR能够识别的所有单词。 您可以将鼠标悬停在单词上,查看猜测的单词和置信度。 红色高亮部分的强度反映了置信度:

通过应用筛选器来改善阅读体验
许多图像都存在噪点、模糊和歪斜等问题。 为了提高可读性,我们需要过滤掉这些内容。 如下图所示,必须对文本进行矫正和校正,以提高置信度和结果质量:

导航至左侧的"筛选器"面板,即可将各种筛选器加入队列并实时查看更新。您还可以取消队列或调整其值:

在此处应用斜角校正过滤器将更新右侧"输出"面板中的代码,从而提高结果的准确性:

导出结果或添加到 .NET 项目
要将此结果包含在您自己的项目中,请使用代码面板中的 COPY 按钮导出复制输出面板结果的代码。 将代码粘贴到你的 IDE 中,并将文件路径更改为你的图像文件路径。

对于扫描文档,如果您想要一个可搜索的 PDF 文件,并在原始图像或 PDF 文件上叠加文本,您可以使用 EXPORT AS PDF 按钮导出:


