IronOCR 实用工具(Windows)
除了IronOCR API 库之外,还有一个名为IronOCR Utility的 Windows 桌面程序可供下载。 此应用程序可用于:
- 购买前请评估并测试 IronOCR 的功能。
- 可视化 IronOCR 文件,找到合适的滤镜或裁剪区域。
- 找到合适的设置,以便将 C# 代码读取并导出到您的 IDE。
Tesseract桌面实用程序
- 安装免费的 Tesseract 5 桌面实用程序。
- 通过免费试用版评估 OCR 实用程序。
- 将 OCR 库添加到您的项目中。
- 阅读所有文档并导出为可搜索的PDF文件。
演示安装和设置
IronOCR Utility 可以免费安装,并可与任何有效的试用版、IronOCR 或 Suite 许可证密钥一起使用。 如果您没有许可证,您可以在这里获得一个免费的完整功能试用密钥,无需信用卡或创建帐户。
- To install our IronOCR Utility, please download our ZIP here.
-
解压 ZIP 文件,然后运行
setup.exe。 你应该看看这个:
- 接下来,如果
IronOcrUtility.application没有自动运行,请手动运行它。 -
在此应用程序屏幕上,将您的试用版或完整版许可证密钥输入到窗口中。 如果您没有密钥,您可以在这里获得一个免费的完整功能试用密钥,无需信用卡或创建帐户。 输入信息后,请点击
APPLY KEY。
- 您现在将看到此默认视图。 开始时,请拖入图像文件或 PDF,或点击"视图面板"中央的
Browse File。
使用实用程序评估 IronOCR 后,就可以将 IronOCR 添加到您的库或应用程序中了。
IronOCR库安装
IronOCR Utility 提供了一种可视化的交互式方式来使用 IronOCR,而 IronOCR 软件包则提供了更多功能和语言,以及一个直观的 API,用于使用定制和优化的 Tesseract 5,即 Iron Tesseract。 通过 IronOCR 和 IronTesseract 将 Tesseract 集成到您的项目中,您就能将任何包含文本的文件或图像,以及扫描文档,转换为文本和可搜索的 PDF 文件。
示例用法和演练
设置高亮类型
默认情况下,视图面板不会添加任何高亮显示。 要启用代码高亮,请从 Highlight Settings 菜单中选择一项设置。 推荐设置为 Word:

这将高亮显示IronOCR能够识别的所有单词。 您可以将鼠标悬停在单词上,查看猜测的单词和置信度。 红色高亮部分的强度反映了置信度:

通过应用筛选器来改善阅读体验
许多图像都存在噪点、模糊和歪斜等问题。 为了提高可读性,我们需要过滤掉这些内容。 如下图所示,必须对文本进行矫正和校正,以提高置信度和结果质量:

导航至左侧的"筛选器"面板,即可将各种筛选器加入队列并实时查看更新。您还可以取消队列或调整其值:

在此处应用斜角校正过滤器将更新右侧"输出"面板中的代码,从而提高结果的准确性:

导出结果或添加到 .NET 项目
若要将此结果纳入您的项目,请在"代码面板"中使用 COPY 按钮,导出与"输出面板"结果一致的代码。 将代码粘贴到你的 IDE 中,并将文件路径更改为你的图像文件路径。

对于扫描文档,如果您需要生成可在原始图像或 PDF 上叠加文本的可搜索 PDF,可以使用 EXPORT AS PDF 按钮进行导出:


