在生产环境中测试,无水印。
随时随地满足您的需求。
获得30天的全功能产品。
几分钟内就能启动并运行。
在您的产品试用期间,全面访问我们的支持工程团队。
OCR - 光学字符识别可以检测数字文件中的文本。 扫描的纸质文件总是被计算机保存为图像文件。 这些图像文件中的数据无法使用普通文本编辑器或文字处理程序进行搜索、编辑或保存为文本格式。 OCR 处理可帮助将这些图像转换为机器可读文本,供用户进一步处理。
在当今时代,通过互联网共享的文件都是数字格式的,而且大多是 PDF 或图片形式。 有很多在线资源可以将图片转换为文本。 然而,大多数企业的软件应用程序都需要这种功能。 考虑到这一点,有许多库提供了可嵌入软件应用程序的 OCR 解决方案。
在本文中,我们将比较两种最流行的 C# OCR 技术:
IronOCR for .NET 是一个用于扫描、搜索和读取图像和PDF的C#库。 它将图像或 PDF 文件作为输入,并使用最新的 Tesseract 5 定制 .NET OCR 引擎输出文本、结构化数据或可搜索的 PDF 文档。 其 Tesseract 支持 125 种以上语言,同时支持从 2.0 到 7 的 .NET Core、Standard 跨平台。
IronOCR 是一个用户友好的 API,使 C# 开发人员可以通过使用 IronTesseract
类自动将图像转换为文本。 翻译必须优先考虑速度、准确性和易用性。 它还能辅助计算机视觉 API 使用一组训练有素的模型查找文本。
IronOCR 的另一个强大功能是可以扫描所有图像文件中的条形码和 QR 码,并读取其文本。 IronOCR 的其他重要功能如下。
System.Drawing
对象、流和PDF文档(优化目标DPI)Iris OCR SDK 是一个模块化的软件工具包,能够让您的应用程序将图像文本转换为可编辑文件,并提供其他文本识别服务。 它是速度最快的专业 OCR,具有高性能和高准确性。 通过虹膜识别技术,您可以获得最先进的光学字符识别技术,包括最先进的扫描、基于人工智能的文档分类、数据完整性和数据提取。
Iris OCR 是一款功能丰富的 SDK,还提供强大的图像清理工具来增强图像效果。 它可以很容易地与 C++、C#、J# 和 VB.NET 软件应用程序集成。 IrisOCR 提供长期支持,可跨平台使用。 它还支持 OEM 和 SaaS 应用程序。 Iris OCR 为企业提供价格灵活的全球解决方案。
在本教程中,我们将使用 Visual Studio 2022 的最新版本。 因此,我假定您已经下载并安装了 C#. 如果没有,您可以从Visual Studio 网站下载。
现在,我们需要创建一个控制台项目,以便开始使用这两个库。 请按照以下步骤创建项目:
单击创建新项目。
从给定选项中选择 C# 控制台应用程序,然后单击下一步
配置新项目的名称和位置。 例如:"OCRProject"。
Iris与IronOCR的OCR软件对比:图3
如需了解更多信息,请选择 .NET 6.0 Framework,因为它是最稳定的版本。
安装 IronOCR 库有多种方法。
NuGet 是在项目中下载和安装依赖项的软件包管理器。 其包中包含已编译的代码(DLL)和清单文件。请使用以下方法访问:
单击管理解决方案的 NuGet 软件包
点击管理 NuGet 包
现在,NuGet 包管理器窗口将打开。 浏览 IronOCR 并点击安装。
由Iris和IronOCR提供的OCR软件比较:图7
可直接从 NuGet 官方网站下载。
点击链接:"".
单击页面右侧的下载软件包选项。
打开下载的软件包,即可开始安装。
只需访问 Iron Software 网站并导航至 IronOCR for .NET 网页即可。 滚动到底部并单击下载 DLL 或下载 Windows 安装程序。
可下载压缩文件。 提取您的项目文件或运行 Windows 安装程序。 请按照以下步骤将其添加到您的项目中。
在 Visual Studio 的解决方案资源管理器中右键单击项目的依赖项。
然后,选择 "添加项目参考 "选项。
浏览下载的 DLL 文件位置。
导航至 Visual Studio 中的 "工具 "选项卡。
扩展 NuGet 包管理器选项。
Install-Package IronOcr
这将自动下载 IronOCR 并安装到项目中。
只需要一个命名空间,并且需要添加到我们需要访问其功能的源代码文件的顶部。
using IronOcr;
using IronOcr;
Imports IronOcr
现在,我们可以在项目中使用 IronOCR 了。
使用 Iris OCR 的方法有很多。 如果您正在寻找小型企业或办公室解决方案,可以使用OCR应用程序。该软件可以从这个链接下载。
如果您正在寻找中型企业解决方案,那么您需要联系 Iris 团队,根据您的需求获得报价。 SDK 和其他文档仅提供给注册客户。 要在开发环境中使用该SDK,您需要使用此表单请求访问权限。
在此,我们将使用 Iris 17 OCR 软件进行比较。 它提供了基础层面的所有功能,可与 IronOCR 进行对比使用。 以下步骤将有助于下载和安装 Iris OCR 软件:
下载软件后,双击打开安装向导。
单击下一步并选择安装模式。
接下来,选择要阅读文本的语言
单击下一步并安装 Iris OCR
现在软件将开始安装。 安装完成后点击完成并打开 Iris OCR 软件。
一切完成! 现在让我们来看看对比本身。
从图像中读取数据是一项相当繁琐的工作。 在提取内容时,图片的分辨率和质量起着重要作用。 这两个库都提供光学字符识别功能,可从图像中提取文本。
IronOCR 的强大 IronTessaract
类使开发人员能够非常轻松地读取图像文件的内容。 这里我们将使用一张PNG图像来从图像文件中读取文本,代码如下:
var OCR = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddImage("test-files/employmentapp.png");
var Result = OCR.Read(Input);
Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddImage("test-files/employmentapp.png");
var Result = OCR.Read(Input);
Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
Using Input = New OcrInput()
Input.AddImage("test-files/employmentapp.png")
Dim Result = OCR.Read(Input)
Console.WriteLine(Result.Text)
End Using
IronOCR 的输出结果与给定的原始图像相匹配。 代码简洁易懂,不含任何技术性内容。
Iris OCR 软件可扫描所有纸质文件并用于文本识别。 使用 Iris OCR 技术,文本提取非常简单。 从 "主页 "菜单选项卡的 "从文件 "中选择图像文件。 同一图像用于测试和比较两个软件的输出结果。
您可以对上传的图片进行图像校正。 在输出文件选项卡中,您可以选择任何格式作为输出。 它提供多种输出格式,如 Word、Excel、PDF、文本文件等。只需将文件保存为任何格式,然后打开即可查看提取的文本。
可以看出,两款软件的输出结果存在明显差异。 IronOCR 从图片中提取了准确的文本以及格式。 而 Iris OCR 保留了格式,但全名和电话号码却被弄乱了。
IronOCR 在读取图像时提供了一个独特而实用的功能,即它可以读取条形码和 QR 码。 它可以检测 BarCode 并轻松显示其价值。
为此,请将读取条形码配置设为 true,然后遍历 OCR 结果中的每个条形码。 读取 BarCode 的代码如下:
var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
using (var input = new OcrInput()){
input.AddImage("test-files/Barcode.png");
var Result = OCR.Read(input);
foreach (var Barcode in Result.Barcodes){
Console.WriteLine(Barcode.Value);
}
}
var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
using (var input = new OcrInput()){
input.AddImage("test-files/Barcode.png");
var Result = OCR.Read(input);
foreach (var Barcode in Result.Barcodes){
Console.WriteLine(Barcode.Value);
}
}
Dim OCR = New IronTesseract()
OCR.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("test-files/Barcode.png")
Dim Result = OCR.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
Next Barcode
End Using
输入图片中的三个 BarCode 都已成功读取,并显示了隐藏的文本。
Iris OCR 还提供从图像或 PDF 文件中提取条形码数据的功能。 但是,对于 BarCode,我们必须手动选择要检测的条形码区域。 移动到区域选项卡,选择要识别的 BarCode。
右键单击所选区域并将其复制为数据,然后保存到文字处理文件中以查看数据。
在这种情况下,Iris OCR 软件无法检测到图片中给出的条形码背后隐藏的文本。
在 IronOCR 中阅读 PDF 文件就像阅读图像文件一样简单。 您只需在图像读取代码中将AddImage
方法更改为AddPDF
。 代码如下
var OCR = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddPdf("test-files/example.pdf");
var Result = OCR.Read(Input);
Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddPdf("test-files/example.pdf");
var Result = OCR.Read(Input);
Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
Using Input = New OcrInput()
Input.AddPdf("test-files/example.pdf")
Dim Result = OCR.Read(Input)
Console.WriteLine(Result.Text)
End Using
提取的文本格式与 PDF 文件相同。
使用 Iris 软件阅读 PDF 文件也非常简单。 它支持所有数字格式,PDF 是其中之一。 您还可以使用 Iris OCR 软件制作可搜索格式。 PDF 是纸质文档,每一页都被视为单独的图像文件。使用 "从文件 "选项打开纸质文档。 选择要提取文本的页面范围,并从给定选项中选择任何可编辑的格式保存。
IronOCR 用于开发目的是免费的,但用于商业用途需要获得许可。 它还提供免费试用,以测试其满足您需求的所有潜力。 轻量版套餐起价为$749,并提供30天退款保证。 IronOCR 免费提供 1 年的产品支持和更新,之后每年 399 美元。 所有许可证都是永久性的,即只有一次性购买,没有隐藏费用。 您还可以为 SaaS 和 OEM 产品选择免版税的再分发服务,单次购买价格仅为 1999 美元。 有关许可证包和定价计划的更多信息,请访问此处。
Iris 是一款 OCR 解决方案,提供 10 天免费试用版。 它的专业版起价为 $99,合作版本起价为 $199。要在生产模式中使用其SDK,我们需要向他们的销售代表获取报价。如果您想为C#或任何其他语言开发获得许可,请从这里获取报价。 有关专业版和合作版的更多信息和比较可以在此处查看。
IronOCR 为 C# 开发人员提供了我们所知的任何平台上最先进的 Tesseract API。 IronOCR 可部署在 Windows、Linux、Mac、Azure、AWS 和 Lambda 上,支持 .NET Framework 项目以及 .NET Standard 和 .NET Core。 我们还可以在OCR扫描中读取条形码,并且还可以将我们的OCR导出为HTML和可搜索的PDF。
Iris OCR 软件具有人工智能功能,与 Windows 和 Mac 兼容。 其 SDK 可用于多种编程语言。 Iris Pro 作为图形用户界面应用程序,具有 Windows 和 Mac 版 Iris OCR SDK 的功能。 您可以从图像和 PDF 中读取文本,并以其他格式输出。 您还可以使用 Iris 软件定制所有纸质文档,只需点击几下即可完成。
IronOCR 许可证是基于开发人员的,这意味着您应始终根据将使用该产品的开发人员数量来购买许可证。 Iris OCR 开发许可证不在 Iris 网站上公布。您必须申请报价以获取许可信息。 此外,IronOCR 许可证为一次性购买,可终身使用。
总的来说,这两款软件几乎都提供了人工智能技术的所有 OCR 功能,但 IronOCR 比 Iris OCR 略胜一筹。 就速度、准确性和整体性能而言,IronOCR 在生产环境中的表现更胜一筹。 它只需使用几行代码即可制作一个高级文本识别应用程序。 API 文档也是全天候可用的,这使得开发人员对该库爱不释手,并将其作为 OCR 解决方案的首选。 您可以通过免费试用测试其全部功能。
现在,您可以以2件的价格购买5件Iron产品。欲了解更多信息,请访问此链接。
从这里下载IronOCR并试用一下。