与其他组件比较

Iris与IronOCR之间的OCR软件比较

发布 2023年五月16日
分享:

OCR - 光学字符识别可以检测数字文件中的文本。 扫描的纸质文件总是被计算机保存为图像文件。 这些图像文件中的数据无法使用普通文本编辑器或文字处理程序进行搜索、编辑或保存为文本格式。 OCR 处理可帮助将这些图像转换为机器可读文本,供用户进一步处理。

在当今时代,通过互联网共享的文件都是数字格式的,而且大多是 PDF 或图片形式。 有很多在线资源可以将图片转换为文本。 然而,大多数企业的软件应用程序都需要这种功能。 考虑到这一点,有许多库提供了可嵌入软件应用程序的 OCR 解决方案。

在本文中,我们将比较两种最流行的 C# OCR 技术:

  • IronOCR
  • 虹膜 OCR 软件

介绍

IronOCR

IronOCRfor .NET 是一个 C# 库,用于扫描、搜索和阅读图像及 PDF。 它将图像或 PDF 文件作为输入,并使用最新的 Tesseract 5 定制 .NET OCR 引擎输出文本、结构化数据或可搜索的 PDF 文档。 其 Tesseract 支持 125 种以上语言,同时支持从 2.0 到 7 的 .NET Core、Standard 跨平台。

IronOCR 是一个用户友好型 API,C# 开发人员只需使用 "IronTesseract "类,即可将图像自动转换为文本。 翻译必须优先考虑速度、准确性和易用性。 它还能辅助计算机视觉 API 使用一组训练有素的模型查找文本。

IronOCR 的另一个强大功能是可以扫描所有图像文件中的条形码和 QR 码,并读取其文本。 IronOCR 的其他重要功能如下。

特点

  • 国际语言: 支持 125 种以上和自定义语言,质量高、速度快
  • 文本和条形码阅读: 同时阅读多种语言的文本和数字
  • 专业文件: 具体阅读收据、支票、发票中的文本
  • 从多种格式中阅读: 图片(png、jpg、gif、tiff、bmp)系统.绘图 "对象、流和 PDF 文档(优化的目标 DPI)
  • 过滤器: 过滤器向导、图像校正、修复图像方向、修复图像颜色
  • 简单数据输出: .NET 文本字符串、Barcode 和 QR 数据、图像

虹膜 OCR 软件

虹膜 OCR SDK该工具包是一个模块化软件工具包,可使您的应用程序将图像文本转换为可编辑的文件,并提供其他文本识别服务。 它是速度最快的专业 OCR,具有高性能和高准确性。 通过虹膜识别技术,您可以获得最先进的光学字符识别技术,包括最先进的扫描、基于人工智能的文档分类、数据完整性和数据提取。

Iris OCR 是一款功能丰富的 SDK,还提供强大的图像清理工具来增强图像效果。 它可以很容易地与 C++、C#、J# 和 VB.NET 软件应用程序集成。 IrisOCR 提供长期支持,可跨平台使用。 它还支持 OEM 和 SaaS 应用程序。 Iris OCR 为企业提供价格灵活的全球解决方案。

特点

  • 输入格式: 图像(jpg、png、bmp、tiff)PDF(图像、文本)
  • 预处理: 图像增强、表格清理、透视校正、质量评估
  • 文本识别: 识别 137 种以上不同语言的文本(欧洲、亚洲、中东、特定形式)
  • 条形码识别: 1D 和 2D 条形码识别(PDF417、QR 码、Code 39、UPC 等。)
  • 输出格式: Office(DOCX、XLSX、PPT、RTF)PDF(图像或可搜索 PDF)图像格式(jpg、png、bmp、tiff)文本、HTML、XML、TXT

安装

创建 Visual Studio 项目

在本教程中,我们将使用 Visual Studio 2022 的最新版本。 因此,我假定您已经下载并安装了 C#. 如果没有,您可以从Visual Studio 网站.

现在,我们需要创建一个控制台项目,以便开始使用这两个库。 请按照以下步骤创建项目:

  • 打开 Visual Studio 2022。
  • 单击创建新项目。

    Iris 和 IronOCR 的 OCR 软件比较:图 1

  • 从给定选项中选择 C# 控制台应用程序,然后单击下一步

    Iris 和 IronOCR 的 OCR 软件比较:图 2

  • 配置新项目的名称和位置。 例如:"OCRProject"。

    Iris 和 IronOCR 的 OCR 软件比较:图 3

  • 如需了解更多信息,请选择 .NET 6.0 Framework,因为它是最稳定的版本。

    Iris 和 IronOCR 的 OCR 软件比较:图 4

  • 现在,单击 "创建",项目将在您指定的位置创建。

安装 IronOCR

安装 IronOCR 库有多种方法。

1.使用 Visual Studio NuGet 软件包管理器

NuGet 是在项目中下载和安装依赖项的软件包管理器。 其软件包包含编译代码(DLL)和清单文件。使用以下方法访问:

  • 单击工具选项卡
  • 扩展 NuGet 包管理器选项
  • 单击管理解决方案的 NuGet 软件包

    Iris 和 IronOCR 的 OCR 软件比较:图 5

  • 或右键单击解决方案资源管理器
  • 点击管理 NuGet 包

    Iris 和 IronOCR 的 OCR 软件比较:图 6

    现在,NuGet 包管理器窗口将打开。 浏览 IronOCR 并点击安装。

    Iris 和 IronOCR 的 OCR 软件比较:图 7

2.从 NuGet 网站下载

可直接从 NuGet 官方网站下载。

  1. 点击链接:"".

  2. 单击页面右侧的下载软件包选项。

  3. 打开下载的软件包,即可开始安装。

  4. 最后,重新加载解决方案,大功告成。

3.下载使用 IronOCR 网页

只需访问 Iron Software 网站并导航至 IronOCR for .NET 网页即可。 滚动到底部并单击下载 DLL 或下载 Windows 安装程序。

Iris 和 IronOCR 的 OCR 软件比较:图 8

可下载压缩文件。 提取您的项目文件或运行 Windows 安装程序。 请按照以下步骤将其添加到您的项目中。

  1. 在 Visual Studio 的解决方案资源管理器中右键单击项目的依赖项。

  2. 然后,选择 "添加项目参考 "选项。

  3. 浏览下载的 DLL 文件位置。

  4. 最后,单击 "确定 "添加项目参考。

4.在 Visual Studio 中使用命令提示符

  1. 导航至 Visual Studio 中的 "工具 "选项卡。

  2. 扩展 NuGet 包管理器选项。

  3. 选择软件包管理器控制台并键入以下命令:
    Install-Package IronOcr

这将自动下载 IronOCR 并安装到项目中。

5.添加必要的 IronOCR 命名空间

只需要一个命名空间,并且需要添加到我们需要访问其功能的源代码文件的顶部。

using IronOcr;
using IronOcr;
Imports IronOcr
VB   C#

现在,我们可以在项目中使用 IronOCR 了。

安装 Iris OCR

使用 Iris OCR 的方法有很多。 如果您正在寻找小型企业或办公解决方案,可以使用 OCR 应用程序。该软件可从以下网址下载链接.

如果您正在寻找中型企业解决方案,那么您需要联系 Iris 团队,根据您的需求获得报价。 SDK 和其他文档仅提供给注册客户。 要在开发环境中使用 SDK,您需要通过以下方式申请访问权限表格.

在此,我们将使用 Iris 17 OCR 软件进行比较。 它提供了基础层面的所有功能,可与 IronOCR 进行对比使用。 以下步骤将有助于下载和安装 Iris OCR 软件:

  1. 下载软件后,双击打开安装向导。

    Iris 和 IronOCR 的 OCR 软件比较:图 9

  2. 单击下一步并选择安装模式。

  3. 接下来,选择要阅读文本的语言

    Iris 和 IronOCR 的 OCR 软件比较:图 10

  4. 单击下一步并安装 Iris OCR

    Iris 和 IronOCR 的 OCR 软件比较:图 11

  5. 现在软件将开始安装。 安装完成后点击完成并打开 Iris OCR 软件。

    Iris 和 IronOCR 的 OCR 软件比较:图 12

    完成的所有工作! 现在让我们来看看对比本身。

比较

1.图像到文本

从图像中读取数据是一项相当繁琐的工作。 在提取内容时,图片的分辨率和质量起着重要作用。 这两个库都提供光学字符识别功能,可从图像中提取文本。

1.1.使用 IronOCR

IronOCR 凭借其强大的 "IronTessaract "类,让开发人员可以非常轻松地读取图像文件的内容。 在这里,我们将使用 PNG 图像来从图像文件中读取文本代码如下


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddImage("test-files/employmentapp.png");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }

    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddImage("test-files/employmentapp.png");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }
Dim OCR = New IronTesseract()
	Using Input = New OcrInput()
		Input.AddImage("test-files/employmentapp.png")
		Dim Result = OCR.Read(Input)
		Console.WriteLine(Result.Text)
	End Using
VB   C#
输入图像

Iris 和 IronOCR 的 OCR 软件比较:图 13

输出

虹膜 OCR 软件与 IronOCR 软件的比较:图 14 - 图像输出

IronOCR 的输出结果与给定的原始图像相匹配。 代码简洁易懂,不含任何技术性内容。

1.2.使用虹膜 OCR

Iris OCR 软件可扫描所有纸质文件并用于文本识别。 使用 Iris OCR 技术,文本提取非常简单。 从 "主页 "菜单选项卡的 "从文件 "中选择图像文件。 同一图像用于测试和比较两个软件的输出结果。

Iris 和 IronOCR 的 OCR 软件比较:图 15

您可以对上传的图片进行图像校正。 在输出文件选项卡中,您可以选择任何格式作为输出。 它提供多种输出格式,如 Word、Excel、PDF、文本文件等。只需将文件保存为任何格式,然后打开即可查看提取的文本。

输出

Iris 和 IronOCR 的 OCR 软件比较:图 16

可以看出,两款软件的输出结果存在明显差异。 IronOCR 从图片中提取了准确的文本以及格式。 而 Iris OCR 保留了格式,但全名和电话号码却被弄乱了。

2.将条形码和 QR 码转换为文本

2.1.使用 IronOCR

IronOCR 在读取图像时提供了一个独特而实用的功能,即它可以读取条形码和 QR 码。 它可以检测 BarCode 并轻松显示其价值。

为此,请将读取条形码配置设为 true,然后遍历 OCR 结果中的每个条形码。 读取 BarCode 的代码如下:


    var OCR = new IronTesseract();
    OCR.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput()){   
        input.AddImage("test-files/Barcode.png");   
        var Result = OCR.Read(input);   
        foreach (var Barcode in Result.Barcodes){
                Console.WriteLine(Barcode.Value);
        }
    }

    var OCR = new IronTesseract();
    OCR.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput()){   
        input.AddImage("test-files/Barcode.png");   
        var Result = OCR.Read(input);   
        foreach (var Barcode in Result.Barcodes){
                Console.WriteLine(Barcode.Value);
        }
    }
Dim OCR = New IronTesseract()
	OCR.Configuration.ReadBarCodes = True
	Using input = New OcrInput()
		input.AddImage("test-files/Barcode.png")
		Dim Result = OCR.Read(input)
		For Each Barcode In Result.Barcodes
				Console.WriteLine(Barcode.Value)
		Next Barcode
	End Using
VB   C#
输入图像

Iris 和 IronOCR 的 OCR 软件比较:图 17

输出

Iris 和 IronOCR 的 OCR 软件比较:图 18

输入图片中的三个 BarCode 都已成功读取,并显示了隐藏的文本。

2.2.使用 IRIS OCR

Iris OCR 还提供从图像或 PDF 文件中提取条形码数据的功能。 但是,对于 BarCode,我们必须手动选择要检测的条形码区域。 移动到区域选项卡,选择要识别的 BarCode。

右键单击所选区域并将其复制为数据,然后保存到文字处理文件中以查看数据。

Iris 和 IronOCR 的 OCR 软件比较:图 19

在这种情况下,Iris OCR 软件无法检测到图片中给出的条形码背后隐藏的文本。

3.将 PDF 转换为文本

3.1.使用 IronOCR

在 IronOCR 中阅读 PDF 文件就像阅读图像文件一样简单。 您只需将图像阅读代码中的 "AddImage "方法更改为 "AddPDF "即可。 代码如下


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddPdf("test-files/example.pdf");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }

    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddPdf("test-files/example.pdf");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }
Dim OCR = New IronTesseract()
	Using Input = New OcrInput()
		Input.AddPdf("test-files/example.pdf")
		Dim Result = OCR.Read(Input)
		Console.WriteLine(Result.Text)
	End Using
VB   C#
输出

提取的文本格式与 PDF 文件相同。

Iris 和 IronOCR 的 OCR 软件比较:图 20

3.2.使用 IRIS OCR

使用 Iris 软件阅读 PDF 文件也非常简单。 它支持所有数字格式,PDF 是其中之一。 您还可以使用 Iris OCR 软件制作可搜索格式。 PDF 是纸质文档,每一页都被视为单独的图像文件。使用 "从文件 "选项打开纸质文档。 选择要提取文本的页面范围,并从给定选项中选择任何可编辑的格式保存。

Iris 和 IronOCR 的 OCR 软件比较:图 21

输出

Iris 和 IronOCR 的 OCR 软件比较:图 22

许可

IronOCR 用于开发目的是免费的,但用于商业用途需要获得许可。 它还提供免费试用,以测试其满足您需求的所有潜力。 Lite 软件包起价为 $749,提供 30 天退款保证。 IronOCR 免费提供 1 年的产品支持和更新,之后每年 399 美元。 所有许可证都是永久性的,即只有一次性购买,没有隐藏费用。 您还可以为 SaaS 和 OEM 产品选择免版税的再分发服务,单次购买价格仅为 1999 美元。 有关许可证套餐和定价计划的更多信息,请访问这里.

Iris 和 IronOCR 的 OCR 软件比较:图 23

Iris 是一款 OCR 解决方案,提供 10 天免费试用版。 专业版起价 99 美元,合作版起价 199 美元。要在生产模式下使用其 SDK,我们需要从他们的销售代表处获得报价。如果您想将其授权用于 C# 或任何其他语言的开发,请从以下网站获取报价这里. 有关专业版与合作版的更多信息和比较,请查阅这里.

Iris 和 IronOCR 的 OCR 软件比较:图 24

结论

Iris 和 IronOCR 的 OCR 软件比较:图 25

IronOCR 为 C# 开发人员提供了我们所知的任何平台上最先进的 Tesseract API。 IronOCR 可部署在 Windows、Linux、Mac、Azure、AWS 和 Lambda 上,支持 .NET Framework 项目以及 .NET Standard.NET Core。 我们还可以在OCR扫描中读取条形码,并且还可以将我们的OCR导出为HTML和可搜索的PDF。

Iris OCR 软件具有人工智能功能,与 Windows 和 Mac 兼容。 其 SDK 可用于多种编程语言。 Iris Pro 作为图形用户界面应用程序,具有 Windows 和 Mac 版 Iris OCR SDK 的功能。 您可以从图像和 PDF 中读取文本,并以其他格式输出。 您还可以使用 Iris 软件定制所有纸质文档,只需点击几下即可完成。

IronOCR 许可证是基于开发人员的,这意味着您应始终根据将使用该产品的开发人员数量来购买许可证。 Iris OCR 开发许可证不在 Iris 网站上公布。您必须申请报价以获取许可信息。 此外,IronOCR 许可证为一次性购买,可终身使用。

总的来说,这两款软件几乎都提供了人工智能技术的所有 OCR 功能,但 IronOCR 比 Iris OCR 略胜一筹。 就速度、准确性和整体性能而言,IronOCR 在生产环境中的表现更胜一筹。 它只需使用几行代码即可制作一个高级文本识别应用程序。 API 文档也是全天候可用的,这使得开发人员对该库爱不释手,并将其作为 OCR 解决方案的首选。 您可以使用免费试用.

现在,您可以用 2 个产品的价格购买 5 个 Iron 产品。欲了解更多信息,请访问此网站链接.

从以下地址下载 IronOCR这里并试一试。

< 前一页
Google OCR 和 IronOCR 比较
下一步 >
IronOCR 和 Nanonets OCR 的比较

准备开始了吗? 版本: 2024.11 刚刚发布

免费NuGet下载 总下载量: 2,698,613 查看许可证 >