与其他组件比较

Iris与IronOCR之间的OCR软件比较

发布 2023年五月16日
分享:

OCR - 光学字符识别可以检测数字文件中的文本。扫描的纸质文件总是被计算机保存为图像文件。这些图像文件中的数据无法使用普通文本编辑器或文字处理程序进行搜索、编辑或以文本格式保存。OCR 处理有助于将这些图像转换为机器可读文本,供用户进一步处理。

在当今时代,通过互联网共享的文件都是数字格式的,而且大多以 PDF 或图像的形式存在。有很多在线资源可以将图像转换为文本。然而,大多数企业的软件应用程序都需要这一功能。考虑到这一点,有许多图书馆提供 OCR 解决方案,可以嵌入到软件应用程序中。

在本文中,我们将比较两种最流行的 C# OCR 技术:

  • IronOCR
  • 虹膜 OCR 软件

介绍

IronOCR

IronOCR for .NET是一个用于扫描、搜索和读取图像与PDF文件的C#库。它将图像或 PDF 文件作为输入,并使用最新的 Tesseract 5 定制 .NET OCR 引擎输出文本、结构化数据或可搜索的 PDF 文档。它的 Tesseract 支持 125 种以上的语言,并支持从 2.0 到 7.0 的 .NET Core、标准和跨平台。

IronOCR 是一个用户友好的 API,C# 开发人员只需使用 "IronTesseract "类,就能将图像自动转换为文本。它将速度、准确性和易用性放在首位。它还辅助计算机视觉 API 使用一组训练有素的模型查找文本。

IronOCR 的另一个强大功能是,它可以扫描所有图像文件中的条形码和 QR 码,并读取其文本。IronOCR 的其他重要功能如下。

功能

  • 国际语言: 支持 125 种以上语言和自定义语言,具有高质量和快速的性能
  • 文本和条形码读取: 一次读取多种语言的文本和数字
  • 专业文档: 专门读取收据、支票和发票中的文本
  • 从多种格式读取: 图像 (png、jpg、gif、tiff、bmp)系统.绘图 "对象、流和 PDF 文档 (优化的目标 DPI)
  • 滤镜: 滤镜向导、图像校正、修正图像方向、修正图像颜色
  • 简单数据输出: .NET 文本字符串、条形码和 QR 数据、图像

虹膜 OCR 软件

虹膜 OCR SDK 是一个模块化软件工具包,可使您的应用程序将图像文本转换为可编辑文件,并提供其他文本识别服务。它是速度最快的专业 OCR,具有高性能和高准确性。通过虹膜识别技术,您可以获得最先进的光学字符识别技术,包括最先进的扫描、基于人工智能的文档分类、数据完整性和数据提取。

虹膜 OCR 是一个功能丰富的 SDK,还提供强大的图像清理工具来增强图像。它可以与 C++、C#、J# 和 VB.NET 软件应用程序轻松集成。IrisOCR 提供长期支持,可跨平台使用。它还支持 OEM 和 SaaS 应用程序。Iris OCR 以灵活的价格为企业提供全球解决方案。

功能

  • 输入格式: 图像 (jpg、png、bmp、tiff)PDF (图像、文本)
  • 预处理: 图像增强、表格清理、透视校正、质量评估
  • 文本识别: 识别 137 种以上不同语言的文本 (欧洲、亚洲、中东、特定形式)
  • 条形码识别: 一维和二维条形码识别 (PDF417、QR 码、Code 39、UPC 等。)

  • 输出格式: Office (DOCX、XLSX、PPT、RTF)PDF (图像或可搜索 PDF)图像格式 (jpg、png、bmp、tiff)文本、HTML、XML、TXT

安装

创建 Visual Studio 项目

在本教程中,我们将使用 Visual Studio 2022 的最新版本。因此,我假设你已经下载并安装了 C# 版本。如果没有,可以从 Visual Studio 网站.

现在,我们需要创建一个控制台项目,以便开始使用这两个库。请按照以下步骤创建项目:

  • 打开 Visual Studio 2022。
  • 点击创建新项目。

    Iris 和 IronOCR 的 OCR 软件比较:图 1

  • 从给定选项中选择 C# 控制台应用程序,然后单击下一步

    Iris 和 IronOCR 的 OCR 软件比较:图 2

  • 配置新项目的名称和位置。例如,"OCRProject"。

    Iris 和 IronOCR 的 OCR 软件比较:图 3

  • 有关其他信息,请选择 .NET 6.0 Framework,因为它是最稳定的版本。

    Iris 和 IronOCR 的 OCR 软件比较:图 4

  • 现在,单击 "创建",项目将在指定位置创建。

安装 IronOCR

安装 IronOCR 库有多种方法。

1.使用 Visual Studio NuGet 包管理器

NuGet 是一个包管理器,用于在项目中下载和安装依赖项。它的软件包包含编译后的代码 (DLL) 和清单文件。使用以下方法访问:

  • 点击工具选项卡
  • 扩展 NuGet 包管理器选项

  • 单击管理解决方案的 NuGet 包

    Iris 和 IronOCR 的 OCR 软件比较:图 5

  • 或右键单击解决方案资源管理器
  • 单击管理 NuGet 包

    Iris 和 IronOCR 的 OCR 软件比较:图 6

现在,NuGet 包管理器窗口将打开。浏览 IronOCR 并点击安装。

Iris 和 IronOCR 的 OCR 软件比较:图 7

2.从 NuGet 网站下载

可直接从 NuGet 官方网站下载。

1.点击链接:"".

2.点击页面右侧的下载软件包选项。

3.打开下载的软件包,即可开始安装。

4.最后,重新加载解决方案,就大功告成了。

3.使用 IronOCR 网页下载

只需访问 Iron Software 网站并导航至 IronOCR for the .NET 网页。滚动到底部,点击下载 DLL 或下载 Windows 安装程序。

Iris 和 IronOCR 的 OCR 软件比较:图 8

下载一个压缩文件。解压项目文件或运行 Windows 安装程序。按照以下步骤将其添加到项目中。

1.在 Visual Studio 的解决方案资源管理器中右键单击项目的依赖项。

2.然后,选择 "添加项目引用 "选项。

3.浏览下载的 DLL 文件位置。

4.最后,单击 "确定 "添加项目引用。

4.在 Visual Studio 中使用命令提示符

1.导航至 Visual Studio 中的 "工具 "选项卡。

2.扩展 NuGet 包管理器选项。

3.选择软件包管理器控制台并键入以下命令:

    Install-Package IronOcr

这将自动下载 IronOCR 并安装到项目中。

5.添加必要的 IronOCR 命名空间

只需要在我们需要访问其功能的源代码文件顶部添加一个命名空间。

using IronOcr;
using IronOcr;
Imports IronOcr
VB   C#

现在,我们可以在项目中使用 IronOCR 了。

安装虹膜 OCR

使用 Iris OCR 的方法有很多。如果您正在寻找小型企业或办公解决方案,可以使用 OCR 应用程序。该软件可从以下网址下载 链接.

如果您正在寻找中型企业解决方案,那么您需要联系 Iris 团队,根据您的需求获得报价。SDK 和其他文档仅提供给注册客户。要在开发环境中使用 SDK,您需要通过以下方式申请访问权限 表格.

在此,我们将使用 Iris 17 OCR 软件进行比较。它提供所有基本功能,可与 IronOCR 进行比较。以下步骤将有助于下载和安装 Iris OCR 软件:

1.软件下载完成后,双击打开安装向导。

![Iris 和 IronOCR 的 OCR 软件比较:图 9](/static-assets/ocr/blog/ocr-software-by-iris-alternatives/ocr-software-by-iris-alternatives-9.webp)

2.单击下一步并选择安装模式。

3.接下来,选择要读取文本的语言

![Iris 和 IronOCR 的 OCR 软件比较:图 10](/static-assets/ocr/blog/ocr-software-by-iris-alternatives/ocr-software-by-iris-alternatives-10.webp)

4.单击下一步并安装 Iris OCR

![Iris 和 IronOCR 的 OCR 软件比较:图 11](/static-assets/ocr/blog/ocr-software-by-iris-alternatives/ocr-software-by-iris-alternatives-11.webp)

5.现在软件将开始安装。安装完成后点击 "完成",然后打开 Iris OCR 软件。

![Iris 和 IronOCR 的 OCR 软件比较:图 12](/static-assets/ocr/blog/ocr-software-by-iris-alternatives/ocr-software-by-iris-alternatives-12.webp)

一切已完成! 现在让我们来看看比较本身。

比较

1.图像到文本

从图像中读取数据是一项相当繁琐的工作。图像的分辨率和质量在提取内容时起着重要作用。这两个库都提供光学字符识别功能,可从图像中提取文本。

1.1.使用 IronOCR

IronOCR 凭借其强大的 "IronTessaract "类,让开发人员可以轻松读取图像文件的内容。在这里,我们将使用 PNG 图像来 从图像文件中读取文本 代码如下


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddImage("test-files/employmentapp.png");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }

    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddImage("test-files/employmentapp.png");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }
Dim OCR = New IronTesseract()
	Using Input = New OcrInput()
		Input.AddImage("test-files/employmentapp.png")
		Dim Result = OCR.Read(Input)
		Console.WriteLine(Result.Text)
	End Using
VB   C#
输入图像

Iris 和 IronOCR 的 OCR 软件比较:图 13

输出端

虹膜 OCR 软件与 IronOCR 软件的比较:图 14 - 图像输出

IronOCR 的输出结果与提供给它的原始图像一致。代码简洁易懂,没有任何技术含量。

1.2.使用虹膜 OCR

虹膜 OCR 软件可扫描所有纸质文档,并用于文本识别。使用 Iris OCR 技术,文本提取非常简单。从主菜单选项卡的 "从文件 "中选择一个图像文件。使用相同的图像来测试和比较两个软件的输出结果。

Iris 和 IronOCR 的 OCR 软件比较:图 15

您可以对上传的图像进行图像校正。在输出文件选项卡中,你可以选择任何格式作为输出。它提供多种输出格式,如 Word、Excel、PDF、文本文件等。只需将文件保存为任何格式,然后打开即可查看提取的文本。

输出端

Iris 和 IronOCR 的 OCR 软件比较:图 16

可以看出,两个软件的输出结果有明显的不同。IronOCR 从图像中提取了准确的文本和格式。而 Iris OCR 则保留了格式,但全名和电话号码却被弄乱了。

2.将条形码和 QR 码转换为文本

2.1.使用 IronOCR

IronOCR 在读取图像时提供了一项独特而实用的功能,即可以读取条形码和 QR 码。它可以轻松检测条形码并显示其值。

为此,请将读取条形码配置设为 true,然后遍历 OCR 结果中的每个条形码。读取条形码的代码如下:


    var OCR = new IronTesseract();
    OCR.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput()){   
        input.AddImage("test-files/Barcode.png");   
        var Result = OCR.Read(input);   
        foreach (var Barcode in Result.Barcodes){
                Console.WriteLine(Barcode.Value);
        }
    }

    var OCR = new IronTesseract();
    OCR.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput()){   
        input.AddImage("test-files/Barcode.png");   
        var Result = OCR.Read(input);   
        foreach (var Barcode in Result.Barcodes){
                Console.WriteLine(Barcode.Value);
        }
    }
Dim OCR = New IronTesseract()
	OCR.Configuration.ReadBarCodes = True
	Using input = New OcrInput()
		input.AddImage("test-files/Barcode.png")
		Dim Result = OCR.Read(input)
		For Each Barcode In Result.Barcodes
				Console.WriteLine(Barcode.Value)
		Next Barcode
	End Using
VB   C#
输入图像

Iris 和 IronOCR 的 OCR 软件比较:图 17

输出端

Iris 和 IronOCR 的 OCR 软件比较:图 18

输入图像中的三个条形码都被成功读取,并显示出隐藏的文本。

2.2.使用 IRIS OCR

Iris OCR 还能从图像或 PDF 文件中提取条形码数据。不过,对于条形码,我们必须手动选择要检测的条形码区域。移动到区域选项卡,选择要识别的条形码。

右键单击所选区域并将其复制为数据,然后保存到文字处理文件中查看数据。

Iris 和 IronOCR 的 OCR 软件比较:图 19

在这种情况下,Iris OCR 软件无法检测到图片中给出的条形码背后隐藏的文本。

3.将 PDF 转换为文本

3.1.使用 IronOCR

在 IronOCR 中,读取 PDF 文件与读取图像文件一样简单。您只需将图像阅读代码中的 AddImage 方法改为 AddPDF。代码如下


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddPdf("test-files/example.pdf");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }

    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddPdf("test-files/example.pdf");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }
Dim OCR = New IronTesseract()
	Using Input = New OcrInput()
		Input.AddPdf("test-files/example.pdf")
		Dim Result = OCR.Read(Input)
		Console.WriteLine(Result.Text)
	End Using
VB   C#
输出端

提取的文本格式与 PDF 文件相同。

Iris 和 IronOCR 的 OCR 软件比较:图 20

3.2.使用 IRIS OCR

使用 Iris 软件阅读 PDF 文件也非常简单。它支持所有数字格式,PDF 就是其中之一。您还可以使用 Iris OCR 软件制作可搜索格式。PDF 是一种纸质文档,每一页都被视为单独的图像文件。使用 "从文件 "选项打开纸质文档。选择要提取文本的页面范围,并从给定选项中选择任何可编辑格式保存。

Iris 和 IronOCR 的 OCR 软件比较:图 21

输出端

Iris 和 IronOCR 的 OCR 软件比较:图 22

Licensing

IronOCR 用于开发目的是免费的,但用于商业用途需要获得许可。它还提供免费试用版,以测试其满足您需求的所有潜力。精简版软件包起价为 $749,并提供 30 天退款保证。IronOCR 提供 1 年免费产品支持和更新,之后每年 399 美元。所有许可证都是永久性的,即只有一次性购买,没有隐藏费用。您还可以为 SaaS 和 OEM 产品选择免版税的再分发服务,单次购买只需 1999 美元。有关许可证套餐和定价计划的更多信息,请访问 这里.

Iris 和 IronOCR 的 OCR 软件比较:图 23

Iris 是一款 OCR 解决方案,提供 10 天免费试用版。专业版起价 99 美元,合作版起价 199 美元。要在生产模式下使用其 SDK,我们需要从他们的销售代表那里获得报价。如果您想将其授权用于 C# 或任何其他语言的开发,请从以下网站获取报价 这里.更多信息以及专业版与合作版的比较,请查阅 这里.

Iris 和 IronOCR 的 OCR 软件比较:图 24

结论

Iris 和 IronOCR 的 OCR 软件比较:图 25

IronOCR 可在任何平台上为 C# 开发人员提供我们所知的最先进的 Tesseract API。IronOCR 可部署在 Windows、Linux、Mac、Azure、AWS 和 Lambda 上,并支持 .NET Framework 项目以及 .NET Standard.NET Core。我们还可以读取 OCR 扫描中的条形码,甚至可以将 OCR 导出为 HTML 和可搜索的 PDF。

Iris OCR 软件具有人工智能功能,与 Windows 和 Mac 兼容。其 SDK 适用于多种编程语言。Iris Pro 具备 Windows 和 Mac 版 Iris OCR SDK 的功能,是一款图形用户界面应用程序。您可以从图像和 PDF 中读取文本,并以其他格式输出。您还可以使用 Iris 软件定制所有纸质文档,只需点击几下即可完成。

IronOCR 许可证是基于开发人员的,这意味着您应始终根据将使用该产品的开发人员数量来购买许可证。Iris OCR 开发许可证不在 Iris 网站上公布。您必须询价才能获得许可证信息。此外,IronOCR 许可证是一次性购买,可终身使用。

总的来说,这两款软件都能利用人工智能技术提供几乎所有的 OCR 功能,但 IronOCR 比 Iris OCR 略胜一筹。就速度、准确性和整体性能而言,IronOCR 在生产环境中更胜一筹。它只需几行代码就能实现高级文本识别应用。此外,IronOCR 还提供全天候的 API 文档,这让开发人员对该库爱不释手,并将其作为 OCR 解决方案的首选。您可以使用 免费试用.

现在,您可以用 2 块钱的价格购买 5 块铁制品。 链接.

从以下地址下载 IronOCR 这里 并试一试。

< 前一页
Google OCR 和 IronOCR 比较
下一步 >
IronOCR 和 Nanonets OCR 的比较

准备开始了吗? 版本: 2024.9 刚刚发布

免费NuGet下载 总下载量: 2,319,721 查看许可证 >