跳至页脚内容
与其他组件比较

Iris & IronOCR 之间的 OCR 软件比较

OCR(光学字符识别)技术可以检测数字文件中的文本。 计算机总是将扫描的纸质文件保存为图像文件。 这些图像文件中的数据无法使用普通文本编辑器或甚至使用文字处理应用程序进行搜索、编辑或以文本格式保存。 OCR 处理有助于将这些图像转换为机器可读文本,以便用户进行进一步的处理。

在当今时代,通过互联网共享的文件都是数字格式,而且大多是 PDF 或图像格式。 有许多可用的在线资源可以将图像转换为文本。 然而,大多数企业需要在其软件应用程序中具备此功能。 考虑到这一点,有很多库提供可嵌入软件应用程序的 OCR 解决方案。

本文将比较两种最流行的 C# OCR 技术:

  • IronOCR
  • Iris OCR 软件

IronOCR

IronOCR for .NET 是一个 C# 库,用于扫描、搜索和读取图像及 PDF 文件。 它以图像或 PDF 文件作为输入,使用最新的 Tesseract 5 自定义构建 .NET OCR 引擎输出文本、结构化数据或可搜索 PDF 文档。 其 Tesseract 提供 125 多种语言版本,并支持 .NET Core、Standard 2.0 到 7 的跨平台版本。

IronOCR 是一个用户友好的 API,允许 C# 开发人员通过简单地使用IronTesseract类自动将图像转换为文本。 它优先考虑速度、准确性和易用性。 它还可以帮助计算机视觉 API 使用一组训练好的模型来查找文本。

IronOCR 的另一个强大功能是,它可以从所有图像文件中扫描条形码和二维码并读取其文本。 IronOCR的其他重要功能如下所示。

功能

  • 支持 125 种以上国际语言和自定义语言,性能高、速度快、质量好。 *文本和条形码读取:*一次读取多种语言的文本和数字。 专业文件:专门读取收据、支票、发票中的文本。 可读取多种格式:图像(PNG、JPG、GIF、TIFF、BMP)、 System.Drawing对象、流和 PDF 文档(优化目标 DPI)。 滤镜:**滤镜向导、图像校正、修复图像方向、修复图像颜色。 *简单数据输出: .NET 文本字符串、条形码和二维码数据、图像。

虹膜OCR软件

Iris OCR SDK是一个模块化软件工具包,可使您的应用程序将图像文本转换为可编辑文件,并提供其他文本识别服务。 它是速度最快、性能最高、准确率最高的专业OCR软件。 虹膜识别技术结合了最先进的光学字符识别技术,包括最先进的扫描、基于人工智能的文档分类、数据完整性和数据提取。

Iris OCR 是一款功能丰富的 SDK,还提供强大的图像清理工具,用于图像增强。 它可以轻松与 C++、C#、J# 和 VB.NET 软件应用程序集成。 IrisOCR 提供长期支持,并设计为跨平台使用。 它还支持 OEM 和 SaaS 应用。 Iris OCR 为企业提供价格灵活的全球化解决方案。

功能

*输入格式:*图像(JPG、PNG、BMP、TIFF)、PDF(图像、文本)。 预处理:图像增强、形状清理、透视校正、质量评估。 文本识别:识别 137 种以上不同语言的文本(欧洲、亚洲、中东、特定形式)。 条形码识别:**一维和二维条形码识别(PDF417、QR码、Code 39、UPC等)。 *输出格式: Office(DOCX、XLSX、PPT、RTF)、PDF(图像或可搜索的 PDF)、图像格式(JPG、PNG、BMP、TIFF)、HTML、XML、TXT。

安装

创建 Visual Studio 项目

在本教程中,我们将使用 Visual Studio 2022 最新版本。 所以,我假设您已经下载并为 C# 安装了它。 如果没有,您可以从 Visual Studio 网站下载。

现在,我们需要创建一个控制台项目以开始使用两个库。 按照以下步骤创建一个项目:

安装IronOCR

有多种方法可以安装 IronOCR 库。

1. 使用 Visual Studio NuGet 包管理器

NuGet 是一个用于在您的项目中下载和安装依赖项的包管理器。 它的软件包包含已编译的代码(DLL)和清单文件。可以使用以下方法访问它:

点击"工具"选项卡。

或者,右键单击"解决方案资源管理器"。

现在,NuGet 包管理器窗口将打开。 浏览 IronOCR 并点击安装。

Iris 和 IronOCR OCR 软件对比:图 7

2. 从 NuGet 网站下载

可以直接从 NuGet 官方网站下载。

  1. 访问NuGet 网站
  2. 点击页面右侧的下载包选项。
  3. 打开下载的软件包,它将开始安装。
  4. 最后,重新加载解决方案,就完成了。

3. 使用 IronOCR 网页下载

只需访问 Iron Software 网站,然后导航至 IronOCR for the .NET 网页即可。 向下滚动并点击下载 DLL 或下载 Windows 安装程序。

Iris 和 IronOCR OCR 软件对比:图 8

已下载一个压缩文件。 提取项目文件或运行 Windows 安装程序。 按照以下步骤将其添加到您的项目中。

  1. 在 Visual Studio 信息资源管理器中右键单击项目的依赖项。
  2. 然后,选择添加项目引用选项。
  3. 浏览已下载的 DLL 文件所在位置。
  4. 最后,单击"确定"添加项目参考。

4. 在 Visual Studio 中使用命令提示符

  1. 在 Visual Studio 中导航到工具选项卡。
  2. 扩展 NuGet 包管理器选项。
  3. 选择包管理器控制台并输入以下命令:

    Install-Package IronOcr

这将自动下载并安装 IronOCR 到您的项目中。

5. 添加必要的 IronOCR 命名空间

只需要一个命名空间,需要将其添加到我们需要访问其函数的源代码文件的顶部。

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

现在,我们已经准备好在我们的项目中使用 IronOCR。

安装 Iris OCR

虹膜OCR有很多用途。 如果您正在寻找适用于小型企业或办公室的解决方案,可以使用OCR应用程序。该软件可从此链接下载。

如果您正在寻找中大型企业解决方案,那么您需要联系 Iris 团队,根据您的需求获取报价。 SDK 和其他文档仅供注册客户使用。 要在开发环境中使用 SDK,您需要使用此表单申请访问权限。

这里我们将使用 Iris 17 OCR 软件进行比较。 它提供了所有基本功能,可以与 IronOCR 进行比较。 以下步骤将帮助您下载并安装 Iris OCR 软件:

  1. 软件下载完成后,双击打开安装向导。

    Iris 和 IronOCR OCR 软件对比:图 9

  2. 点击下一步,选择安装模式。
  3. 接下来,选择你想阅读文本的语言。

    Iris 和 IronOCR OCR 软件对比:图 10

  4. 点击下一步并安装 Iris OCR。

    Iris 和 IronOCR OCR 软件对比:图 11

  5. 现在软件将开始安装。 安装完成后,点击完成并打开 Iris OCR 软件。

    Iris 和 IronOCR OCR 软件对比:图 12

全部完成! 现在让我们进入比较环节。

比较

1. 图片转文字

从图像中读取数据是一项相当繁琐的任务。 图像分辨率和质量在提取内容时起着重要作用。 这两个库都提供光学字符识别功能,可以从图像中提取文本。

1.1. 使用 IronOCR

IronOCR 凭借其强大的IronTessaract类,使开发人员能够非常轻松地读取图像文件的内容。 这里我们将使用PNG图像从图像文件中读取文本,代码如下:

var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
' We use a using statement to ensure resources are freed after use
Using Input = New OcrInput()
	' Add the image from which you want to extract text
	Input.AddImage("test-files/employmentapp.png")
	' Perform OCR to read the text
	Dim Result = OCR.Read(Input)
	' Output the extracted text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel
输入图像

Iris 和 IronOCR OCR 软件对比:图 13

输出

Iris 和 IronOCR OCR 软件对比:图 14 - 图像输出

IronOCR 的输出与给定图像的原始图像匹配。 代码简洁易懂,没有任何技术性。

1.2. 使用虹膜OCR

Iris OCR 软件可以扫描所有纸质文档并用于文本识别。 使用Iris OCR技术提取文本非常简单。 从"主页"菜单选项卡中的"从文件"选择图像文件。 使用同一张图片来测试和比较两个软件的输出结果。

Iris 和 IronOCR OCR 软件对比:图 15

您可以对上传的图片进行图像校正。 在输出文件选项卡中,您可以选择任何格式作为输出格式。 它提供多种输出格式,例如 Word、Excel、PDF、文本文件等。只需将文件保存为任意格式,然后打开即可查看提取的文本。

输出

Iris 和 IronOCR OCR 软件对比:图 16

你可以看出这两个软件的输出结果有明显的差异。 IronOCR 从图像中提取出了完整的文本及其格式。 然而,Iris OCR 虽然保留了格式,但姓名和电话号码却全部乱码了。

2. 条形码和二维码转文本

2.1. 使用 IronOCR

IronOCR 在读取图像时提供了一个独特而有用的功能,即它可以读取条形码和二维码。 它可以轻松检测条形码并显示它们的值。

为此,请将读取条形码配置设置为 true,然后遍历 OCR 结果中的每个条形码。 读取条形码的代码如下所示:

var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Dim OCR = New IronTesseract()
OCR.Configuration.ReadBarCodes = True
' Using statement to automatically dispose of resources
Using input = New OcrInput()
	' Add the image to be processed
	input.AddImage("test-files/Barcode.png")
	' Read the OCR result
	Dim Result = OCR.Read(input)
	' Iterate through the barcodes detected and display their values
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
$vbLabelText   $csharpLabel
输入图像

Iris 和 IronOCR 的 OCR 软件对比:图 17

输出

Iris 和 IronOCR OCR 软件对比:图 18

输入图像中的所有三个条形码都已成功读取,并显示其隐藏文本。

2.2. 使用虹膜OCR

Iris OCR 还提供了从图像或 PDF 文件中提取条形码数据的功能。 但是对于条形码,我们必须手动选择要检测的条形码区域。 切换到区域选项卡,然后选择要识别的条形码。

右键单击选定区域并将其复制为数据,然后将其保存到文字处理文件中以查看数据。

Iris 和 IronOCR OCR 软件对比:图 19

在这种情况下,Iris OCR 软件无法检测到图片中条形码后面的隐藏文字。

3. PDF 转文本

3.1. 使用 IronOCR

在 IronOCR 中,阅读 PDF 文件就像阅读图像一样简单。 您只需在图像读取代码中将 AddImage 方法更改为 AddPdf。 代码如下

var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
' Using statement for resource management
Using Input = New OcrInput()
	' Add the PDF file to be processed
	Input.AddPdf("test-files/example.pdf")
	' Get the OCR results
	Dim Result = OCR.Read(Input)
	' Output the extracted text
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel
输出

提取的文本与 PDF 文件的格式相同。

Iris 和 IronOCR OCR 软件对比:图 20

3.2. 使用虹膜OCR

使用 Iris 软件阅读 PDF 文件也非常容易。 它支持所有数字格式,PDF 就是其中之一。 您还可以使用 Iris OCR 软件创建可搜索格式。 PDF 文件本质上是纸质文档,每一页都被视为一个单独的图像文件。使用"从文件打开"选项打开纸质文档。 选择要从中提取文本的页面范围,并从给定的选项中选择任意可编辑格式保存。

Iris 和 IronOCR OCR 软件对比:图 21

输出

Iris 和 IronOCR OCR 软件对比:图 22

许可

IronOCR 可免费用于开发目的,但商业用途需要获得许可。 它还提供免费试用以测试其所有潜力,以满足您的需求。 精简版套餐起价为$799 ,并提供 30 天退款保证。 IronOCR 提供 1 年免费产品支持和更新,之后每年收费 399 美元。 所有许可证均为永久有效,这意味着只需一次性购买,没有任何隐藏费用。 您还可以选择为 SaaS 和 OEM 产品提供免版税再分发保障,只需一次性支付 1999 美元。 有关许可套餐和定价方案的更多信息,请访问此处

Iris 和 IronOCR OCR 软件对比:图 23

Iris 是一款 OCR 解决方案,提供 10 天免费试用版。 其专业版起价 99 美元,企业版起价 199 美元。要在生产环境中使用其 SDK,我们需要联系其销售代表获取报价。如果您想获得 C# 或其他语言开发的许可,请点击此处获取报价。 您可以在这里查看更多信息以及专业版和企业版之间的比较。

Iris 和 IronOCR OCR 软件对比:图 24

结论

Iris 和 IronOCR OCR 软件对比:图 25

IronOCR 为 C# 开发人员提供我们所知的最先进的 Tesseract API,可在任何平台上使用。 IronOCR 可部署在 Windows、Linux、Mac、Azure、AWS 和 Lambda 上,并支持 .NET Framework 项目以及 .NET Standard 和 .NET Core 项目。 我们还可以读取 OCR 扫描中的条形码,甚至可以将 OCR 导出为 HTML 和可搜索的 PDF。

Iris OCR 软件内置人工智能功能,兼容 Windows 和 Mac 系统。 它的SDK支持多种编程语言。 Iris Pro 具备 Iris OCR SDK for Windows 和 Mac 的功能,并以 GUI 应用程序的形式呈现。 您可以读取图像和 PDF 中的文本,并将其输出为其他格式。 您还可以使用 Iris 软件,只需点击几下即可自定义所有纸质文档。

AWS Textract许可证基于文档页数来提取信息和分析数据。 Iris OCR 开发许可协议并未在 Iris 网站上公布。您需要联系 Iris 索取报价以获取许可信息。 此外,IronOCR 许可证是一次性购买,可以终身使用。

总体而言,这两款软件都提供了几乎所有 OCR 功能以及 AI 技术,但 IronOCR 比 Iris OCR 略胜一筹。 就速度、准确性和整体性能而言,IronOCR 在生产环境中表现更佳。 它仅使用几行代码即可创建一个高级文本识别应用程序。 API 文档也全天候可用,这使得开发人员喜欢这个库,并使其成为 OCR 解决方案的首选。 您可以免费试用其全部功能。

现在,您可以以 2 件商品的价格购买 5 件铁制品。欲了解更多信息,请访问此链接

这里下载 IronOCR 并试用一下。

请注意Iris OCR 软件是其各自所有者的注册商标。 本网站与 Iris OCR 软件公司没有任何关联,也未获得其认可或赞助。 所有产品名称、徽标和品牌均为各自所有者的财产。 比较仅供参考,反映的是撰写时的公开信息。

常见问题解答

如何在C#中使用OCR将图像转换为文本?

您可以在图像文件上使用IronOCR的Read方法将其转换为机器可读文本。它支持多种图像格式和超过125种语言。

IronOCR库支持哪些语言?

IronOCR支持超过125种语言,为文本和条码识别提供广泛的国际语言兼容性。

我如何增强图像质量以获得更好的OCR结果?

IronOCR内置了图像增强工具,可以自动调整图像的对比度、亮度和分辨率,以提高OCR的准确性。

IronOCR支持哪些输出格式?

IronOCR可以以多种格式输出文本,包括纯文本、PDF和结构化数据格式如XML和JSON。

我可以在购买之前试用IronOCR吗?

可以,IronOCR提供免费试用版,允许开发人员在购买商业许可证之前评估其功能和性能。

IronOCR的许可如何运作?

IronOCR提供了简单的许可模型,提供基于开发人员的永久许可证,可一次性购买,包括企业使用选项。

IronOCR适合生产环境吗?

IronOCR因其速度、高准确性、易于集成和强大的开发者支持而高度推荐用于生产环境。

IronOCR如何处理条码和二维码扫描?

IronOCR可以使用其内置的ReadBarCodes功能从图像中扫描条码和二维码,该功能可以在配置设置中启用。

IronOCR和Iris OCR软件之间的主要区别是什么?

虽然两者都具有强大的OCR能力,但IronOCR因其易用性、丰富的文档和简单的许可而著称。相比之下,Iris OCR以速度、准确性和模块化设计而闻名,但需要联系销售代表获取许可详情。

IronOCR可以与.NET Core和.NET Standard集成吗?

可以,IronOCR完全兼容.NET Core和.NET Standard,实现了在现代开发环境中的无缝集成。

Kannaopat Udonpant
软件工程师
在成为软件工程师之前,Kannapat 在日本北海道大学完成了环境资源博士学位。在攻读学位期间,Kannapat 还成为了车辆机器人实验室的成员,隶属于生物生产工程系。2022 年,他利用自己的 C# 技能加入 Iron Software 的工程团队,专注于 IronPDF。Kannapat 珍视他的工作,因为他可以直接从编写大多数 IronPDF 代码的开发者那里学习。除了同行学习外,Kannapat 还喜欢在 Iron Software 工作的社交方面。不撰写代码或文档时,Kannapat 通常可以在他的 PS5 上玩游戏或重温《最后生还者》。