跳至页脚内容
与其他组件比较

IronOCR 与 Iris OCR:工程团队应该选择哪种 OCR 解决方案?

IronOCR 提供了一个面向开发者的 C# 库,具有简单易用的 API 集成和高精度的文本提取功能。 相比之下,Iris OCR 提供的是企业文档管理软件,需要手动访问 SDK。 对于寻求具有清晰定价和即时实施功能的嵌入式 OCR 功能的工程团队而言,IronOCR 更具成本效益。

OCR(光学字符识别)技术能够检测数字文件中的文本。 计算机将扫描的纸质文档保存为图像文件,而这些图像文件中的数据无法使用标准文本编辑器或文字处理应用程序进行搜索、编辑或以文本格式保存。 OCR处理将这些图像转换为机器可读文本,以便进行进一步处理。

如今在线共享的文档主要以PDF或图像形式存在。 虽然很多在线资源可以将图像转换为文本,但大多数企业需要将此功能嵌入到他们的软件应用程序中。 各种库提供用于软件集成的OCR解决方案。 对于正在评估 OCR 技术的企业而言,了解部署模型和集成复杂性对于制作可搜索的 PDF和实施文档自动化工作流程至关重要。

本文比较了两种主流的 C# OCR 技术:

  • IronOCR
  • Iris OCR 软件

什么是 IronOCR?它的主要特点是什么?

IronOCR for .NET 是一个 C# 库,可以扫描、搜索和读取图像和 PDF 文件。 它接受图像或 PDF 文件作为输入,并使用最新的Tesseract 5 自定义.NET OCR 引擎输出文本、结构化数据或可搜索的 PDF 文档。 Tesseract 支持125 多种语言,并具有 .NET Core、Standard 2.0 至 7 的跨平台兼容性。

IronOCR 提供了一个对开发者友好的 API,使 C# 开发者能够使用IronTesseract类自动将图像转换为文本。 它优先考虑速度、准确性和易用性。 它支持计算机视觉API ,可以使用训练好的模型来定位文本。 该库包含用于企业级处理的多线程和异步操作,对于管理大量文档的团队来说至关重要。

IronOCR 可以扫描所有图像文件中的条形码和二维码,并提取其中的文本。 其他功能包括:

为什么开发团队应该选择 IronOCR?

*国际语言:*支持 125 多种语言,运行速度快。 在单个文档中处理多种语言文本和条形码读取:从多种语言中提取文本和数字。 支持20 多种条形码格式专业文档:使用专门算法读取收据、支票、发票。 读取多种格式:图像(PNG、JPG、GIF、TIFF、BMP)、 System.Drawing对象、PDF 文档滤镜:滤镜向导图像校正修复方向修复颜色简单数据输出:** .NET 文本字符串、条形码/二维码数据、图像。 导出为可搜索的 PDFhOCR HTML

什么是 Iris OCR 软件及其企业级应用?

Iris OCR SDK是一个模块化软件工具包,使应用程序能够将图像文本转换为可编辑文件并提供文本识别服务。 它提供高性能、高精度的专业OCR功能。 虹膜识别技术融合了先进的光学字符识别技术,包括扫描、基于人工智能的文档分类、数据完整性和数据提取。 企业平台方法与 IronOCR 的嵌入式库模型不同,它需要专门的基础设施和工作流程集成。

Iris OCR 提供图像清理工具以增强图像质量。 它可与 C++、C#、J# 和 VB.NET 应用程序集成。 Iris OCR 提供长期支持和跨平台设计。 它支持OEM和SaaS应用。 Iris OCR 提供全球解决方案,定价灵活。 对于正在评估AWS 部署Azure 集成的团队来说,了解平台要求至关重要。

是什么让 Iris OCR 具备企业级应用能力?

*输入格式:*图像(JPG、PNG、BMP、TIFF)、PDF(图像、文本)。 支持多帧TIFF文件预处理:图像增强、形状清理、透视校正、质量评估。 与 IronOCR 的预处理过滤器类似。 文本识别:可识别 137 种以上语言(欧洲、亚洲、中东、特定形式)。 包括语言培训条形码识别:**一维和二维条形码(PDF417、QR码、Code 39、UPC等)。 *输出格式: Office(DOCX、XLSX、PPT、RTF)、PDF、图像、HTML、XML、TXT。

如何安装和部署这两种 OCR 解决方案?

如何设置 Visual Studio 项目?

本教程使用 Visual Studio 2022。如有需要,请从Visual Studio 网站下载。 对于企业部署,请查阅Docker 容器化环境的设置指南

按照以下步骤创建控制台项目:

如何安装用于开发的 IronOCR?

安装方法多种多样,包括适用于企业环境的高级 NuGet 选项

使用 NuGet 包管理器的最快方法是什么?

NuGet 用于管理项目中的依赖项。 可通过以下方式访问:

点击"工具"选项卡。

或者,右键单击"解决方案资源管理器"。

浏览 IronOCR 并点击安装。 企业团队应在生产部署前审查许可实施情况

NuGet 包管理器界面显示 IronOCR 及其语言包,版本号为 2023.4.13,并显示每个包的下载统计信息

如何使用其他方法安装?

直接从 NuGet 网站下载:

  1. 访问NuGet 网站
  2. 点击右侧的下载包。
  3. 打开下载的软件包进行安装。
  4. 重新加载解决方案。

我可以直接从IronOCR的网站下载吗?

访问 Iron Software 网站,然后转到 IronOCR for .NET。 向下滚动并单击"下载 DLL"或"下载Windows 安装程序" 。 对于企业部署,请查看部署文档

IronOCR 网站页脚显示文档链接、许可选项、下载方式以及完整的 Iron Software .NET 产品套件。

解压下载的zip文件或运行Windows安装程序。 添加到您的项目中:

  1. 在解决方案资源管理器中右键单击项目依赖项。
  2. 选择"添加项目参考"。
  3. 浏览到下载的 DLL 文件所在位置。
  4. 单击"确定"添加参考文献。

如何使用命令行安装?

  1. 转到"工具"选项卡。
  2. 展开 NuGet 包管理器。
  3. 选择"软件包管理器控制台"并输入:

    Install-Package IronOcr

它会自动下载并安装 IronOCR。

需要哪些命名空间?

添加此命名空间即可访问 IronOCR 函数。 对于高级实现,可能需要额外的命名空间。

using IronOcr;
using IronOcr;
$vbLabelText   $csharpLabel

如何访问和安装 Iris OCR?

Iris OCR 提供多种使用方式。 对于小型企业解决方案,请点击此链接下载 OCR 应用。 与 IronOCR 的透明许可模式不同,Iris 需要通过销售联系才能获得 SDK 访问权限。

中大型企业请联系 Iris 获取定制报价。 SDK和文档仍然仅限注册用户访问。 请使用此表单申请 SDK 访问权限。 这与 IronOCR 立即提供试用许可证形成鲜明对比。

此对比使用了 Iris 17 OCR 软件。 它提供与 IronOCR 相当的基本功能。 安装步骤:

  1. 双击下载的安装向导。

    Readiris 17 InstallShield 向导欢迎屏幕显示修改、修复或删除 OCR 软件的选项

  2. 点击下一步,选择安装模式。
  3. 选择用于文本识别的语言。 IronOCR 通过 NuGet 包支持125 多种语言

    Readiris 17 安装向导显示语言选择屏幕,其中包含多种 OCR 语言选项,包括英语、南非荷兰语、阿尔巴尼亚语、阿拉伯语等。

  4. 点击下一步并安装。

    Iris 和 IronOCR OCR 软件对比:图 11

  5. 安装完成后点击完成,打开 Iris OCR 软件。

    Readiris 企业版 OCR 软件界面显示主工作区,其中包含扫描选项、文档语言设置和输出文件格式控件。

IronOCR 和 Iris OCR 在实际使用中的表现有何不同?

他们如何处理图像转文本?

从图像中提取数据可能具有挑战性。 图像分辨率和质量对内容提取的准确性有显著影响。 这两个库都提供光学字符识别功能,用于文本提取。 IronOCR 提供DPI 设置以提高准确度。

IronOCR的图像处理方法是什么?

IronOCR 通过其IronTesseract类简化了图像内容的读取。 本示例使用PNG图像从图像文件中读取文本

var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

IronOCR 提供专门用于护照读取车牌识别手写文本识别的方法。 OcrInput 类支持多种输入格式,包括屏幕截图照片扫描文档。 为了提高精度,您可以使用滤镜向导自动调整图像预处理设置。

输入图像

求职申请表显示申请人简·多伊自2009年至今的烘焙师工作经历。

输出

Microsoft Visual Studio 调试控制台以纯文本格式显示提取的个人信息,包括姓名、电话号码、地址和工作经历。

IronOCR 的输出结果与原始图像完全一致。 代码依然简洁明了。 对于企业团队而言,进度跟踪能够监控大规模批量操作。 OcrResult 类提供有关提取文本的详细信息,包括置信度分数和位置数据。 对于低质量扫描,IronOCR 提供高级过滤器来提高识别准确率。

虹膜OCR如何处理图像?

Iris OCR软件能够扫描纸质文档并识别文本。 从主菜单的"从文件"中选择图像文件。 与 IronOCR 的程序化OCR 输入处理不同,Iris 需要手动选择文件。

Readiris Corporate 通过从扫描表单(包括复杂的表格结构)中准确提取申请人信息和工作经历,展示了其 OCR 功能

根据需要进行图像校正。 在输出文件选项卡中选择输出格式。 提供多种格式,包括 Word、Excel、PDF 和文本文件。 保存文件并查看提取的文本。

输出

记事本窗口显示了从求职申请表中提取文本的 OCR 结果,结果显示部分准确,但存在一些字符识别错误。

输出结果对比显示出明显的差异。 IronOCR提取的文本格式完整保留。 Iris OCR 保留了格式,但错误地读取了完整的姓名和电话号码。 对于高精度要求,IronOCR 的结果置信度评分提供了质量指标。 详细的配置选项允许针对特定文档类型进行微调。

它们对条形码和二维码的识别效果如何?

IronOCR的条形码读取功能有何独特之处?

IronOCR 能够独特地读取图像中的条形码和二维码。 它能轻松检测条形码并显示数值,支持20 多种条形码格式。 对于特殊应用,IronOCR 可与IronBarcode无缝集成,实现高级条形码生成和读取功能。

启用条形码读取功能并遍历检测到的条形码:

var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
$vbLabelText   $csharpLabel

对于需要 多线程的复杂场景,IronOCR 会自动提高多个 CPU 核心的性能。 该库支持中止令牌,用于取消长时间运行的操作,这对于响应式应用程序至关重要。

输入图像

三张不同的收银机小票样本,展示了各种格式,包括商品明细、总计和条形码,背景为透明方格纹

输出

Microsoft Visual Studio 调试控制台显示 OCR 项目执行的数值输出值 (640509040147, 11178897, 01072877)

三个条形码均读取成功,隐藏文本显示正常。 对于库存系统而言,这种OCR 和条形码相结合的功能简化了文档处理。 数据输出选项包括用于数据库集成的结构化格式。

虹膜OCR如何处理条形码检测?

Iris OCR 可从图像或 PDF 中提取条形码数据。 条形码检测需要手动选择区域。 转到"区域"选项卡,然后选择条形码区域。

右键单击选定区域并选择"复制为数据"。 保存为文字处理文件以查看数据。

Readiris 企业版界面展示了其同时处理多张收据的能力,并突出显示了条形码检测区域和 OCR 文本提取功能

Iris OCR软件未能检测到所提供条形码后面的隐藏文本。 这种人工方法与 IronOCR 的自动检测形成对比,影响了大规模文档处理的效率。

PDF文本提取的效率如何?

IronOCR的PDF处理为何如此简单?

在 IronOCR 中读取 PDF 文件只需将AddImage改为AddPdf即可:

var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

IronOCR 支持PDF 流可搜索 PDF 创建,适用于企业文档管理。 PDF OCR 提取功能可以高效处理扫描版和数字版 PDF 文件。 对于特殊需求,您可以从纯图像文档创建可搜索的 PDF ,从而提高文档的可访问性和 SEO 效果。

输出

提取的文本保持PDF格式。 您的团队可以提取具有结构化数据保留功能的表格

IronOCR 成功提取并保留了考勤记录表的表格格式,保持了原始结构,包括序列号、日期和到岗/离岗签名列标题。

对于高级处理,IronOCR 提供TIFF 到可搜索 PDF 的转换,并能流畅地处理多页 TIFF 文件图像DPI设置可确保各种文档类型获得最佳质量。

Iris OCR 如何处理 PDF 文档?

Iris软件可以轻松处理PDF阅读。 它支持所有数字格式,包括PDF。 使用 Iris OCR 创建可搜索格式。 PDF 文件会作为单独的页面图像进行处理。 使用"从文件"选项打开文档。 选择页面范围并以可编辑格式保存。

Readiris Corporate 通过处理学校考勤表来展示其 OCR 功能,并提供多种输出格式和文档管理功能。

对于评估多页 TIFF 处理或批量操作的企业团队来说,了解平台功能至关重要。

输出

记事本中显示的是教学实习的考勤记录表,表格包含序号、日期、到达、签名和离开等列。

有哪些许可选项和总拥有成本?

IronOCR 仍可免费用于开发,但商业用途需要获得许可。 它提供免费试用版,供用户评估各项功能。 精简版套餐起价为$799 ,并提供 30 天退款保证。 IronOCR包含1年的产品支持和更新,之后每年收费399美元。 所有许可证均为永久有效——一次性购买,无任何隐藏费用。 SaaS 和 OEM 产品的免版税再分发许可费用为 1999 美元,一次性支付。详情请访问许可页面。 企业团队可以考虑申请许可证延期,以获得更多席位。

IronOCR定价对比表,显示三个级别:Lite版(749美元)、Professional版(1499美元)和Unlimited版(2999美元),每个级别均有开发者数量、地点和项目数量的限制。

Iris提供10天免费试用。 专业版起价 99 美元,企业版起价 199 美元。SDK 生产环境使用需咨询销售人员。 如需 C# 开发许可,请在此处申请报价。 在此比较专业版和企业版。 缺乏透明的SDK定价给工程团队带来了预算方面的挑战。

! 对比表格展示了 Readiris Pro 17(99 美元)和 Readiris Corporate 17(199 美元)之间的功能差异,重点介绍了每个版本的新功能和特性。

工程团队应该选择哪种OCR解决方案?

! 对比表格展示了 IronOCR 和 IrisOCR 的功能,包括文本读取、并发处理、OCR 引擎、文档支持、训练模型和语言能力。

IronOCR 为 C# 开发人员提供跨平台的先进 Tesseract API 功能。 IronOCR 可部署在WindowsLinuxMacAzureAWS和 Lambda 上。 它支持 .NET Framework、.NET Standard 和 .NET Core。 OCR扫描中的条形码读取以及导出为HTML可搜索PDF的功能提高了性能。 完整的API 参考文档提供了所有类和方法的详细文档。

Iris OCR 软件融合了人工智能功能,并兼容 Windows 和 Mac 系统。 它的SDK支持多种编程语言。 Iris Pro 包含适用于 Windows 和 Mac 的 GUI 应用程序功能。 从图像和 PDF 中提取文本,并支持多种输出格式。 通过 Iris 软件界面自定义纸质文档。 然而,企业平台方法需要比 IronOCR 的嵌入式库模型更大的基础设施投资。

授权模式如何影响团队可扩展性?

IronOCR 许可证是基于开发者的——购买价格取决于使用该产品的开发者数量。 Iris OCR 开发许可需要询价。 IronOCR 许可证提供一次性购买即可终身使用。 IronOCR 为升级提供透明的定价方案。 AndroidiOS 部署指南的使用为移动开发团队提供支持。

工程经理的关键决策因素是什么?

两种方案都提供了完整的OCR功能以及人工智能技术。 IronOCR 在速度、精度和生产性能方面都展现出优势。 用最少的代码即可创建高级文本识别应用程序。 完善的 API 文档能够提高开发人员的工作效率。 获取完整的教程代码示例,以便快速实现。 通过免费试用版测试功能。

功能概述详细介绍了所有功能。 对于特殊需求,请探索文档处理功能OCR 结果处理预处理选项专业的数据提取功能可处理复杂的文档类型。完整的演示展示了实际应用案例。

如需进行故障排除,请访问一般故障排除指南或有关Azure Functions 部署libgdiplus 问题Visual C++ Redistributable 要求的特定指南。 工程支持请求指南可确保复杂问题得到快速解决。

购买 5 件 Iron 产品,只需支付 2 件的价格。点击此链接了解详情。 这包括IronPDFIronBarcodeIronXLIronWord ,用于完整的文档处理。

请从这里下载 IronOCR 并评估其功能。

请注意Iris OCR 软件是其各自所有者的注册商标。 本网站与 Iris OCR 软件公司没有任何关联,也未获得其认可或赞助。 所有产品名称、徽标和品牌均为各自所有者的财产。 比较仅供参考,反映的是撰写时的公开信息。

常见问题解答

如何在C#中使用OCR将图像转换为文本?

您可以在图像文件上使用IronOCR的Read方法将其转换为机器可读文本。它支持多种图像格式和超过125种语言。

IronOCR库支持哪些语言?

IronOCR支持超过125种语言,为文本和条码识别提供广泛的国际语言兼容性。

我如何增强图像质量以获得更好的OCR结果?

IronOCR内置了图像增强工具,可以自动调整图像的对比度、亮度和分辨率,以提高OCR的准确性。

IronOCR支持哪些输出格式?

IronOCR可以以多种格式输出文本,包括纯文本、PDF和结构化数据格式如XML和JSON。

我可以在购买之前试用IronOCR吗?

可以,IronOCR提供免费试用版,允许开发人员在购买商业许可证之前评估其功能和性能。

IronOCR的许可如何运作?

IronOCR提供了简单的许可模型,提供基于开发人员的永久许可证,可一次性购买,包括企业使用选项。

IronOCR适合生产环境吗?

IronOCR因其速度、高准确性、易于集成和强大的开发者支持而高度推荐用于生产环境。

IronOCR如何处理条码和二维码扫描?

IronOCR可以使用其内置的ReadBarCodes功能从图像中扫描条码和二维码,该功能可以在配置设置中启用。

IronOCR和Iris OCR软件之间的主要区别是什么?

虽然两者都具有强大的OCR能力,但IronOCR因其易用性、丰富的文档和简单的许可而著称。相比之下,Iris OCR以速度、准确性和模块化设计而闻名,但需要联系销售代表获取许可详情。

IronOCR可以与.NET Core和.NET Standard集成吗?

可以,IronOCR完全兼容.NET Core和.NET Standard,实现了在现代开发环境中的无缝集成。

Kannaopat Udonpant
软件工程师
在成为软件工程师之前,Kannapat 在日本北海道大学完成了环境资源博士学位。在攻读学位期间,Kannapat 还成为了车辆机器人实验室的成员,隶属于生物生产工程系。2022 年,他利用自己的 C# 技能加入 Iron Software 的工程团队,专注于 IronPDF。Kannapat 珍视他的工作,因为他可以直接从编写大多数 IronPDF 代码的开发者那里学习。除了同行学习外,Kannapat 还喜欢在 Iron Software 工作的社交方面。不撰写代码或文档时,Kannapat 通常可以在他的 PS5 上玩游戏或重温《最后生还者》。