使用 IRONOCR

使用计算机视觉的OCR(示范教程)

更新 2024年一月28日
分享:

光学字符识别(光学字符识别)是一种使机器能够从图像中读取和解释文本的技术,使数据处理和自动化更快、更高效。 本文提供了使用 IronOCR 库的 OCR 计算机视觉的指南,以及如何增强文本识别能力,实现这一过程的自动化。

OCR 为什么重要?

OCR 与计算机视觉是一种先进的光学字符识别技术(光学字符识别)我们的翻译工具是 "图像识别",它利用人工智能和机器学习算法的力量,更准确、更高效地识别图像中的文本字符。

计算机视觉图像处理算法允许 OCR 系统理解图像中文本的上下文和布局,并根据其形状和结构识别字符。 OCR 与计算机视觉相结合,可以从具有多种字体、样式和尺寸的复杂图像中提取文本,是文档数字化、数据提取和自动化的重要工具。

IronOCR: C# OCR 库

IronOCR是一个流行的 OCR 库,使用计算机视觉技术从图像和文档中提取文本。 它易于使用,可与 C# 和 VB.NET 等多种编程语言集成。 IronOCR 有内部部署和云版本,提供一系列从图像中处理和提取文本的功能。

安装 IronOCR

要安装 IronOCR,请在 NuGet 软件包管理器控制台中使用以下命令:

:ProductInstall

IronOCR 的 OCR 系统

下面的图片用于测试计算机视觉 OCR 系统使用 IronOCR。

利用计算机视觉进行 OCR 识别(实例教程),图 1:用于 OCR 检测的图像样本

用于 OCR 检测的图片样本

查找文本区域

"(《世界人权宣言》)查找文本区域在图像中识别单个文本区域的方法。 该方法需要几个可选参数,包括 "Scale"、"DilationAmount"、"Binarize "和 "Invert"。 Scale 可调整图像的大小,DilationAmount 可增加文本的厚度,Binarize 可将图像转换为黑白图像,Invert 可反转图像的颜色。

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using inputOCR = New OcrInput("test.jpg")
	inputOCR.FindTextRegion()
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

运行代码后,您将看到它使用机器学习过程从文本区域提取文本。 输出结果显示在控制台中,文本识别准确率几乎达到 100%。 IronOCR 对于各种形式的文本,无论是印刷体还是手写体,准确率都接近 100%。

利用计算机视觉进行 OCR 识别(示例教程),图 2:文本提取过程中的控制台结果

文本提取过程中的控制台结果

查找多个文本区域方法

"(《世界人权宣言》)查找多个文本区域该方法与 FindTextRegion 方法类似,但它用于图像中有多个文本区域的情况。 它返回一个定义每个文本区域位置的 CropRectangle 对象列表。 当您想从包含多个文本部分的图像中提取文本时,这种方法非常有用。

using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr

Private ocr = New IronTesseract()
Using input = New OcrInput("test.jpg")
	input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

上面提供的代码片段是一个如何使用 IronOCR 库在图像文件上执行 OCR 的示例。它首先导入 IronOCR 库,并创建一个新的钢铁魔方类。 然后,初始化一个OcrInput对象,输入图像文件的路径,并应用一些图像校正的预处理技术使用 FindMultipleTextRegions 方法。

之后,它将调用阅读对象的 "IronTesseract "方法,该方法会对预处理后的图像执行 OCR 并返回一个OcrResult反对 从 OcrResult 对象中提取的文本将存储在字符串变量中并打印到控制台。

IronOCR 的输出结果

IronOCR 的输出非常准确,即使在处理具有多种字体、尺寸和文本样式的复杂图像时也是如此。

从图像中提取数据时,OCR 的准确性至关重要,因为提取的文本通常用于进一步处理,如数据分析、手动数据录入、机器学习或自然语言处理。 如果提取的文本包含错误,就会给下游工作带来麻烦。 此外,IronOCR 允许对结果对象进行调查,以便检查置信度.

OCR 计算机视觉的使用案例

光学字符识别(光学字符识别)技术已经彻底改变了处理印刷和手写文本的方式。 OCR 工具已成为文档处理和数据提取不可或缺的一部分。 以下是一些光学字符识别软件的使用案例:

OCR 车牌识别

车牌识别在交通管理自动化、停车系统和执法活动中发挥着重要作用。 通过在 C# 中实现 OCR 计算机视觉,开发人员可以创建应用程序,从图像或实时视频馈送中快速准确地识别车牌。 该技术可用于

  • 监控交通违规行为,识别涉及犯罪活动的车辆。
  • 实现停车系统自动化,方便出入管理并简化计费流程。
  • 通过跟踪和监控车辆在禁区内的移动情况来加强安全措施。

从发票中提取文本

C# 中的 OCR 计算机视觉可用于开发 OCR 应用程序,自动完成从发票中提取文本以及其他财务文件。 这一过程可以大大减少人工数据录入错误,简化会计任务。 主要优势包括

  • 通过自动化数据录入流程提高工作效率。
  • 提高准确性,因为 OCR 降低了人为错误的可能性。
  • 与会计软件和系统无缝集成,实现高效数据管理。

OCR 字幕生成

制作视频字幕既耗时又耗力。C# 中的 OCR 计算机视觉可以通过自动检测和誊写屏幕文本翻译的目的是使开发人员能够

  • 为电影、电视节目和在线视频制作准确的字幕。
  • 提高有听力障碍或使用不同语言的人的可访问性。
  • 通过为视频平台提供可搜索、可索引的内容,提高搜索引擎优化效果

OCR PDF 处理

PDF 被广泛用于共享和存储文档,但从中提取文本却具有挑战性。 C# 中的 OCR 计算机视觉可以帮助开发人员构建 OCR 应用程序,毫不费力地处理 PDF 文件和取其精华在翻译过程中,必须注意以下几点

印刷文本数字化

OCR 软件广泛用于从文档图像中将印刷文本数字化. OCR 工具可以从扫描的数字文档中提取文本、PDF 文件各种格式的图像. 这在文档管理中尤其有用,您可以轻松搜索、存储和共享基于文本的文档。

提取手写文本

OCR 技术已经发展到可以识别手写文本高准确性。 这在医疗保健等领域尤其有用,因为医疗记录通常包含手写笔记。 OCR 工具可以从医疗记录、处方标签和其他手写文档中提取手写文本。

数据提取

OCR 技术被广泛用于从发票、收据和表格等输入数据中提取数据。 OCR 模型可以识别和提取关键数据字段,如姓名、地址、日期和金额。 这样就无需手动输入数据,并减少数据处理中的错误。

图片搜索

OCR 技术还可用于图像搜索,您可以根据图像中包含的文本搜索图像。 这对大型图片库尤其有用,因为人工搜索会耗费大量时间。

翻译

OCR 软件可用于从一种语言的文档中提取文本并将其翻译成另一种语言。 这对需要快速准确翻译文件的国际企业尤其有用。

摘要

光学字符识别(光学字符识别)是一种使计算机能够从图像中读取文本的技术。 OCR 和计算机视觉非常重要,因为它可以让机器理解和解释视觉世界,这对于自动驾驶汽车、机器人和自动文档处理等应用至关重要。

IronOCR 是一款功能强大的 OCR 引擎,可用于将 OCR 与计算机视觉相结合,准确识别文本并从图像中进行文本提取。 它提供了一系列查找和提取文本区域的方法,包括 "FindTextRegion"、"FindMultipleTextRegions "和 "GetTextRegions"。 每种方法都有自己的一组参数,可用于微调 OCR 流程并提供较高的 OCR 精确度。

使用 IronOCR,您可以快速、准确地从输入图像中提取扫描文本,使用并发性自定义配置在处理大量输入图像数据时,这些工具可以节省您的时间和精力。 无论您使用的是扫描文件、照片还是屏幕截图,IronOCR 都能帮助您解锁其中包含的文本。

IronOCR 提供免费试用用户在做出购买决定之前需要对软件进行测试。 "(《世界人权宣言》)IronOCR 的许可证该翻译从 $749 起,包括一年的支持和更新。 IronOCR 功能强大、价格合理,对于正在寻找可靠、OCR 准确率高的 OCR 解决方案的人来说,IronOCR 是一个不错的选择。

< 前一页
OCR 收据数据提取(逐步教程)
下一步 >
如何在C#中OCR 驾照

准备开始了吗? 版本: 2024.11 刚刚发布

免费NuGet下载 总下载量: 2,698,613 查看许可证 >