使用 IRONOCR

使用计算机视觉的OCR(示范教程)

更新 2024年一月28日
分享:

光学字符识别 (光学字符识别) 是一种能让机器从图像中读取和解释文本的技术,它能让数据处理和自动化变得更快、更高效。这篇文章提供了使用 IronOCR 库的 OCR 计算机视觉的指南,以及它如何增强文本识别能力,实现这一过程的自动化。

OCR 为什么重要?

OCR 与计算机视觉 是一种先进的光学字符识别技术 (光学字符识别) 它利用人工智能和机器学习算法的力量,更准确、更高效地识别图像中的文本字符。

计算机视觉图像处理算法使 OCR 系统能够理解图像中文本的上下文和布局,并根据其形状和结构识别字符。OCR 与计算机视觉相结合,可以从具有多种字体、样式和尺寸的复杂图像中提取文本,使其成为文档数字化、数据提取和自动化的重要工具。

IronOCR:C#OCR 库

IronOCR 是一个流行的 OCR 库,它使用计算机视觉技术从图像和文档中提取文本。它易于使用,可与多种编程语言集成,包括 C# 和 VB.NET。IronOCR 有内部部署和云版本,提供一系列处理和提取图像文本的功能。

安装 IronOCR

要安装 IronOCR,请在 NuGet 软件包管理器控制台中使用以下命令:

:ProductInstall

使用 IronOCR 的 OCR 系统

以下图像用于测试 计算机视觉 OCR 系统 使用 IronOCR。

利用计算机视觉进行 OCR 识别(实例教程),图 1:用于 OCR 检测的图像样本

用于 OCR 检测的图像样本

FindTextRegion

查找文本区域 查找文本区域 方法用于识别图像中的单个文本区域。该方法需要几个可选参数,包括 "Scale"、"DilationAmount"、"Binarize "和 "Invert"。Scale 可调整图像的大小,DilationAmount 可增加文本的厚度,Binarize 可将图像转换为黑白图像,Invert 可反转图像的颜色。

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using inputOCR = New OcrInput("test.jpg")
	inputOCR.FindTextRegion()
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

运行代码后,你会看到它通过机器学习过程从文本区域提取文本。输出结果显示在控制台中,文字识别准确率几乎达到 100%。无论是打印文本还是手写文本,IronOCR 的准确率都接近 100%。

利用计算机视觉进行 OCR 识别(示例教程),图 2:文本提取过程中的控制台结果

文本提取过程中的控制台结果

FindMultipleTextRegions 方法

方法 查找多个文本区域 方法类似于 FindTextRegion 方法,但它用于图像中存在多个文本区域的情况。它返回一个定义每个文本区域位置的 CropRectangle 对象列表。当您想从包含多个文本区域的图像中提取文本时,此方法非常有用。

using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr

Private ocr = New IronTesseract()
Using input = New OcrInput("test.jpg")
	input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

上面提供的代码片段是一个如何使用 IronOCR 库在图像文件上执行 OCR 的示例。它首先导入 IronOCR 库,并创建一个新的 钢铁魔方 类。然后,它会初始化一个 OcrInput 对象,输入图像文件的路径,并应用 一些图像校正的预处理技术 使用 FindMultipleTextRegions 方法。

之后,它会调用 阅读 对象的 "IronTesseract "方法,该方法会对预处理后的图像执行 OCR 并返回一个 OcrResult 对象。然后,从 OcrResult 对象中提取的文本会存储在一个字符串变量中,并打印到控制台。

IronOCR 的输出结果

IronOCR 的输出非常准确,即使在处理带有多种字体、尺寸和文本样式的复杂图像时也是如此。

从图像中提取数据时,OCR 的准确性至关重要,因为提取的文本通常用于进一步处理,如数据分析、手动数据录入、机器学习或自然语言处理。如果提取的文本包含错误,就会给下游处理带来问题。此外,IronOCR 还允许对结果对象进行调查,以便 检查置信度.

OCR 计算机视觉使用案例

光学字符识别 (光学字符识别) OCR 技术彻底改变了处理印刷和手写文本的方式。光学字符识别工具已成为文档处理和数据提取不可或缺的一部分。以下是一些光学字符识别软件的使用案例:

OCR 车牌识别系统

车牌识别 在交通管理自动化、停车系统和执法活动中发挥着重要作用。通过在 C# 中实施 OCR 计算机视觉技术,开发人员可以创建应用程序,从图像或实时视频中快速准确地识别车牌。这项技术可用于

  • 监控交通违规行为,识别涉及犯罪活动的车辆。
  • 实现停车系统自动化,促进出入管理并简化计费流程。

  • 通过跟踪和监控禁区内的车辆通行情况,加强安保措施。

从发票中提取文本

C# 中的 OCR 计算机视觉可用于开发 OCR 应用程序,这些应用程序可自动 从发票中提取文本 和其他财务文件。这一流程可大幅减少人工数据输入错误,并简化会计任务。主要优势包括

  • 通过自动化数据录入流程提高生产率。
  • 提高准确性,因为 OCR 降低了人为错误的可能性。

  • 与会计软件和系统无缝集成,实现高效数据管理。

OCR 字幕生成

为视频制作字幕既耗时又耗力。C# 中的 OCR 计算机视觉可以通过自动 检测和誊写屏幕文本使开发人员能够

  • 为电影、电视节目和在线视频创建准确的字幕。
  • 为有听力障碍或使用不同语言的人提高无障碍程度。

  • 通过为视频平台提供可搜索、可索引的内容,提高搜索引擎优化效果

OCR PDF 处理

PDF 被广泛用于共享和存储文档,但从中提取文本却具有挑战性。C# 中的 OCR 计算机视觉技术可帮助开发人员构建 OCR 应用程序,毫不费力地处理 PDF 文件,并在 PDF 文件中提取文本。 取其精华促进:

印刷文本数字化

OCR 软件广泛用于 从文档图像中将印刷文本数字化.OCR 工具可以从扫描的数字文档中提取文本、 PDF 文件各种格式的图像.这在文档管理中尤为有用,您可以轻松搜索、存储和共享基于文本的文档。

提取手写文本

OCR 技术已经发展到可以 识别手写文本 准确度极高。这在医疗保健等领域尤其有用,因为医疗记录通常包含手写笔记。OCR 工具可以从医疗记录、处方标签和其他手写文档中提取手写文本。

数据提取

OCR 技术广泛用于从发票、收据和表格等输入数据中提取数据。OCR 模型可以识别和提取关键数据字段,如姓名、地址、日期和金额。这样就无需手动输入数据,减少了数据处理中的错误。

图像搜索

OCR 技术还可用于图像搜索,根据图像中包含的文本搜索图像。这对大型图像库尤为有用,因为人工搜索非常耗时。

翻译

OCR 软件可用于从一种语言的文件中提取文本,并将其翻译成另一种语言。这对需要快速准确翻译文件的国际企业尤其有用。

摘要

光学字符识别 (光学字符识别) 是一种能让计算机从图像中读取文字的技术。OCR 和计算机视觉之所以重要,是因为它能让机器理解和解释视觉世界,这对于自动驾驶汽车、机器人和自动文档处理等应用至关重要。

IronOCR 是一个功能强大的 OCR 引擎,可用于将 OCR 与计算机视觉相结合,准确识别文本并从图像中提取文本。它提供了一系列查找和提取文本区域的方法,包括 "FindTextRegion"(查找文本区域)、"FindMultipleTextRegions"(查找多个文本区域)和 "GetTextRegions"(获取文本区域)。每种方法都有自己的参数集,可用于 微调 OCR 流程 并提供较高的 OCR 精确度。

通过使用 IronOCR,您可以快速、准确地从输入图像中提取扫描文本。 并发性自定义配置在处理大量输入图像数据时,它能为你节省时间和精力。无论您处理的是扫描文档、照片还是屏幕截图,IronOCR 都能帮助您解锁其中包含的文本。

IronOCR 提供 免费试用 用户在做出购买决定之前,可以试用该软件。用户 IronOCR 的许可证 起价为 $749,包括一年的支持和更新。IronOCR 功能强大,价格合理,是寻找高 OCR 精确度的可靠 OCR 解决方案的用户的最佳选择。

< 前一页
OCR 收据数据提取(逐步教程)
下一步 >
如何在C#中OCR 驾照

准备开始了吗? 版本: 2024.9 刚刚发布

免费NuGet下载 总下载量: 2,319,721 查看许可证 >