IronOCR 计算机视觉使用指南

查克尼特·宾

2022年九月26日

更新 2024年十二月10日

Translated

View the article in English

介绍

IronOCR 利用 OpenCV 使用计算机视觉来检测图像中存在文本的区域。这对于包含大量噪音的图像、文本分布在许多不同位置的图像，以及文本扭曲的图像非常有用。 IronOCR中计算机视觉的使用将确定文本区域的位置，然后使用Tesseract尝试读取这些区域。

开始使用IronOCR

立即在您的项目中开始使用IronOCR，并享受免费试用。

第一步：

IronOCR.ComputerVision 通过 NuGet 包安装

在IronOCR中执行计算机视觉的OpenCV方法可以在常规的IronOCR NuGet包中看到。

使用这些方法需要在解决方案中通过 NuGet 安装IronOcr.ComputerVision，如果您没有安装，系统会提示您下载。

Windows: IronOcr.ComputerVision.Windows
Linux: IronOcr.ComputerVision.Linux
macOS: IronOcr.ComputerVision.MacOS
macOS ARM：IronOcr.ComputerVision.MacOS.ARM
使用 NuGet 包管理器安装或在包管理器控制台中粘贴以下内容：

PM> Install-Package IronOcr.ComputerVision.Windows

PM> Install-Package IronOcr.ComputerVision.Windows

SHELL

这将提供使用我们的模型文件所需的程序集以便使用IronOCR计算机视觉。

功能和 API

本教程后面附有代码示例。这里是当前可用方法的总览：

Method	Explanation
FindTextRegion	Detect regions which contain text elements and instruct Tesseract to only search for text within the area in which text was detected.
FindMultipleTextRegions	Detect areas which contain text elements and divide the page into separate images based on text regions.
GetTextRegions	Scans the image and returns a list of text regions as `List`.

代码示例

查找文本区域

使用FindTextRegion将利用计算机视觉检测OcrInput对象每一页上包含文本元素的区域。

:path=/static-assets/ocr/content-code-examples/tutorials/csharp-recognize-text-from-image-computer-vision-1.cs

using IronOcr;

var ocr = new IronTesseract();
using var input = new OcrInput();
// Load at least one image
input.LoadImage("/path/file.png");

input.FindTextRegion();
OcrResult result = ocr.Read(input);
string resultText = result.Text;

Imports IronOcr

Private ocr = New IronTesseract()
Private input = New OcrInput()
' Load at least one image
input.LoadImage("/path/file.png")

input.FindTextRegion()
Dim result As OcrResult = ocr.Read(input)
Dim resultText As String = result.Text

$vbLabelText $csharpLabel

可选择使用自定义参数调用：

:path=/static-assets/ocr/content-code-examples/tutorials/csharp-recognize-text-from-image-computer-vision-2.cs

using IronOcr;

var ocr = new IronTesseract();
using var input = new OcrInput();
// Load at least one image
input.LoadImage("/path/file.png");

input.FindTextRegion(Scale: 2.0, DilationAmount: 20, Binarize: true, Invert: true);
OcrResult result = ocr.Read(input);
string resultText = result.Text;

Imports IronOcr

Private ocr = New IronTesseract()
Private input = New OcrInput()
' Load at least one image
input.LoadImage("/path/file.png")

input.FindTextRegion(Scale:= 2.0, DilationAmount:= 20, Binarize:= True, Invert:= True)
Dim result As OcrResult = ocr.Read(input)
Dim resultText As String = result.Text

$vbLabelText $csharpLabel

重载也可用于以矩形返回文本区域：

:path=/static-assets/ocr/content-code-examples/tutorials/csharp-recognize-text-from-image-computer-vision-3.cs

using IronOcr;

using var input = new OcrInput();
// Load at least one image
input.LoadImage("/path/file.png");

input.FindTextRegion(Scale: 2.0, Binarize: true);

Imports IronOcr

Private input = New OcrInput()
' Load at least one image
input.LoadImage("/path/file.png")

input.FindTextRegion(Scale:= 2.0, Binarize:= True)

$vbLabelText $csharpLabel

查找多个文本区域

使用FindMultipleTextRegions会处理OcrInput对象的所有页面，并使用计算机视觉检测包含文本元素的区域，根据文本区域将输入分成独立的图像：

:path=/static-assets/ocr/content-code-examples/tutorials/csharp-recognize-text-from-image-computer-vision-4.cs

using IronOcr;

var ocr = new IronTesseract();
using var input = new OcrInput();
// Load at least one image
input.LoadImage("/path/file.png");

input.FindMultipleTextRegions();
OcrResult result = ocr.Read(input);
string resultText = result.Text;

Imports IronOcr

Private ocr = New IronTesseract()
Private input = New OcrInput()
' Load at least one image
input.LoadImage("/path/file.png")

input.FindMultipleTextRegions()
Dim result As OcrResult = ocr.Read(input)
Dim resultText As String = result.Text

$vbLabelText $csharpLabel

可选择使用自定义参数调用：

:path=/static-assets/ocr/content-code-examples/tutorials/csharp-recognize-text-from-image-computer-vision-5.cs

using IronOcr;

var ocr = new IronTesseract();
using var input = new OcrInput();
// Load at least one image
input.LoadImage("/path/file.png");

input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
OcrResult result = ocr.Read(input);
string resultText = result.Text;

Imports IronOcr

Private ocr = New IronTesseract()
Private input = New OcrInput()
' Load at least one image
input.LoadImage("/path/file.png")

input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)
Dim result As OcrResult = ocr.Read(input)
Dim resultText As String = result.Text

$vbLabelText $csharpLabel

另一个重载的 FindMultipleTextRegions 方法接收一个 OCR 页面，并返回一个 OCR 页面列表，每个文本区域对应一个页面：

:path=/static-assets/ocr/content-code-examples/tutorials/csharp-recognize-text-from-image-computer-vision-6.cs

using IronOcr;
using System.Collections.Generic;
using System.Linq;

int pageIndex = 0;
using var input = new OcrInput();
// Load at least one image
input.LoadImage("/path/file.png");

var selectedPage = input.GetPages().ElementAt(pageIndex);
List<OcrInputPage> textRegionsOnPage = selectedPage.FindMultipleTextRegions();

Imports IronOcr
Imports System.Collections.Generic
Imports System.Linq

Private pageIndex As Integer = 0
Private input = New OcrInput()
' Load at least one image
input.LoadImage("/path/file.png")

Dim selectedPage = input.GetPages().ElementAt(pageIndex)
Dim textRegionsOnPage As List(Of OcrInputPage) = selectedPage.FindMultipleTextRegions()

$vbLabelText $csharpLabel

获取文本区域

使用GetTextRegions会返回一个列表，其中包含在页面中检测到文本的裁剪区域：

:path=/static-assets/ocr/content-code-examples/tutorials/csharp-recognize-text-from-image-computer-vision-7.cs

using IronOcr;
using IronSoftware.Drawing;
using System.Collections.Generic;
using System.Linq;


int pageIndex = 0;
using var input = new OcrInput();
// Load at least one image
input.LoadImage("/path/file.png");

var selectedPage = input.GetPages().ElementAt(pageIndex);
var regions = selectedPage.GetTextRegions();

Imports IronOcr
Imports IronSoftware.Drawing
Imports System.Collections.Generic
Imports System.Linq


Private pageIndex As Integer = 0
Private input = New OcrInput()
' Load at least one image
input.LoadImage("/path/file.png")

Dim selectedPage = input.GetPages().ElementAt(pageIndex)
Dim regions = selectedPage.GetTextRegions()

$vbLabelText $csharpLabel

查克尼特·宾

立即与工程团队聊天

软件工程师

Chaknith 负责 IronXL 和 IronBarcode 的工作。他在 C# 和 .NET 方面拥有深厚的专业知识，帮助改进软件并支持客户。他从用户互动中获得的洞察力，有助于提升产品、文档和整体体验。