使用 IRONOCR

如何在C#中创建OCR软件演示

Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

坎那帕·乌东攀

2024年六月6日

光学字符识别（OCR）是一种技术，可将各种文档格式（包括扫描的纸质文档、PDF、数字文件或用数码相机拍摄的打印文本图像）转换为可编辑和可搜索的机器编码文本数据。

IronOCR 是一个出色的OCR引擎库，为开发人员提供强大的OCR功能。在本文中，我们将探讨如何使用IronOCR执行OCR，并提供带有OCR软件演示的代码示例。

什么是IronOCR？

IronOCR 是一个强大的 .NET 库，旨在促进 C# 和 VB.NET 应用程序中的光学字符识别（OCR）。利用先进的算法和机器学习技术，IronOCR 可以准确地从扫描的 PDF 文件、图像和 PDF 中提取文本和内容，从而更轻松地以编程方式处理、搜索和分析此类文件。

凭借其简单明了的 API 和丰富的功能，开发人员可以将 OCR 功能无缝集成到他们的应用程序中，实现数据提取、文档处理、数据录入和内容管理任务的自动化。无论您是从事商务工作，还是处理发票、报告、自动数据提取、可搜索的 PDF 或任何其他文本丰富的文档，IronOCR 都能提供可靠的解决方案，高效处理 OCR 要求。

IronOCR 入门

在深入代码示例之前，您需要通过NuGet 包管理器安装 IronOCR。在软件包管理器控制台运行以下命令即可安装 IronOCR：

Install-Package IronOcr

Install-Package IronOcr

'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr

$vbLabelText $csharpLabel

使用 IronOCR 执行 OCR

基本文本识别

要使用 IronOCR 执行基本的文本识别，可以使用以下代码片段：

using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
    OcrResult ocrResult = ocrTesseract.Read(ocrInput);
    string RecognizedText = ocrResult.Text;
    Console.WriteLine(RecognizedText);
}

using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
    OcrResult ocrResult = ocrTesseract.Read(ocrInput);
    string RecognizedText = ocrResult.Text;
    Console.WriteLine(RecognizedText);
}

Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput("ocr.png")
	Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
	Dim RecognizedText As String = ocrResult.Text
	Console.WriteLine(RecognizedText)
End Using

$vbLabelText $csharpLabel

此代码使用IronOCR对名为“ocr.png”的图像文件执行光学字符识别（OCR）。它初始化一个IronTesseract对象，并将图像文件的文本层读取到一个OcrInput对象中。

然后将 OCR 结果作为RecognizedText检索并打印到控制台。

输出



- 标志店

     - LOREM IPSUM

     - DOLOR SITAMET CONSECTETUR

- 精英

- 1 LOREM IPSUM $3.20

- 2 装饰性混合色 $9.50

- 3 门发酵 $5.90

- 4 球形面包 $6.00

     - 5 ELEIFEND $9.00

     - 6 SEMNISIMASSA $0.50

     - 7 DUIS FAMES DIS $7.60

- 8 FACILISIRISUS $810

- 总金额 $49.80

     - CASH $50.00



- 标志店

     - LOREM IPSUM

     - DOLOR SITAMET CONSECTETUR

- 精英

- 1 LOREM IPSUM $3.20

- 2 装饰性混合色 $9.50

- 3 门发酵 $5.90

- 4 球形面包 $6.00

     - 5 ELEIFEND $9.00

     - 6 SEMNISIMASSA $0.50

     - 7 DUIS FAMES DIS $7.60

- 8 FACILISIRISUS $810

- 总金额 $49.80

     - CASH $50.00

'INSTANT VB TODO TASK: The following line uses invalid syntax:
'- 标志店 - LOREM IPSUM - DOLOR SITAMET CONSECTETUR - 精英 - 1 LOREM IPSUM $3.20 - 2 装饰性混合色 $9.50 - 3 门发酵 $5.90 - 4 球形面包 $6.00 - 5 ELEIFEND $9.00 - 6 SEMNISIMASSA $0.50 - 7 DUIS FAMES DIS $7.60 - 8 FACILISIRISUS $810 - 总金额 $49.80 - CASH $50.00

$vbLabelText $csharpLabel


### 高级 OCR 选项

IronOCR 提供多种选项，您可以根据自己的图像文件和要求定制 OCR 流程。 例如，您可以指定 OCR 语言、调整图像预处理设置或启用文本清理。 下面的示例展示了其中一些高级选项：

```cs
using IronOcr;
class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
    ocrInput.LoadImage(@"images\image.png");
        // Set OCR language to English
        ocr.Language = OcrLanguage.English;
        // Enable text cleaning
        ocrInput.DeNoise();
    ocrInput.EnhanceResolution(225);
        var result = ocr.Read(ocrInput);
        if (result != null && result.Text != null)
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}

代码使用 IronOCR 对位于 "images "文件夹中的图像文件 "image.png "执行 OCR。它将 OCR 语言设置为英语，清除图像噪点并增强其分辨率。从图像中提取识别的文本，然后打印到控制台。

如何在 C# 中创建 OCR 软件演示：图 1

条形码阅读

IronOCR 还支持条形码读取，让您可以制作软件从图像中提取条形码信息。下面是一个代码示例，演示了如何使用 IronOCR 读取条形码：

using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
    Console.WriteLine(barcode.Value);
}

using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
    Console.WriteLine(barcode.Value);
}

Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Dim ocrInput As New OcrInput()
ocrInput.LoadImage("images\imageWithBarcode.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
For Each barcode In ocrResult.Barcodes
	Console.WriteLine(barcode.Value)
Next barcode

$vbLabelText $csharpLabel

代码使用 IronOCR 从 "images "文件夹中的图像文件 "imageWithBarcode.png "中检测和读取条形码。它通过将ReadBarCodes设置为true来配置IronOCR以启用条形码读取。然后将检测到的 BarCode 值打印到控制台。

如何在 C# 中创建 OCR 软件演示：图 2

PDF 文本提取

IronOCR 还可以从 PDF 和扫描文档中提取文本。下面是一个代码示例，演示了如何使用 IronOCR 从 PDF 文件中提取文本：

using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);

using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);

Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
Private ocrInput = New OcrInput()
' OCR entire document
ocrInput.LoadPdf("Email_Report.pdf")
Dim pages() As Integer = { 1, 2, 3, 4, 5 }
' Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)

$vbLabelText $csharpLabel

代码使用 IronOCR 对名为 "Email_Report.pdf "的 PDF 文档执行 OCR 处理。它可以使用LoadPdf对整个文档进行OCR，或者使用带密码的LoadPdfPages对“example.pdf”的特定页面进行OCR。 OCR 操作识别出的文本将打印到控制台。

如何在C#中创建OCR软件演示：图3

结论

IronOCR 是一个功能强大的 .NET 库，提供先进的 OCR 软件功能，使开发人员能够轻松在其应用程序中执行 OCR 任务。在本文中，我们通过代码示例探讨了如何使用 IronOCR 进行基础和高级 OCR 软件演示。

如果您正在开发一个 .NET 项目，并且需要集成 OCR 功能，那么 IronOCR 绝对值得您在考察不同的 OCR 引擎时加以考虑。其易用性、速度、灵活性和丰富的文档使其成为开发人员执行 OCR 自动化任务的热门选择。

那么，为什么不试试 IronOCR，看看它如何简化您自己的 OCR 项目开发流程呢？它可能是最适合您的项目的 OCR 引擎。

IronOCR提供免费试用许可证，然后从$749美元起，这使您能够在项目中继续充分利用IronOCR。

要了解有关IronOCR的更多信息，请访问此处。

坎那帕·乌东攀

立即与工程团队聊天

软件工程师

在成为软件工程师之前，Kannapat 从日本北海道大学完成了环境资源博士学位。在攻读学位期间，Kannapat 还成为了生物生产工程系车辆机器人实验室的成员。2022年，他利用自己的 C# 技能加入了 Iron Software 的工程团队，专注于 IronPDF。Kannapat 珍视他的工作，因为他能直接向编写 IronPDF 大部分代码的开发者学习。除了同伴学习，Kannapat 还享受在 Iron Software 工作的社交方面。不写代码或文档时，Kannapat 通常在 PS5 上玩游戏或重看《最后生还者》。

< 前一页
Tesseract OCR 多语言开发教程

下一步 >
如何在C#中执行车辆注册OCR