在生产环境中测试,无水印。
随时随地满足您的需求。
获得30天的全功能产品。
几分钟内就能启动并运行。
在您的产品试用期间,全面访问我们的支持工程团队。
光学字符识别(OCR)是一种技术,可将各种文档格式(包括扫描的纸质文档、PDF、数字文件或用数码相机拍摄的打印文本图像)转换为可编辑和可搜索的机器编码文本数据。
IronOCR 是一个出色的OCR引擎库,为开发人员提供强大的OCR功能。 在本文中,我们将探讨如何使用IronOCR执行OCR,并提供带有OCR软件演示的代码示例。
IronOCR 是一个强大的 .NET 库,旨在促进 C# 和 VB.NET 应用程序中的光学字符识别(OCR)。 利用先进的算法和机器学习技术,IronOCR 可以准确地从扫描的 PDF 文件、图像和 PDF 中提取文本和内容,从而更轻松地以编程方式处理、搜索和分析此类文件。
凭借其简单明了的 API 和丰富的功能,开发人员可以将 OCR 功能无缝集成到他们的应用程序中,实现数据提取、文档处理、数据录入和内容管理任务的自动化。 无论您是从事商务工作,还是处理发票、报告、自动数据提取、可搜索的 PDF 或任何其他文本丰富的文档,IronOCR 都能提供可靠的解决方案,高效处理 OCR 要求。
在深入代码示例之前,您需要通过NuGet 包管理器安装 IronOCR。 在软件包管理器控制台运行以下命令即可安装 IronOCR:
Install-Package IronOcr
Install-Package IronOcr
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr
要使用 IronOCR 执行基本的文本识别,可以使用以下代码片段:
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput("ocr.png")
Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
Dim RecognizedText As String = ocrResult.Text
Console.WriteLine(RecognizedText)
End Using
此代码使用IronOCR对名为“ocr.png”的图像文件执行光学字符识别(OCR)。 它初始化一个IronTesseract对象,并将图像文件的文本层读取到一个OcrInput对象中。
然后将 OCR 结果作为RecognizedText检索并打印到控制台。
- 标志店 - LOREM IPSUM - DOLOR SITAMET CONSECTETUR - 精英 - 1 LOREM IPSUM $3.20 - 2 装饰性混合色 $9.50 - 3 门发酵 $5.90 - 4 球形面包 $6.00 - 5 ELEIFEND $9.00 - 6 SEMNISIMASSA $0.50 - 7 DUIS FAMES DIS $7.60 - 8 FACILISIRISUS $810 - 总金额 $49.80 - CASH $50.00
- 标志店 - LOREM IPSUM - DOLOR SITAMET CONSECTETUR - 精英 - 1 LOREM IPSUM $3.20 - 2 装饰性混合色 $9.50 - 3 门发酵 $5.90 - 4 球形面包 $6.00 - 5 ELEIFEND $9.00 - 6 SEMNISIMASSA $0.50 - 7 DUIS FAMES DIS $7.60 - 8 FACILISIRISUS $810 - 总金额 $49.80 - CASH $50.00
'INSTANT VB TODO TASK: The following line uses invalid syntax: '- 标志店 - LOREM IPSUM - DOLOR SITAMET CONSECTETUR - 精英 - 1 LOREM IPSUM $3.20 - 2 装饰性混合色 $9.50 - 3 门发酵 $5.90 - 4 球形面包 $6.00 - 5 ELEIFEND $9.00 - 6 SEMNISIMASSA $0.50 - 7 DUIS FAMES DIS $7.60 - 8 FACILISIRISUS $810 - 总金额 $49.80 - CASH $50.00
$vbLabelText $csharpLabel
### 高级 OCR 选项
IronOCR 提供多种选项,您可以根据自己的图像文件和要求定制 OCR 流程。 例如,您可以指定 OCR 语言、调整图像预处理设置或启用文本清理。 下面的示例展示了其中一些高级选项:
```cs
using IronOcr;
class Program
{
static void Main()
{
var ocr = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\image.png");
// Set OCR language to English
ocr.Language = OcrLanguage.English;
// Enable text cleaning
ocrInput.DeNoise();
ocrInput.EnhanceResolution(225);
var result = ocr.Read(ocrInput);
if (result != null && result.Text != null)
{
Console.WriteLine($"Recognized Text: {result.Text}");
}
}
}
代码使用 IronOCR 对位于 "images "文件夹中的图像文件 "image.png "执行 OCR。 它将 OCR 语言设置为英语,清除图像噪点并增强其分辨率。 从图像中提取识别的文本,然后打印到控制台。
IronOCR 还支持条形码读取,让您可以制作软件从图像中提取条形码信息。 下面是一个代码示例,演示了如何使用 IronOCR 读取条形码:
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Dim ocrInput As New OcrInput()
ocrInput.LoadImage("images\imageWithBarcode.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
For Each barcode In ocrResult.Barcodes
Console.WriteLine(barcode.Value)
Next barcode
代码使用 IronOCR 从 "images "文件夹中的图像文件 "imageWithBarcode.png "中检测和读取条形码。 它通过将ReadBarCodes设置为true来配置IronOCR以启用条形码读取。 然后将检测到的 BarCode 值打印到控制台。
IronOCR 还可以从 PDF 和扫描文档中提取文本。 下面是一个代码示例,演示了如何使用 IronOCR 从 PDF 文件中提取文本:
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
Private ocrInput = New OcrInput()
' OCR entire document
ocrInput.LoadPdf("Email_Report.pdf")
Dim pages() As Integer = { 1, 2, 3, 4, 5 }
' Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
代码使用 IronOCR 对名为 "Email_Report.pdf "的 PDF 文档执行 OCR 处理。 它可以使用LoadPdf对整个文档进行OCR,或者使用带密码的LoadPdfPages对“example.pdf”的特定页面进行OCR。 OCR 操作识别出的文本将打印到控制台。
IronOCR 是一个功能强大的 .NET 库,提供先进的 OCR 软件功能,使开发人员能够轻松在其应用程序中执行 OCR 任务。 在本文中,我们通过代码示例探讨了如何使用 IronOCR 进行基础和高级 OCR 软件演示。
如果您正在开发一个 .NET 项目,并且需要集成 OCR 功能,那么 IronOCR 绝对值得您在考察不同的 OCR 引擎时加以考虑。 其易用性、速度、灵活性和丰富的文档使其成为开发人员执行 OCR 自动化任务的热门选择。
那么,为什么不试试 IronOCR,看看它如何简化您自己的 OCR 项目开发流程呢? 它可能是最适合您的项目的 OCR 引擎。
IronOCR提供免费试用许可证,然后从$749美元起,这使您能够在项目中继续充分利用IronOCR。
要了解有关IronOCR的更多信息,请访问此处。