在实际环境中测试
在生产中测试无水印。
随时随地为您服务。
光学字符识别(光学字符识别)是一种将各种文档格式(包括扫描的纸质文档、PDF、数字文件或数码相机拍摄的印刷文本图像)转换为可编辑和可搜索的机器编码文本数据的技术。
IronOCR是一个出色的 OCR 引擎库,可为开发人员提供强大的 OCR 功能。 在本文中,我们将通过OCR 软件演示的代码示例,探讨如何使用 IronOCR 执行 OCR。
IronOCR 是一个功能强大的 .NET 库,旨在方便光学字符识别(光学字符识别)在 C# 和 VB.NET 应用程序中。 利用先进的算法和机器学习技术,IronOCR 可以准确地从扫描的 PDF 文件、图像和 PDF 中提取文本和内容,从而更轻松地以编程方式处理、搜索和分析此类文件。
凭借其简单明了的 API 和丰富的功能,开发人员可以将 OCR 功能无缝集成到他们的应用程序中,实现数据提取、文档处理、数据录入和内容管理任务的自动化。 无论您是从事商务工作,还是处理发票、报告、自动数据提取、可搜索的 PDF 或任何其他文本丰富的文档,IronOCR 都能提供可靠的解决方案,高效处理 OCR 要求。
在深入学习代码示例之前,您需要安装通过 NuGet 软件包管理器运行 IronOCR. 在软件包管理器控制台运行以下命令即可安装 IronOCR:
Install-Package IronOcr
Install-Package IronOcr
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr
要使用 IronOCR 执行基本的文本识别,可以使用以下代码片段:
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput("ocr.png")
Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
Dim RecognizedText As String = ocrResult.Text
Console.WriteLine(RecognizedText)
End Using
该代码使用 IronOCR 进行光学字符识别(光学字符识别)在一个名为 "ocr.png "的图像文件上。 它初始化一个 IronTesseract 对象,并将图像文件的文本层读入一个 OcrInput 对象。
然后,OCR 结果将以RecognizedText的形式获取并打印到控制台。
``cs
- 商标商店 - LOREM IPSUM - dolor sitamet consectetur - 翻译 - 1 lorem ipsum $3.20 - 2 ornare malesuada $9.50 - 3 porta fermentum $5.90 - 4 sodales arcu $6.00 - 5 eleifend $9.00 - 6 semnisimassa $0.50 - 7 duis fames dis $7.60 - 8 facilisirisus $810 - 总金额 49.80 美元 - 现金 50.00 美元
### 高级 OCR 选项
IronOCR 提供多种选项,您可以根据自己的图像文件和要求定制 OCR 流程。 例如,您可以指定 OCR 语言、调整图像预处理设置或启用文本清理。 下面的示例展示了其中一些高级选项:
```cs
using IronOcr;
class Program
{
static void Main()
{
var ocr = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\image.png");
// Set OCR language to English
ocr.Language = OcrLanguage.English;
// Enable text cleaning
ocrInput.DeNoise();
ocrInput.EnhanceResolution(225);
var result = ocr.Read(ocrInput);
if (result != null && result.Text != null)
{
Console.WriteLine($"Recognized Text: {result.Text}");
}
}
}
代码使用 IronOCR 对位于 "images "文件夹中的图像文件 "image.png "执行 OCR。 它将 OCR 语言设置为英语,清除图像噪点并增强其分辨率。 从图像中提取识别的文本,然后打印到控制台。
IronOCR 还支持条形码读取,让您可以制作软件从图像中提取条形码信息。 下面是一个代码示例,演示了如何使用 IronOCR 读取条形码:
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Dim ocrInput As New OcrInput()
ocrInput.LoadImage("images\imageWithBarcode.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
For Each barcode In ocrResult.Barcodes
Console.WriteLine(barcode.Value)
Next barcode
代码使用 IronOCR 从 "images "文件夹中的图像文件 "imageWithBarcode.png "中检测和读取条形码。 它通过将 ReadBarCodes 设置为 true 来配置 IronOCR 以启用条形码读取功能。 然后将检测到的 BarCode 值打印到控制台。
IronOCR 还可以从 PDF 和扫描文档中提取文本。 下面是一个代码示例,演示了如何使用 IronOCR 从 PDF 文件中提取文本:
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
Private ocrInput = New OcrInput()
' OCR entire document
ocrInput.LoadPdf("Email_Report.pdf")
Dim pages() As Integer = { 1, 2, 3, 4, 5 }
' Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
代码使用 IronOCR 对名为 "Email_Report.pdf "的 PDF 文档执行 OCR 处理。 它可以使用LoadPdf对整个文档进行 OCR,也可以使用LoadPdfPages对 "example.pdf "中的特定页面进行 OCR 并输入密码。 OCR 操作识别出的文本将打印到控制台。
IronOCROCR 是一个功能强大的 .NET 库,提供先进的 OCR 软件功能,使开发人员可以轻松地在其应用程序中执行 OCR 任务。 在本文中,我们通过代码示例探讨了如何使用 IronOCR 进行基础和高级 OCR 软件演示。
无论您是需要识别手写文本、各种数字格式、扫描和读取条形码,还是从 PDF 文档中提取文本,IronOCR 都能为您提供全面的功能。
如果您正在开发一个 .NET 项目,并且需要集成 OCR 功能,那么 IronOCR 绝对值得您在考察不同的 OCR 引擎时加以考虑。 其易用性、速度、灵活性和丰富的文档使其成为开发人员执行 OCR 自动化任务的热门选择。
那么,为什么不试试 IronOCR,看看它如何简化您自己的 OCR 项目开发流程呢? 它可能是最适合您的项目的 OCR 引擎。
IronOCR 提供免费的试用许可价格从 749 美元起,让您在项目中继续充分发挥 IronOCR 的作用。
要了解有关 IronOCR 的更多信息,请访问这里.