在实际环境中测试
在生产中测试无水印。
随时随地为您服务。
IronOCR 是一个 OCR 库,可用于从图像中识别文本数据以提取信息,包括收据 OCR。它基于 Tesseract OCR 引擎构建,该引擎被认为是迄今为止用于收据识别的最准确的 OCR 引擎之一。IronOCR 可用于读取不同文档类型(包括 PNG、JPG、TIFF、JSON 格式和 PDF)中包含关键信息的文本,并能识别多种语言的文本。
IronOCR 的主要功能或服务之一,是它在收据 OCR 方面特别有用的能力 自动检测文本方向即使图像被旋转或歪斜,也能识别。这对于准确识别上传的收据上的文本和提取数据至关重要,因为收据通常包含大量信息,而且可能被折叠或揉皱,导致文本歪斜。
打开 Visual Studio 软件,进入 "文件 "菜单。选择 "新建项目",然后选择控制台应用程序。
在相应的文本框中输入项目名称并选择路径。然后点击创建按钮。选择所需的 .NET Framework,如下图所示:
在 Visual Studio 中创建新项目
Visual Studio 项目现在将生成控制台应用程序的结构。完成后,它将打开 Program.cs 文件,你可以在其中编写和执行源代码。
从 Visual Studio 新项目向导生成的 program.cs 文件
在 Visual Studio 中,您可以轻松地将 IronOCR 与 C# 项目集成。IronOCR 提供了多种与 C# .NET 项目集成的方法。在此,我们将讨论其中一种:使用 NuGet 包管理器安装 IronOCR。
在 Visual Studio 中,转到 工具 > NuGet 包管理器 > 包管理器控制台
Visual Studio NuGet 软件包管理器控制台
点击后,Visual Studio 窗口底部会出现一个新的控制台。在控制台中键入以下命令并按回车键。
Install-Package IronOcr
只需几秒钟,IronOCR 就会安装完毕。
IronOCR 是一个功能强大的 OCR 库,可用于从收据中提取和访问包含详细信息的数据。使用 IronOCR,您可以拍摄收据图片并将其转换为机器可读文本,从而在不损害数据隐私的情况下轻松分析和处理数据。
下面是一个如何使用 IronOCR 从收据中提取文本的示例,展示了收据 OCR 的工作原理。
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput("ocr.png")
Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
Dim RecognizedText As String = ocrResult.Text
Console.WriteLine(RecognizedText)
End Using
请参阅 从图像读取文本教程 进一步了解 IronOCR 如何使用 C# 计算机语言从图像中读取文本。
上述代码的输出结果如下:
- LOGO SHOP
- LOREM IPSUM
- DOLOR SITAMET CONSECTETUR
- ADIPISCING ELIT
- 1 LOREM IPSUM $3.20
- 2 ORNARE MALESUADA $9.50
- 3 PORTA FERMENTUM $5.90
- 4 SODALES ARCU $6.00
- 5 ELEIFEND $9.00
- 6 SEMNISIMASSA $0.50
- 7 DUIS FAMES DIS $7.60
- 8 FACILISIRISUS $810
- TOTAL AMOUNT $49.80
- CASH $50.00
作为一个功能强大的 OCR 库,IronOCR 允许开发人员从扫描的收据中提取重要信息,包括税额和商家名称等。
下面举例说明如何使用 IronOCR 从收据图像中提取总金额:
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
ocrTesseract.Language = OcrLanguage.English;
// Code line to load the receipt image
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
// Optimize the input image for OCR
ocrInput.DeNoise(true);
ocrInput.Contrast();
ocrInput.EnhanceResolution();
ocrInput.ToGrayScale();
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Search for the total price in the OCR result
var totalPrice = ocrResult.Text.Contains("Total:") ? ocrResult.Text.Split("Total:")[1].Split("\n")[0] : "";
Console.WriteLine("Total Price: " + totalPrice);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
ocrTesseract.Language = OcrLanguage.English;
// Code line to load the receipt image
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
// Optimize the input image for OCR
ocrInput.DeNoise(true);
ocrInput.Contrast();
ocrInput.EnhanceResolution();
ocrInput.ToGrayScale();
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Search for the total price in the OCR result
var totalPrice = ocrResult.Text.Contains("Total:") ? ocrResult.Text.Split("Total:")[1].Split("\n")[0] : "";
Console.WriteLine("Total Price: " + totalPrice);
}
Imports Microsoft.VisualBasic
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
ocrTesseract.Language = OcrLanguage.English
' Code line to load the receipt image
Using ocrInput As New OcrInput("ocr.png")
' Optimize the input image for OCR
ocrInput.DeNoise(True)
ocrInput.Contrast()
ocrInput.EnhanceResolution()
ocrInput.ToGrayScale()
Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
' Search for the total price in the OCR result
Dim totalPrice = If(ocrResult.Text.Contains("Total:"), ocrResult.Text.Split("Total:")(1).Split(vbLf)(0), "")
Console.WriteLine("Total Price: " & totalPrice)
End Using
多亏了 OcrInput 因此,可以优化输入图像,以提高 OCR 识别过程的准确性。
用于演示从收据中提取特定数据的输入图像
- Total 16.5
IronOCR 可用于读取收据上的条形码和文本。要使用 IronOCR 读取收据上的条形码,需要使用 条码阅读器 类与 读取条形码 方法。
下面举例说明如何使用 IronOCR 读取收据图像上的条形码。
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput("b.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput("b.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Using ocrInput As New OcrInput("b.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
For Each barcode In ocrResult.Barcodes
Console.WriteLine(barcode.Value)
Next barcode
End Using
读取条形码的输入
处理条形码图像的结果
上文介绍了在 C# 项目中安装和使用 IronOCR 从收据中提取数据的过程,并提供了一个示例代码片段。
请阅读 从图像中阅读文本.
IronOCR 是 Iron Suite它包括五个不同的 .NET 库,用于处理文档和图像。您可以 购买整套铁艺套房 只需两张 IronOCR 许可证.
在您的生产应用程序中试用 IronOCR,使用 免费试用.