在实际环境中测试
在生产中测试无水印。
随时随地为您服务。
本教程旨在帮助初学者创建一个OCR 收据扫描仪使用IronOCR用 C# 编写一个 OCR API。 在本指南结束时,您将了解如何实现光学字符识别(光学字符识别)使用收据 OCR API 将不同类型的收据文件转换为可编辑和可搜索的数据。 对于希望实现费用管理自动化并尽量减少人工数据输入的企业来说,这项技术可以改变游戏规则。 让我们开始吧!
使用 NuGet 软件包管理器安装 OCR 库3。使用 OcrInput 方法将收据加载到程序中
在我们进入编码部分之前,请确保您具备以下条件:
虚拟工作室:这将是我们的集成开发环境(IDE)我们将在.NET、Java、Python 或 Node js 中编写和运行 C# 代码。
IronOCR 库:我们将使用 IronOCR,这是一个先进的 OCR 库,可以轻松集成到 C# 应用程序中。
打开 Visual Studio:在桌面或应用程序菜单中找到 Visual Studio 图标,双击该图标打开程序。
创建新项目:打开 Visual Studio 后,您会发现一个启动窗口。 点击“创建新项目”按钮。 如果您已经打开了 Visual Studio,但没有看到启动窗口,可以通过单击顶部菜单中的 "文件">"新建">"项目 "来访问该窗口。
选择项目类型:在 "创建新项目 "窗口中,您将看到各种项目模板。 在搜索框中输入 "控制台应用程序 "过滤选项,然后选择控制台应用程序(.NET Core)或控制台应用程序(.NET框架)您可以根据自己的偏好和兼容性来决定是否翻译。 然后点击下一步按钮。
配置新项目:现在,您将看到一个名为 "配置您的新项目 "的屏幕。
填写完这些详细信息后,请单击下一步按钮。
附加信息: 可能会要求您选择目标 .NET Framework。 选择最新版本(除非您有特殊的兼容性要求)然后点击创建。
在使用 IronOCR 库之前,我们需要将其包含在我们的项目中。 遵循以下步骤:
右键单击解决方案资源管理器中的项目。
选择 "管理 NuGet 软件包"。
在 NuGet 软件包管理器窗口中,您会看到几个选项卡,如浏览、已安装、更新和合并。 单击 "浏览"选项卡。
在搜索框中输入 IronOcr。 这是我们希望添加到项目中的库的名称。 按回车键搜索。
搜索结果将显示 IronOCR 库包。 这应该是您最先看到的结果之一。 点击选择。
选择 IronOCR 软件包后,您会发现右侧有一个面板显示该软件包的信息,包括描述和版本。 该面板中还有一个安装按钮。
安装 IronOCR 后,下一步就是配置项目。 方法如下:
添加命名空间:在Program.cs文件的顶部,包含以下命名空间:
using IronOcr;
using System;
using IronOcr;
using System;
Imports IronOcr
Imports System
配置设置:如果您有任何配置设置,如 API 密钥或许可证密钥,请务必包括在内。 对于 IronOCR,您需要设置许可证密钥,如提供的代码所示:
License.LicenseKey = "License-Key"; // replace 'License-Key' with your key
License.LicenseKey = "License-Key"; // replace 'License-Key' with your key
License.LicenseKey = "License-Key" ' replace 'License-Key' with your key
现在,让我们编写代码来读取收据。
定义收据路径:指定要扫描的收据文件的路径。
string pdfFilePath = "Sample_Receipt.jpg";
string pdfFilePath = "Sample_Receipt.jpg";
Dim pdfFilePath As String = "Sample_Receipt.jpg"
Try-Catch 块:使用 try-catch 块实现错误处理。 这将有助于您管理 OCR 过程中出现的任何异常情况。
try
{
// OCR code will go here
}
catch (Exception ex)
{
// Handle exceptions here
Console.WriteLine($"An error occurred: {ex.Message}");
}
try
{
// OCR code will go here
}
catch (Exception ex)
{
// Handle exceptions here
Console.WriteLine($"An error occurred: {ex.Message}");
}
Try
' OCR code will go here
Catch ex As Exception
' Handle exceptions here
Console.WriteLine($"An error occurred: {ex.Message}")
End Try
在第 5 步,我们将深入探讨应用程序的核心功能:实施 OCR 来读取和解释收据中的数据。 这包括初始化 OCR 引擎、配置输入、执行 OCR 操作和显示结果。
代码的第一部分创建了IronTesseract类的实例:
var ocr = new IronTesseract();
var ocr = new IronTesseract();
Dim ocr = New IronTesseract()
通过创建IronTesseract实例,我们基本上设置了我们的 OCR 工具,使其能够执行文本识别任务。 这就好比在驾驶汽车之前先启动发动机。 该对象将用于控制 OCR 过程,包括读取输入内容并从中提取文本。
接下来,我们定义 OCR 流程的输入:
using (var input = new OcrInput(pdfFilePath))
{
// OCR processing will go here
}
using (var input = new OcrInput(pdfFilePath))
{
// OCR processing will go here
}
Using input = New OcrInput(pdfFilePath)
' OCR processing will go here
End Using
在本段中,OcrInput 用于指定我们要处理的文件。 pdfFilePath是一个变量,包含我们接收文件的路径。通过将此变量传递给 OcrInput,我们就告诉了 OCR 引擎:"这就是我要你读取的文件。using语句是一种特殊的 C# 结构,可确保OcrInput使用的资源(如文件句柄)处理完成后,译文将被适当发布。 这是一种有效管理资源的方法,可确保您的应用程序顺利运行,而不会造成不必要的内存占用。
在使用块中,我们在ocr实例上调用Read方法:
var result = ocr.Read(input);
var result = ocr.Read(input);
Dim result = ocr.Read(input)
Read 方法将输入文件路径作为参数。 此行将开始扫描收据。 它将对给定的输入文件进行 OCR 处理,提取数据并将其存储到变量结果中。 我们可以使用该方法提取的文本执行任何文本操作。
最后,我们输出 OCR 识别出的文本:
Console.WriteLine(result.Text);
Console.WriteLine(result.Text);
Console.WriteLine(result.Text)
result 变量包含 OCR 处理的输出,result.Text 包含从收据中提取的实际文本。 然后,Console.WriteLine 函数会获取这些文本并将其显示在控制台上。 这样您就可以看到并验证 OCR 过程的结果。 以下是完整的 Program.cs 文件代码:
using IronOcr;
using Microsoft.Extensions.Configuration;
using System;
class Program
{
static void Main(string [] args)
{
License.LicenseKey = "Your-License-Key";
string pdfFilePath = "Sample_Receipt.jpg";
try
{
var ocr = new IronTesseract();
using (var input = new OcrInput(pdfFilePath))
{
var result = ocr.Read(input);
Console.WriteLine(result.Text);
}
}
catch (Exception ex)
{
// Handle exceptions (e.g., file not found, OCR errors) and log them if necessary.
Console.WriteLine($"An error occurred: {ex.Message}");
}
}
}
using IronOcr;
using Microsoft.Extensions.Configuration;
using System;
class Program
{
static void Main(string [] args)
{
License.LicenseKey = "Your-License-Key";
string pdfFilePath = "Sample_Receipt.jpg";
try
{
var ocr = new IronTesseract();
using (var input = new OcrInput(pdfFilePath))
{
var result = ocr.Read(input);
Console.WriteLine(result.Text);
}
}
catch (Exception ex)
{
// Handle exceptions (e.g., file not found, OCR errors) and log them if necessary.
Console.WriteLine($"An error occurred: {ex.Message}");
}
}
}
Imports IronOcr
Imports Microsoft.Extensions.Configuration
Imports System
Friend Class Program
Shared Sub Main(ByVal args() As String)
License.LicenseKey = "Your-License-Key"
Dim pdfFilePath As String = "Sample_Receipt.jpg"
Try
Dim ocr = New IronTesseract()
Using input = New OcrInput(pdfFilePath)
Dim result = ocr.Read(input)
Console.WriteLine(result.Text)
End Using
Catch ex As Exception
' Handle exceptions (e.g., file not found, OCR errors) and log them if necessary.
Console.WriteLine($"An error occurred: {ex.Message}")
End Try
End Sub
End Class
构建项目:单击 "构建 "菜单,然后选择 "构建解决方案"。
运行项目:按 F5 键或点击 "开始 "按钮运行应用程序。
现在,您可以看到从收据输出到控制台的文本。 此文本代表从您的收据图像中提取的数据。 我们就是这样使用 IronOCR 扫描收据的。 这是一个使用 OCR 功能从纸质收据中提取数据的简单示例。这是一个非常通用的实现。 您可以修改代码以匹配收据图片的布局。
之后,您可以使用我们扫描收据后从收据中获得的非结构化数据。我们可以从收据的特定部分获取重要信息。 或者,我们可以以更有条理的方式展示收据数据。 我们可以使用 IronOCR 制作一个 OCR 收据扫描软件应用程序。 这将有助于我们提取准确的收据字段数据。
祝贺! 您已经使用 C# 和 IronOCR 成功构建了一个 OCR 收据扫描仪。 该扫描仪可大大提高数据提取的准确性,满足各种业务需求,如费用跟踪、供应链管理等。 以后再也不用查看扫描的收据并手动提取数据了。
IronOCR 提供了一个免费试用对于那些希望集成和利用 Node.js 工具的用户,我们可以在不收取任何初始费用的情况下,让用户探索和评估其功能。对于那些寻求在专业设置中集成和利用全部功能的用户,许可证从 $749 开始,为强大的 OCR 收据扫描和数据提取需求提供全面的解决方案。
请记住,这仅仅是个开始。 您可以扩展此应用程序,以支持各种文件类型,改善数据隐私,或集成其他功能,如识别特定字段的收据,如税额、日期、行项目等。 有了 OCR 技术,我们就有了无限可能,为更高效、更智能的业务流程铺平了道路。 快乐编程!