使用 IronOCR 实现 .NET MAUI OCR

查克尼特·宾

2023年二月1日

更新 2024年十二月11日

Translated

View the article in English

介绍

微软发布了 .NET MAUI（多平台应用程序用户界面），这是一个用于使用.NET Framework构建跨平台应用程序的框架。它允许您使用相同的代码库编写代码，以便在Android、iOS和Windows上运行，从而节省时间、资源和努力。 .NET MAUI 是开源的。您可以在[GitHub](https://github.com/dotnet/maui" target="_blank" rel="nofollow noreferrer noopener)上获取带有示例的.NET MAUI项目的源代码。

在本教程中，我们将学习如何使用IronOCR库在.NET MAUI上创建OCR处理器应用程序，并提供示例。

如何在 .NET Maui 中执行 OCR

下载用于在 .NET Maui 中执行 OCR 的 C# 库
配置Maui项目的前端
使用FilePicker类传递图像的完整路径
调用Read方法对图像进行OCR
通过访问文本属性来获取提取的文本并显示它

IronOCR：.NET OCR 库

IronOCR 是一个 .NET OCR NuGet 库，使开发人员能够轻松地将光学字符识别（OCR）功能集成到他们的项目中。使用IronOCR，PDF文档可以被扫描并转换成可搜索和可编辑的文本/数据，而不会有任何数据质量的损失。这使用户能够轻松地从PDF文档中找到所需信息，并在必要时进行更改或更正。

IronOCR是适用于任何平台的Tesseract二进制文件中最先进的构建版本。它提供了更快的速度、更高的准确性，以及一个支持所有版本 Tesseract（从 Tesseract 3 到 Tesseract 5）的本机 DLL/API，并且只需一次简单的安装/下载。

IronOCR支持广泛的语言，为用户提供125种国际语言。该工具/DLL 默认安装英语。但是，您可以通过通过 NuGet 安装或下载 DLL 来轻松添加更多语言。

与 Tesseract 的比较

IronOCR专为C#开发者设计，并与.NET应用程序无缝集成。相比之下，Tesseract 是一个通用的 OCR 库，开发者需要编写自己的封装器才能在 C# 中使用它。此外，由于采用了创新的人工智能算法，IronOCR 提供了比其他库更高的准确性和速度。

IronOCR附带全面的文档和技术支持，即使是新手开发者也能快速上手。

IronOCR 比 Tesseract 更精确。实际上，它的准确率超过了99%，而Tesseract的准确率只有大约70.2%到92.9%。在[YouTube](https://www.youtube.com/watch?v=2QTEb6x8NJ4" target="_blank" rel="nofollow noopener noreferrer)视频中获取有关IronOCR和Tesseract比较的更多信息和支持。

创建 OCR MAUI 应用的步骤

按照以下步骤使用IronOCR在.NET MAUI框架中创建一个OCR应用。

先决条件

在 .NET MAUI 中创建 OCR 应用程序有一些先决条件。

Visual Studio 2022（最新版本）
.NET 6 或 7
Visual Studio 中安装的 MAUI 包
一个在 Visual Studio 中运行的 .NET MAUI 项目

安装 IronOCR

首先要通过 NuGet 包管理控制台安装 IronOCR 库。右键单击解决方案资源管理器，然后输入以下命令来打开NuGet包控制台，以安装IronOCR库。

Install-Package IronOcr

前端设计

我们将在本节中设计应用程序的前端。打开MainPage.xaml文件。

MainPage.xaml

我们指定一个按钮，帮助我们选择用于OCR的图像或PDF文档。按钮的clicked属性被设置为执行IOCR函数。我们将在下一节中定义这个函数。

<Button
    x:Name="OCR"
    Text="Click to OCR"
    Clicked="IOCR"
    HorizontalOptions="Center" />

<Button
    x:Name="OCR"
    Text="Click to OCR"
    Clicked="IOCR"
    HorizontalOptions="Center" />

XML

在这里，我们创建一个名为OCRImage的Image框。此图片框将帮助显示所选文件。

<Image
    x:Name="OCRImage"
    SemanticProperties.Description="Selected Image"
    HeightRequest="300"
    HorizontalOptions="Center" />

<Image
    x:Name="OCRImage"
    SemanticProperties.Description="Selected Image"
    HeightRequest="300"
    HorizontalOptions="Center" />

XML

接下来，我们创建一个Editor控件。它将用于显示从图像或PDF文档中提取的文本。

<Editor
    x:Name="outputText"
    HorizontalOptions="Center"
    WidthRequest="600"
    HeightRequest="300"
    />

<Editor
    x:Name="outputText"
    HorizontalOptions="Center"
    WidthRequest="600"
    HeightRequest="300"
    />

XML

下面是已完成的 XAML 用户界面标记。

<?xml version="1.0" encoding="utf-8" ?>
<ContentPage xmlns="http://schemas.microsoft.com/dotnet/2021/maui"
             xmlns:x="http://schemas.microsoft.com/winfx/2009/xaml"
             x:Class="IronOCR_MAUI_Test.MainPage">

    <ScrollView>
        <VerticalStackLayout
            Spacing="25"
            Padding="30,0"
            VerticalOptions="Center">
            <Button
                x:Name="OCR"
                Text="Click to OCR"
                Clicked="IOCR"
                HorizontalOptions="Center" />
            <Image
                x:Name="OCRImage"
                SemanticProperties.Description="Selected Image"
                HeightRequest="300"
                HorizontalOptions="Center" />

            <Editor
                x:Name="outputText"
                HorizontalOptions="Center"
                WidthRequest="600"
                HeightRequest="300"
                />
        </VerticalStackLayout>
    </ScrollView>

</ContentPage>

<?xml version="1.0" encoding="utf-8" ?>
<ContentPage xmlns="http://schemas.microsoft.com/dotnet/2021/maui"
             xmlns:x="http://schemas.microsoft.com/winfx/2009/xaml"
             x:Class="IronOCR_MAUI_Test.MainPage">

    <ScrollView>
        <VerticalStackLayout
            Spacing="25"
            Padding="30,0"
            VerticalOptions="Center">
            <Button
                x:Name="OCR"
                Text="Click to OCR"
                Clicked="IOCR"
                HorizontalOptions="Center" />
            <Image
                x:Name="OCRImage"
                SemanticProperties.Description="Selected Image"
                HeightRequest="300"
                HorizontalOptions="Center" />

            <Editor
                x:Name="outputText"
                HorizontalOptions="Center"
                WidthRequest="600"
                HeightRequest="300"
                />
        </VerticalStackLayout>
    </ScrollView>

</ContentPage>

XML

现在，是编写 OCR 功能代码的时候了。

使用IronOCR的OCR代码

打开 "MainPage.xaml.cs" 类文件，并在其中编写以下函数。

MainPage.xaml.cs

private async void IOCR(object sender, EventArgs e)
{
    var images = await FilePicker.Default.PickAsync(new PickOptions
    {
        PickerTitle = "Pick image",
        FileTypes = FilePickerFileType.Images
    });
    var path = images.FullPath.ToString();
    OCRImage.Source = path;

    var ocr = new IronTesseract();
    using (var input = new OcrInput())
    {
        input.AddImage(path);
        OcrResult result = ocr.Read(input);
        string text = result.Text;
        outputText.Text = text; 
    }
}

private async void IOCR(object sender, EventArgs e)
{
    var images = await FilePicker.Default.PickAsync(new PickOptions
    {
        PickerTitle = "Pick image",
        FileTypes = FilePickerFileType.Images
    });
    var path = images.FullPath.ToString();
    OCRImage.Source = path;

    var ocr = new IronTesseract();
    using (var input = new OcrInput())
    {
        input.AddImage(path);
        OcrResult result = ocr.Read(input);
        string text = result.Text;
        outputText.Text = text; 
    }
}

Private Async Sub IOCR(ByVal sender As Object, ByVal e As EventArgs)
	Dim images = Await FilePicker.Default.PickAsync(New PickOptions With {
		.PickerTitle = "Pick image",
		.FileTypes = FilePickerFileType.Images
	})
	Dim path = images.FullPath.ToString()
	OCRImage.Source = path

	Dim ocr = New IronTesseract()
	Using input = New OcrInput()
		input.AddImage(path)
		Dim result As OcrResult = ocr.Read(input)
		Dim text As String = result.Text
		outputText.Text = text
	End Using
End Sub

$vbLabelText $csharpLabel

让我们分解上面的代码。

以下代码片段帮助使用 C# 的FilePicker对象选择图像。 FilePicker 标题和 FilePicker 文件类型都设置为值，同时还包括图像的路径。

var images = await FilePicker.Default.PickAsync(new PickOptions
{
    PickerTitle = "Pick image",
    FileTypes = FilePickerFileType.Images
});
var path = images.FullPath.ToString();

var images = await FilePicker.Default.PickAsync(new PickOptions
{
    PickerTitle = "Pick image",
    FileTypes = FilePickerFileType.Images
});
var path = images.FullPath.ToString();

Dim images = Await FilePicker.Default.PickAsync(New PickOptions With {
	.PickerTitle = "Pick image",
	.FileTypes = FilePickerFileType.Images
})
Dim path = images.FullPath.ToString()

$vbLabelText $csharpLabel

Image 盒控件接下来配置为使用上面 path 变量中指定的图像。

OCRImage.Source = path;

OCRImage.Source = path;

OCRImage.Source = path

$vbLabelText $csharpLabel

然后，我们开始通过创建一个新的IronTesseract类实例来使用IronOCR。我们使用它从选定的图像中提取文本，然后在编辑器控件中显示内容。

var ocr = new IronTesseract();
    using (var input = new OcrInput())
    {
        input.AddImage(path);
        OcrResult result = ocr.Read(input);
        string text = result.Text;
        outputText.Text = text; 
    }

var ocr = new IronTesseract();
    using (var input = new OcrInput())
    {
        input.AddImage(path);
        OcrResult result = ocr.Read(input);
        string text = result.Text;
        outputText.Text = text; 
    }

Dim ocr = New IronTesseract()
	Using input = New OcrInput()
		input.AddImage(path)
		Dim result As OcrResult = ocr.Read(input)
		Dim text As String = result.Text
		outputText.Text = text
	End Using

$vbLabelText $csharpLabel