IronOCR OCR识别:使用旧版本 System.Drawing 的兼容性
.NET 4.6.1 到 .NET 4.8 项目内置了 System.Drawing 版本 4.0.0。此版本的 System.Drawing 已停止支持,在 IronOCR 进行 OCR识别和图片转文字时可能包含易受攻击的代码。
尝试从System.Drawing.Image实例化OcrInput会抛出"IronOcr.Exceptions.IronOcrProductException: '无法将 Object [] 解析为有效的图像文件。'"。 这是因为 IronOcr 无法将System.Drawing.Image识别为有效的输入类型。

尝试指定 Image 输入类型,例如 OcrInput(Image: image),将抛出"无法将 System.Drawing.Image 转换为 SixLabors.ImageSharp.Image"错误。

可能的解决方案
-
将System.Drawing.Common更新至 6.0.0 版本。旧版本的 System.Drawing 已停止支持,并且可能包含存在安全漏洞的代码。
- 使用SixLabors.ImageSharp版本 2.1.3。
OcrInput可以使用SixLabors.ImageSharp.Image类型实例化。
using IronOcr;
using SixLabors.ImageSharp;
using SixLabors.ImageSharp.PixelFormats;
class Program
{
static void Main()
{
var Ocr = new IronTesseract();
// Load the image using SixLabors.ImageSharp
Image image = Image.Load<Rgba32>("image.jpg");
// Use the image as input for OCR
using (var Input = new OcrInput(image))
{
// Perform OCR on the input
var Result = Ocr.Read(Input);
// Print the recognized text
Console.WriteLine(Result.Text);
}
}
}
using IronOcr;
using SixLabors.ImageSharp;
using SixLabors.ImageSharp.PixelFormats;
class Program
{
static void Main()
{
var Ocr = new IronTesseract();
// Load the image using SixLabors.ImageSharp
Image image = Image.Load<Rgba32>("image.jpg");
// Use the image as input for OCR
using (var Input = new OcrInput(image))
{
// Perform OCR on the input
var Result = Ocr.Read(Input);
// Print the recognized text
Console.WriteLine(Result.Text);
}
}
}
Imports IronOcr
Imports SixLabors.ImageSharp
Imports SixLabors.ImageSharp.PixelFormats
Friend Class Program
Shared Sub Main()
Dim Ocr = New IronTesseract()
' Load the image using SixLabors.ImageSharp
Dim image As Image = System.Drawing.Image.Load(Of Rgba32)("image.jpg")
' Use the image as input for OCR
Using Input = New OcrInput(image)
' Perform OCR on the input
Dim Result = Ocr.Read(Input)
' Print the recognized text
Console.WriteLine(Result.Text)
End Using
End Sub
End Class
- 上述代码初始化了
IronTesseract的一个实例,使用SixLabors.ImageSharp从文件中加载图像,然后使用IronOCR处理图像以提取文本。

