修复低质量扫描和图像
IronTesseract "OCR类为C#和.NET开发人员提供了细粒度控制,以添加OCR功能。 (将图像和 PDF 转换为文本) 功能,并根据自己的特定用例对性能进行微调。
通过设置变量,可以在速度和准确性之间找到完美的平衡,并与实际案例相结合。设置包括清除背景噪音"、"增强对比度"、"增强分辨率"、语言、策略、"旋转和拉直"、"色彩空间"、"在黑暗背景下检测白字"、"输入图像类型"。
这样就能读取低质量的扫描结果,而免费的 Tesseract 无法处理这些结果。
using IronOcr; using System; var ocrTesseract = new IronTesseract(); using var ocrInput = new OcrInput(); ocrInput.LoadImage(@"images\image.png"); ocrInput.Deskew(); ocrInput.DeNoise(); ocrInput.Despeckle(); ocrInput.EnhanceResolution(225); ocrInput.Sharpen(); ocrInput.Erode(); ocrInput.Dilate(); ocrInput.Scale(200); var ocrResult = ocrTesseract.Read(ocrInput); Console.WriteLine(ocrResult.Text);
Imports IronOcr Imports System Private ocrTesseract = New IronTesseract() Private ocrInput = New OcrInput() ocrInput.LoadImage("images\image.png") ocrInput.Deskew() ocrInput.DeNoise() ocrInput.Despeckle() ocrInput.EnhanceResolution(225) ocrInput.Sharpen() ocrInput.Erode() ocrInput.Dilate() ocrInput.Scale(200) Dim ocrResult = ocrTesseract.Read(ocrInput) Console.WriteLine(ocrResult.Text)
Install-Package IronOcr
IronTesseract "OCR类为C#和.NET开发人员提供了细粒度控制,以添加OCR功能。 (将图像和 PDF 转换为文本) 功能,并根据自己的特定用例对性能进行微调。
通过设置变量,可以在速度和准确性之间找到完美的平衡,并与实际案例相结合。设置包括清除背景噪音"、"增强对比度"、"增强分辨率"、语言、策略、"旋转和拉直"、"色彩空间"、"在黑暗背景下检测白字"、"输入图像类型"。
这样就能读取低质量的扫描结果,而免费的 Tesseract 无法处理这些结果。