How to set DPI Setting in OCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

每英寸点数 (DPI) 是衡量图像质量的基本标准,它决定了扫描文件或数码照片的细节水平。 虽然扫描文档是将物理记录数字化的一种快速高效的方法,但扫描过程通常会导致文件分辨率较低,尤其是在使用默认设置或 "快速扫描 "设置时。 由于缺乏细节,文本显得模糊或像素化,给数据提取带来了很大的障碍。

这就是 OCR 性能的直接影响因素。 OCR 引擎通过分析字符的精确形状和模式,将其转换为机器可读文本。 当图像的 DPI 较低时,就没有足够的像素来清晰地定义每个字母,从而丢失了精细的细节,导致翻译结果不准确。

然而,IronOCR 的设计可以克服这些常见的挑战。 它经过了精细调整,可在分辨率低至 225 DPI 的扫描仪上实现高准确性。

as-heading:2(快速入门:设置 TargetDPI 以获得更清晰的 OCR 结果) <em

只需简单的一行,您就可以配置 IronOCR 来提升低分辨率图像的分辨率--以最小的代价提高文本的清晰度和识别率。 开发人员可以使用 IronOCR 简洁的 API 立即上手。

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrInput { TargetDPI = 300 }.LoadImage("low-res.png"));
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer
代码示例输出
文本输出