C#图像校正过滤器，用于改进 OCR 阅读

Curtis Chau

已更新:2026年4月21日

Translated

View the article in English

IronOCR 提供了五种关键的图像校正滤镜（dilate 以及 erode），这些滤镜通过在文本提取前增强文字清晰度并减少噪点，对图像进行预处理，从而显著提高 OCR 识别准确率。

快速入门：应用锐化滤镜以获得清晰的文本

使用 IronOCR 的 OcrImageInput，仅需一行代码即可锐化模糊图像。此示例演示了如何增强图像以实现准确的 OCR。

使用 NuGet 包管理器安装 https://www.nuget.org/packages/IronOcr
PM > Install-Package IronOcr

复制并运行这段代码。

new IronOcr.OcrImageInput("sample.png").Sharpen().SaveAsImages("output.png");

部署到您的生产环境中进行测试

通过免费试用立即在您的项目中开始使用IronOCR

最小工作流程（5 个步骤）

下载一个用于使用滤波器进行图像校正的 C# 库
导入 PDF 文档和图像进行读取
应用所需的过滤器，例如锐化、提高分辨率、去噪、扩张和侵蚀
导出校正后的图像以供查看
使用 Read 方法进行 OCR 处理

如何应用锐化滤镜？

该滤镜可增加图像边缘的对比度，使文字边界更加清晰。它可以提高文本的清晰度，使字符识别更加准确。

为什么锐化可以提高 OCR 精度？

锐化滤镜通过增强边缘对比度来强调文本与背景之间的界限。字符识别算法需要清晰明确的字母形状才能正常运行。扫描文档或低质量照片中常见的边缘模糊的文本会导致 OCR 引擎错误识别字符边界。要了解有关 OCR 最佳图像处理的更多信息，请查看我们的OCR 图像优化过滤器综合指南。

要应用 sharpen 过滤器，请调用 Sharpen 对象的 OcrImageInput 方法：

:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-sharpen-filter.cs

using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Apply sharpen filter
imageInput.Sharpen();

// Export filtered image
imageInput.SaveAsImages("sharpen.jpg");

Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.jpg")
' Apply sharpen filter
imageInput.Sharpen()

' Export filtered image
imageInput.SaveAsImages("sharpen.jpg")

$vbLabelText $csharpLabel

何时使用锐化筛选器？

对略微失焦的图像、文本边缘较软的扫描文档或光线较暗的照片使用锐化处理。避免过度锐化清晰的文本，因为这会带来人工痕迹并降低准确性。对于极度模糊的扫描图像，可将锐化与其他滤镜结合使用，或参阅我们的修复低质量扫描图像指南。

使用 SaveAsImages 方法导出过滤后的图像。以下是翻译前后的对比。

前

后

如何增强分辨率以获得更好的 OCR 效果？

该滤镜可增加像素密度，提高清晰度。它有助于 OCR 引擎更准确地读取低分辨率图像中的文本。

OCR 的目标 DPI 是多少？

OCR 引擎在 300 DPI（每英寸点数）下性能最佳。较低的分辨率会导致字符识别错误；分辨率越高，处理速度越慢，但准确性却不会提高。 IronOCR 的增强过滤器可将图像智能地提升到最佳 DPI 水平。有关详细指导，请参阅我们的 DPI 设置指南。

调用 EnhanceResolution 方法以应用此过滤器。默认目标值为 225 DPI：

using IronOcr;

// Create OCR input
var imageInput = new OcrImageInput("low-res-scan.jpg");

// Apply enhance resolution filter with default 225 DPI
imageInput.EnhanceResolution();

// Or specify a custom DPI
imageInput.EnhanceResolution(300);

// Combine with OCR reading
var ocr = new IronTesseract();
var result = ocr.Read(imageInput);
Console.WriteLine($"Extracted text: {result.Text}");

using IronOcr;

// Create OCR input
var imageInput = new OcrImageInput("low-res-scan.jpg");

// Apply enhance resolution filter with default 225 DPI
imageInput.EnhanceResolution();

// Or specify a custom DPI
imageInput.EnhanceResolution(300);

// Combine with OCR reading
var ocr = new IronTesseract();
var result = ocr.Read(imageInput);
Console.WriteLine($"Extracted text: {result.Text}");

Imports IronOcr

' Create OCR input
Dim imageInput As New OcrImageInput("low-res-scan.jpg")

' Apply enhance resolution filter with default 225 DPI
imageInput.EnhanceResolution()

' Or specify a custom DPI
imageInput.EnhanceResolution(300)

' Combine with OCR reading
Dim ocr As New IronTesseract()
Dim result = ocr.Read(imageInput)
Console.WriteLine($"Extracted text: {result.Text}")

$vbLabelText $csharpLabel

何时增强分辨率最为重要？

提高分辨率对以下方面至关重要

以屏幕分辨率（72-96 DPI）截取的截图
从互联网下载的网页图片
低分辨率扫描的历史文件
低分辨率的传真传输

OCR Tesseract Image DPI 示例让我们深入了解 DPI 如何影响不同文档类型的准确性。

前

后

如何去除图像中的噪点？

去噪过滤器可以减少图像中不必要的伪影。降噪可以将文本与背景干扰隔离开来，从而产生更清晰、更准确的 OCR 结果。

2x2 和 3x3 形态有什么区别？

形态大小决定去噪强度。 2x2 形态学应用了温和的降噪技术，在保留精细文本的同时，将人工痕迹降到最低。 3x3 形态可为严重降级的文档提供积极的噪声去除，但可能会影响到非常小的文本。

要应用降噪过滤器，请使用 DeNoise 方法。默认形态为 2x2。通过 "true "表示 3x3 形态：

using IronOcr;

// Load noisy document
var imageInput = new OcrImageInput("noisy-scan.pdf");

// Apply denoise filter with default 2x2 morphology
imageInput.DeNoise();

// Apply stronger denoising with 3x3 morphology
imageInput.DeNoise(true);

// Combine with other filters for severely degraded images
imageInput.DeNoise()
         .Sharpen()
         .EnhanceResolution(300);

// Process with OCR
var ocr = new IronTesseract();
var result = ocr.Read(imageInput);

// Check confidence levels
foreach (var page in result.Pages)
{
    Console.WriteLine($"Page confidence: {page.Confidence}%");
}

using IronOcr;

// Load noisy document
var imageInput = new OcrImageInput("noisy-scan.pdf");

// Apply denoise filter with default 2x2 morphology
imageInput.DeNoise();

// Apply stronger denoising with 3x3 morphology
imageInput.DeNoise(true);

// Combine with other filters for severely degraded images
imageInput.DeNoise()
         .Sharpen()
         .EnhanceResolution(300);

// Process with OCR
var ocr = new IronTesseract();
var result = ocr.Read(imageInput);

// Check confidence levels
foreach (var page in result.Pages)
{
    Console.WriteLine($"Page confidence: {page.Confidence}%");
}

Imports IronOcr

' Load noisy document
Dim imageInput As New OcrImageInput("noisy-scan.pdf")

' Apply denoise filter with default 2x2 morphology
imageInput.DeNoise()

' Apply stronger denoising with 3x3 morphology
imageInput.DeNoise(True)

' Combine with other filters for severely degraded images
imageInput.DeNoise() _
         .Sharpen() _
         .EnhanceResolution(300)

' Process with OCR
Dim ocr As New IronTesseract()
Dim result = ocr.Read(imageInput)

' Check confidence levels
For Each page In result.Pages
    Console.WriteLine($"Page confidence: {page.Confidence}%")
Next

$vbLabelText $csharpLabel

如何知道我的图像是否需要去噪处理？

请注意这些噪音指标：

背景上的随机斑点或圆点
因扫描不佳而产生的椒盐噪音
高 ISO 摄影产生的颗粒感
背景纹理来自再生纸

如需自动检测噪声，请访问我们的 Filter Wizard。

前

后

如何使用 Dilate 过滤器？

扩展图像中的明亮区域。它可以加粗文本，使其更加突出，便于 OCR 软件进行解释。

何时应对文本进行缩放？

对于以下文本中的细小或破碎文本字符，缩放效果最佳：

墨水不一致的旧打字机文件
褪色收据和热敏纸打印输出
带有毛边字体的文档
图像格式中过度压缩的文本

缩放可填补字符内的细小空隙，并加强薄弱的笔画连接。这样可以防止 OCR 引擎将断开的字符误解为多个符号。

要应用膨胀滤波器，请使用 Dilate 方法。默认形态为 2x2；为 3x3 传递 "true"：

using IronOcr;

// Create OCR engine
var ocrTesseract = new IronTesseract();

// Apply dilate filter
var imageInput = new OcrImageInput("thin-text.jpg");
imageInput.Dilate();

// For more aggressive dilation
imageInput.Dilate(true);

// Practical example for faded receipt processing
var receiptInput = new OcrImageInput("faded-receipt.jpg");
receiptInput.Dilate()
           .DeNoise()
           .EnhanceResolution(300);

// Configure for better receipt reading
ocrTesseract.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.SingleBlock;
ocrTesseract.Configuration.ReadBarCodes = true;

// Perform OCR
var result = ocrTesseract.Read(receiptInput);

using IronOcr;

// Create OCR engine
var ocrTesseract = new IronTesseract();

// Apply dilate filter
var imageInput = new OcrImageInput("thin-text.jpg");
imageInput.Dilate();

// For more aggressive dilation
imageInput.Dilate(true);

// Practical example for faded receipt processing
var receiptInput = new OcrImageInput("faded-receipt.jpg");
receiptInput.Dilate()
           .DeNoise()
           .EnhanceResolution(300);

// Configure for better receipt reading
ocrTesseract.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.SingleBlock;
ocrTesseract.Configuration.ReadBarCodes = true;

// Perform OCR
var result = ocrTesseract.Read(receiptInput);

Imports IronOcr

' Create OCR engine
Dim ocrTesseract As New IronTesseract()

' Apply dilate filter
Dim imageInput As New OcrImageInput("thin-text.jpg")
imageInput.Dilate()

' For more aggressive dilation
imageInput.Dilate(True)

' Practical example for faded receipt processing
Dim receiptInput As New OcrImageInput("faded-receipt.jpg")
receiptInput.Dilate() _
           .DeNoise() _
           .EnhanceResolution(300)

' Configure for better receipt reading
ocrTesseract.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.SingleBlock
ocrTesseract.Configuration.ReadBarCodes = True

' Perform OCR
Dim result = ocrTesseract.Read(receiptInput)

$vbLabelText $csharpLabel

过度扩张的常见问题有哪些？

过度扩展可能会导致：

相邻字母合并时的字符出血
内部细节丢失（"e "或 "8 "中的漏洞）
降低粗体文字的准确性

监控结果并做出相应调整。对于具有混合文本权重的文档，请有选择地使用我们的图像质量校正过滤器。

前

后

如何应用 Erode 过滤器？

侵蚀可以减小图像中明亮区域的大小，细化粗大或扭曲的字符并改善字符分离效果。

为什么腐蚀对厚文本有帮助？

侵蚀会使文本笔画变细，并分离接触到的字符。该过滤器擅长

过墨印刷文件
有字符出血的复印件
出现合并的粗体文字
低质量传真传输

仔细的侵蚀可以恢复字符分隔，提高单个字母的识别能力，防止整个单词被误读。

请使用 Erode 方法应用此过滤器。默认形态为 2x2；为 3x3 传递 "true"：

using IronOcr;

// Create OCR instance
var ocrTesseract = new IronTesseract();

// Load image with thick text
var imageInput = new OcrImageInput("thick-text.jpg");

// Apply erode filter
imageInput.Erode();

// Stronger erosion for heavily bleeding text
imageInput.Erode(true);

// Example: Processing a poor-quality photocopy
var photocopyInput = new OcrImageInput("thick-text-photocopy.pdf");

// Apply erosion followed by sharpening for best results
photocopyInput.Erode()
              .Sharpen()
              .EnhanceResolution(300);

// Configure OCR for better accuracy
ocrTesseract.Configuration.BlackListCharacters = "~`@#$%^&*()_+-={}[]|\\:\";<>?,./";
ocrTesseract.Configuration.WhiteListCharacters = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789 ";

var ocrResult = ocrTesseract.Read(photocopyInput);

// Extract with confidence check
var highConfidenceText = ocrResult.Blocks
    .Where(b => b.Confidence > 90)
    .Select(b => b.Text);

using IronOcr;

// Create OCR instance
var ocrTesseract = new IronTesseract();

// Load image with thick text
var imageInput = new OcrImageInput("thick-text.jpg");

// Apply erode filter
imageInput.Erode();

// Stronger erosion for heavily bleeding text
imageInput.Erode(true);

// Example: Processing a poor-quality photocopy
var photocopyInput = new OcrImageInput("thick-text-photocopy.pdf");

// Apply erosion followed by sharpening for best results
photocopyInput.Erode()
              .Sharpen()
              .EnhanceResolution(300);

// Configure OCR for better accuracy
ocrTesseract.Configuration.BlackListCharacters = "~`@#$%^&*()_+-={}[]|\\:\";<>?,./";
ocrTesseract.Configuration.WhiteListCharacters = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789 ";

var ocrResult = ocrTesseract.Read(photocopyInput);

// Extract with confidence check
var highConfidenceText = ocrResult.Blocks
    .Where(b => b.Confidence > 90)
    .Select(b => b.Text);

Imports IronOcr

' Create OCR instance
Dim ocrTesseract As New IronTesseract()

' Load image with thick text
Dim imageInput As New OcrImageInput("thick-text.jpg")

' Apply erode filter
imageInput.Erode()

' Stronger erosion for heavily bleeding text
imageInput.Erode(True)

' Example: Processing a poor-quality photocopy
Dim photocopyInput As New OcrImageInput("thick-text-photocopy.pdf")

' Apply erosion followed by sharpening for best results
photocopyInput.Erode() _
              .Sharpen() _
              .EnhanceResolution(300)

' Configure OCR for better accuracy
ocrTesseract.Configuration.BlackListCharacters = "~`@#$%^&*()_+-={}[]|\:"";<>?,./"
ocrTesseract.Configuration.WhiteListCharacters = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789 "

Dim ocrResult = ocrTesseract.Read(photocopyInput)

' Extract with confidence check
Dim highConfidenceText = ocrResult.Blocks _
    .Where(Function(b) b.Confidence > 90) _
    .Select(Function(b) b.Text)

$vbLabelText $csharpLabel

如何平衡侵蚀与文本可读性？

要找到合适的侵蚀程度，需要进行仔细的测试：

从默认的 2x2 形态开始
对代表性文档样本进行测试
检查标点符号是否清晰可见
确保细字体不会损坏

对于混合文本权重的文档，请参见我们的高级配置选项。

前

后

如何将过滤后的图像保存为可搜索的 PDF？

IronOCR 可让您保存应用了过滤器的修改过的 PDF 文件或其原始状态。 SaveAsSearchablePdf 方法的第二个参数用于确定是否应用过滤器进行保存。

保留过滤器更改的好处是什么？

保留过滤器的更改具有以下几个优势：

创建更简洁、更易读的文档
保持各批次文件的一致性
提供文本质量改进的可视化确认
实现质量控制比较

创建可搜索的 PDF，嵌入 OCR 文本层，同时保持视觉外观。了解更多信息，请参阅我们的创建可搜索 PDF 指南。

using IronOcr;

var ocr = new IronTesseract();
var ocrInput = new OcrInput();

// Load a PDF file
ocrInput.LoadPdf("invoice.pdf");

// Apply multiple filters for comprehensive improvement
ocrInput.ToGrayScale()
        .DeNoise()
        .Sharpen()
        .EnhanceResolution(300);

// Perform OCR
OcrResult result = ocr.Read(ocrInput);

// Save the result as a searchable PDF with filters applied
result.SaveAsSearchablePdf("outputFiltered.pdf", true);

// Or save without filters to preserve original appearance
result.SaveAsSearchablePdf("outputOriginal.pdf", false);

// Export to other formats
result.SaveAsTextFile("extracted-text.txt");
result.SaveAsHocrFile("output.html");

using IronOcr;

var ocr = new IronTesseract();
var ocrInput = new OcrInput();

// Load a PDF file
ocrInput.LoadPdf("invoice.pdf");

// Apply multiple filters for comprehensive improvement
ocrInput.ToGrayScale()
        .DeNoise()
        .Sharpen()
        .EnhanceResolution(300);

// Perform OCR
OcrResult result = ocr.Read(ocrInput);

// Save the result as a searchable PDF with filters applied
result.SaveAsSearchablePdf("outputFiltered.pdf", true);

// Or save without filters to preserve original appearance
result.SaveAsSearchablePdf("outputOriginal.pdf", false);

// Export to other formats
result.SaveAsTextFile("extracted-text.txt");
result.SaveAsHocrFile("output.html");

Imports IronOcr

Dim ocr As New IronTesseract()
Dim ocrInput As New OcrInput()

' Load a PDF file
ocrInput.LoadPdf("invoice.pdf")

' Apply multiple filters for comprehensive improvement
ocrInput.ToGrayScale() _
        .DeNoise() _
        .Sharpen() _
        .EnhanceResolution(300)

' Perform OCR
Dim result As OcrResult = ocr.Read(ocrInput)

' Save the result as a searchable PDF with filters applied
result.SaveAsSearchablePdf("outputFiltered.pdf", True)

' Or save without filters to preserve original appearance
result.SaveAsSearchablePdf("outputOriginal.pdf", False)

' Export to other formats
result.SaveAsTextFile("extracted-text.txt")
result.SaveAsHocrFile("output.html")

$vbLabelText $csharpLabel

如何选择过滤 PDF 和原始 PDF？

在以下情况下使用筛选器保存（true）：

原始文件质量较差
需要在所有文档中保持一致的外观
过滤版本大大提高了可读性
归档文件以便长期保存

保存时不带筛选器（false）：

保留原貌是法律要求
颜色信息很重要
必须保持文件的真实性
只需提供 OCR 准确性过滤器

有关高级 PDF 处理选项，请浏览我们的 PDF OCR 文本提取指南。有关最佳过滤器组合，请参阅过滤器向导教程。

常见问题解答

哪些图像过滤器可以提高 C# 中 OCR 的准确性？

IronOCR 提供五种基本的图像校正滤镜：锐化、增强分辨率、去噪、扩张和侵蚀。这些滤镜可在提取文本前对图像进行预处理，通过提高文本清晰度和减少噪点来显著提高 OCR 的准确性。

如何锐化模糊图像以更好地识别文本？

只需一行代码，您就可以使用 IronOCR 的 OcrImageInput 锐化模糊图像：new IronOcr.OcrImageInput("sample.png").Sharpen()。该滤镜可增加图像边缘的对比度，从而创建更清晰的文本边界，提高字符识别能力。

为什么锐化可以提高 OCR 的准确性？

IronOCR 中的锐化滤镜通过增强边缘对比度来强调文本和背景之间的边界。这一点至关重要，因为字符识别算法需要清晰明确的字母形状才能正常运行。边缘柔和的模糊文本会导致 OCR 引擎错误识别字符边界。

什么时候应该使用锐化 OCR 滤镜？

使用 IronOCR 的锐化滤镜处理略微失焦的图像、文本边缘柔和的扫描文档或在光线不足的情况下拍摄的照片。避免过度锐化清晰文本，因为这样会产生伪影并降低准确性。

为了获得最佳的 OCR 性能，我应该选择什么样的 DPI？

IronOCR 在处理 300 DPI（点/英寸）的图像时性能最佳。较低的分辨率会导致字符识别错误，而较高的分辨率则会减慢处理速度，但不会提高准确性。使用增强分辨率过滤器可提高低分辨率图像的像素密度。

应用修正后能否导出过滤后的图像？

是的，IronOCR 允许您使用 SaveAsImages 方法导出过滤后的图像。这样，您就可以查看图像修正前后的对比，并在运行 OCR 之前验证改进效果。

应用图像滤镜的最基本工作流程是什么？

IronOCR 的最小工作流程包括 5 个步骤：下载库、导入 PDF 或图像、应用所需的过滤器（锐化、增强分辨率、去噪、扩张、侵蚀）、导出校正后的图像以供查看，以及使用读取方法进行 OCR 处理。

使用IronOCR进行文档管理有什么好处？

使用IronOCR进行文档管理可以通过将扫描的文档转换为可搜索和可编辑文本来简化工作流程，减少手动数据输入的需要，提高文档可访问性。

IronOCR如何提高数据准确性？

IronOCR通过其高级识别算法和图像校正功能提高数据准确性，确保文本提取过程既可靠又精确。

IronOCR 有免费试用版吗？

是的，Iron Software 提供IronOCR 的免费试用，使用户在做出购买决定之前可以测试其功能和能力。

Curtis Chau

立即与工程团队聊天

技术作家

Curtis Chau 拥有卡尔顿大学的计算机科学学士学位，专注于前端开发，精通 Node.js、TypeScript、JavaScript 和 React。他热衷于打造直观且美观的用户界面，喜欢使用现代框架并创建结构良好、视觉吸引力强的手册。

除了开发之外，Curtis 对物联网 (IoT) 有浓厚的兴趣，探索将硬件和软件集成的新方法。在空闲时间，他喜欢玩游戏和构建 Discord 机器人，将他对技术的热爱与创造力相结合。

准备开始了吗？

Nuget 下载 5,896,332 | 版本: 2026.5 just released

查看许可证

还在滚动吗？

想快速获得证据？ PM > Install-Package IronOcr
运行示例观看您的图像变成可搜索文本。

查看许可证

开始免费 30 天试用

本页内容

C#图像校正过滤器，用于改进 OCR 阅读

使用 NuGet 包管理器安装 https://www.nuget.org/packages/IronOcr

复制并运行这段代码。

部署到您的生产环境中进行测试

最小工作流程（5 个步骤）

如何应用锐化滤镜？

为什么锐化可以提高 OCR 精度？

何时使用锐化筛选器？

如何增强分辨率以获得更好的 OCR 效果？

OCR 的目标 DPI 是多少？

何时增强分辨率最为重要？

如何去除图像中的噪点？

2x2 和 3x3 形态有什么区别？

如何知道我的图像是否需要去噪处理？

如何使用 Dilate 过滤器？

何时应对文本进行缩放？

过度扩张的常见问题有哪些？

如何应用 Erode 过滤器？

为什么腐蚀对厚文本有帮助？

如何平衡侵蚀与文本可读性？

如何将过滤后的图像保存为可搜索的 PDF？

保留过滤器更改的好处是什么？

如何选择过滤 PDF 和原始 PDF？

常见问题解答

哪些图像过滤器可以提高 C# 中 OCR 的准确性？

如何锐化模糊图像以更好地识别文本？

为什么锐化可以提高 OCR 的准确性？

什么时候应该使用锐化 OCR 滤镜？

为了获得最佳的 OCR 性能，我应该选择什么样的 DPI？

应用修正后能否导出过滤后的图像？

应用图像滤镜的最基本工作流程是什么？

使用IronOCR进行文档管理有什么好处？

IronOCR如何提高数据准确性？

IronOCR 有免费试用版吗？

还在滚动吗？

免费获取

下一步：开始免费 30 天试用

Thank You

下一步：开始免费 30 天试用

Want to deploy IronSuite to a live project for FREE?

What’s included?

深受全球数百万工程师信赖

钢铁支援团队