如何在 C# 中使用输入图像进行 OCR 处理

How to Read Images

This article was translated from English: Does it need improvement?
Translated
View the article in English

OCR 或光学字符识别是一种用于从图像中识别和提取文本的技术。 这项技术对于印刷文件的数字化尤其有用,因为它可以从扫描页面、照片或其他图像文件中提取文本内容并进行处理。

IronOCR 支持多种图像格式,包括 jpg、png、gif、tiff 和 bmp。还提供了图像过滤器,以增强读取能力。

as-heading:2(快速入门:使用 IronOCR 读取图像文件)<em

只需一行即可使用 IronOCR 从图像中提取文本。 本示例展示了如何通过几个简单的步骤,使用 IronTesseract 上的 Read 方法加载图像并读取其文本,从而实现快速 OCR 设置。

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    var result = new IronTesseract().Read(new OcrImageInput("Potter.png"));
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer

阅读图片示例

请注意 从 2025.6 版本开始: - 现在,加载 TIFF 图像始终能提供更快的性能。 - 读取 TIFF 图像显示的性能提升取决于机器的 GPU。 一些用户可能会体验到两倍的速度,而另一些用户可能会看到与以前版本类似的性能