OCR工具

OCR照片(初学者教程)

Kannaopat Udonpant
坎那帕·乌东攀
2023年十二月12日
分享:

介绍

光学字符识别(OCR)技术彻底改变了我们在数字世界中与文本互动的方式。 OCR 图像工具能够将图像转换为文本,从而更容易将打印的笔记数字化。

在本文中,我们将探讨四种在线OCR工具——包括免费和付费的,并介绍IronOCR,展示如何在C#中编程实现OCR。

1.谷歌视觉应用程序接口

Google Vision API 提供了一种由 Google 提供的强大 OCR 解决方案,用于创建图像到文本的转换器。 它支持图像和 PDF 文本提取,并能识别多种语言的文本。

OCR 照片(初学者教程):图 1

优点

  • 高准确性
  • 语言支持
  • 与其他 Google 云服务集成。

幻灯片

  • 需要 API 密钥
  • 超过一定的使用门槛后不完全免费。

第 1 步 获取 API 密钥

  • 访问Google Cloud 控制台
  • 创建新项目或选择现有项目。
  • 启用 Cloud Vision API 并生成 API 密钥。

第 2 步 申请 API

  • 使用 cURL 等工具或您选择的编程语言提出 HTTP POST 请求。
  • 在请求有效载荷中包含图片文件或 URL。
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"

步骤 3 解析结果

  • 从 API 响应中提取识别文本。
{
  "responses": [
    {
      "textAnnotations": [
        {
          "description": "Hello World!",
          "boundingPoly": { /* bounding box coordinates */ }
        }
      ]
    }
  ]
}

2.魔方 OCR

Tesseract 是一个由谷歌开发的开源 OCR 引擎。 它支持 100 多种语言,因其准确性和灵活性而被广泛使用。 它帮助将多种文件格式的图像转换,并且甚至可以将扫描图像转换为可编辑文本。

OCR 照片(初学者教程):图 2

优点

  • 开放源代码
  • 高准确性
  • 社区支持

幻灯片

  • 可能需要集成其他工具
  • 可能需要进行图像预处理,以获得最佳效果。

步骤 1 安装 Tesseract

  • 官方GitHub仓库下载并安装Tesseract OCR。
  • 将 tesseract 文件夹添加到 "路径 "环境变量,以便在终端的任何位置访问。

步骤 2 在图像上运行 OCR

  • 打开终端并导航到包含图片的文件夹。
  • 执行以下命令:
tesseract path/to/your/image.jpg output.txt
tesseract path/to/your/image.jpg output.txt
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'tesseract path/@to/your/image.jpg output.txt
$vbLabelText   $csharpLabel

步骤 3 查看结果

  • 打开生成的文本文件(output.txt)查看提取的文本。

3.ABBYY FineReader 在线

ABBYY FineReader Online 是一项基于云的 OCR 服务,允许用户将扫描的文档和图像转换为可编辑格式。

该在线工具提供免费使用的基于 OCR 的在线文本转换器,可轻松从图像中提取文本。

OCR照片(初学者教程):图3

优点

  • 用户友好型图像 OCR 工具
  • 支持各种输入格式
  • 保留文档格式

幻灯片

  • 有限免费使用
  • 需要互联网连接

步骤 1 访问 ABBYY FineReader 在线版

  • 请访问ABBYY FineReader Online网站。
  • 下载 Windows 或 Mac 版免费试用版。
  • 安装软件并按照给出的步骤操作。

第 2 步 上传图片

  • 点击 "选择文件 "按钮,上传您的图片。

步骤 3 加工图像

  • 等待图像处理。 该工具将自动提取文本。

步骤 4 编辑文本

  • 保存提取的文本或使用编辑器进行必要的修改
  • 以 Word、Excel 和文本格式保存。

4.在线 OCR

Online OCR 是一个基于网络的OCR服务,支持多种语言的在线图像转文本转换。 用户可以直接从设备上传图片或提供 URL。

优点

  • 简单的用户界面
  • 支持各种输入格式
  • 免费使用,但有限制

幻灯片

  • 有限的免费功能
  • 取决于互联网连接

步骤 1 访问在线 OCR

请访问Online OCR网站。

第 2 步 上传图片

单击 "选择文件 "按钮并上传您的图片。

OCR 图片(初学者教程):图 4

第 3 步 选择语言和输出格式

选择图片中文本的语言和输出格式。

OCR Foto(初学者教程):图5

步骤 4 启动 OCR

点击 "转换 "按钮开始 OCR 处理。

步骤 5 下载文本

翻译过程完成后,请从提供的链接下载提取的文本。

OCR 照片(初学者教程):图6

C# 中的 IronOCR 简介;

现在,让我们深入了解 IronOCR,这是一个功能强大的 C# OCR 库,为开发人员提供了无缝实现 OCR 功能的工具。 IronOCR 是 Iron Software 团队为 C# 开发的领先 OCR 库。

IronOCR 是一个出色的光学字符识别(OCR)库,专为 C# 开发人员设计,提供强大的一整套功能,可从图像中准确无误地提取文本。

IronOCR 以其可靠性和高效性著称,在寻求从图像和文档中提取文本的综合解决方案的 C# 开发人员中颇受欢迎。

IronOCR 注重准确性和通用性,已成为从文件管理系统到数据提取应用程序等项目的首选。

IronOCR 采用先进的 OCR 算法,能够准确破译 JPEG、PNG 和 TIFF 等各种图像格式中的文本。 它的多功能性扩展到多语言支持,使其成为满足不同语言需求的应用程序的重要工具。

该库与流行的 .NET Framework 无缝集成,简化了 C# 应用程序中 OCR 功能的实现。

无论您处理的是扫描文档还是图像,IronOCR 的全面功能都能让开发人员毫不费力地将 OCR 功能融入到他们的项目中。

IronOCR 功能详解

  1. 高级OCR算法:IronOCR采用复杂的OCR算法,不仅限于基本字符识别,确保即使在复杂场景中也能保持高精度。

  2. 图像格式支持:开发人员可以利用IronOCR对多种图像格式的支持,例如JPEG、PNG和TIFF,从而在处理多样化视觉内容时提供灵活性。

  3. 多语言支持:鉴于应用程序的全球性质,IronOCR配备了多语言支持,能够精准地提取不同语言的文本。

  4. PDF文本提取:除了图像外,IronOCR还扩展了其从PDF文档中提取文本的功能,提高了其在以数字格式存储文档的场景中的适用性。

  5. 与 .NET 框架集成:IronOCR 无缝集成流行的 .NET 框架,使 C# 开发人员能够轻松地将 OCR 功能集成到他们的项目中,而无需进行复杂的配置。

在 C# 中使用 IronOCR 实现 OCR;

以下是一个在C#中使用IronOCR从图像提取文本的简单示例:

using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
Imports IronOcr
Private imageText As String = (New IronTesseract()).Read("images\image.png").Text
$vbLabelText   $csharpLabel

这个简单的 C# 代码片段演示了如何使用 IronOCR 从图像文件中读取文本。开发人员可以根据自己的具体要求进一步定制 OCR 流程。

有关 IronOCR 高级功能的详细信息,请访问文档页面。

结论

OCR 照片工具在从图像中数字化文本内容方面发挥着重要作用。 虽然各种在线工具提供了便利,但 IronOCR 为开发人员提供了强大而灵活的解决方案,可将 OCR 功能集成到他们的 C# 应用程序中。

在线工具和编程实现库之间的选择取决于各种因素,如准确性要求、定制需求以及开发人员对 OCR 流程的控制程度。

IronOCR确实提供免费试用。 从这里下载软件。

Kannaopat Udonpant
坎那帕·乌东攀
软件工程师
在成为软件工程师之前,Kannapat 从日本北海道大学完成了环境资源博士学位。在攻读学位期间,Kannapat 还成为了生物生产工程系车辆机器人实验室的成员。2022年,他利用自己的 C# 技能加入了 Iron Software 的工程团队,专注于 IronPDF。Kannapat 珍视他的工作,因为他能直接向编写 IronPDF 大部分代码的开发者学习。除了同伴学习,Kannapat 还享受在 Iron Software 工作的社交方面。不写代码或文档时,Kannapat 通常在 PS5 上玩游戏或重看《最后生还者》。
< 前一页
最适合开发人员的免费 OCR 软件
下一步 >
阿拉伯语文本识别工具:提高准确性