OCR工具

Windows 10中的OCR(免费在线工具)

Kannaopat Udonpant
坎那帕·乌东攀
2022年十月30日
分享:

光学字符识别(OCR)是将文本图像转换为机器可读格式的过程。 将图像或文档扫描到计算机时,会将其保存为图像文件。这使得文本编辑器无法编辑、搜索或计算图像文件中的单词。OCR 允许系统从图像中提取文本,然后将内容存储为可编辑的文本数据。

大多数业务工作流程涉及使用印刷媒体交流信息。 扫描文件和图像可能会带来挑战。 OCR 技术可将文本图像转换为文本数据,然后由其他商业软件进行分析,从而解决这一问题。 这些数据可用于进行分析、简化操作、自动化流程和提高生产率。

本文将介绍一些可帮助用户高效管理文件的免费 OCR 程序。

Microsoft OneNote:最好的免费 OCR 软件

OneNote 是一款数字笔记应用程序,它提供了一个单一的地方来保存您的所有笔记、研究、计划和信息。 OneNote支持光学字符识别(OCR),这是一种工具,可让您从图片或文件打印件(PDF文件或Word文件)中提取文本并将其粘贴到您的笔记中,从而可以对文字进行更改。 这是将名片上的信息复制到 OneNote 中的好方法。 提取文本后,您可以将其粘贴到 OneNote 或其他程序(如 Outlook 或 Word)中的其他地方。 您可以从微软商店下载最新版本,它通常已安装在 Windows 系统中。 它是用于文本识别的最佳免费 OCR 软件之一。

Windows 10 中的 OCR,图 1:OneNote OCR

从单张图片中提取文本

  1. 右键单击图片,然后单击从图片复制文字

  2. 点击您想粘贴复制文本的地方,然后按Ctrl+V

从多页文件打印输出的图像中提取文本

  1. 右键单击任何图像文件,然后执行以下操作之一:

    • 点击从打印输出的这一页复制文本以仅复制当前选定图像(页面)中的文本。

    • 点击从打印件的所有页面复制文本以从所有图像(页面)复制文本。
  2. 点击您想粘贴复制文本的地方,然后按Ctrl+V

在线 OCR 工具

我们刚刚看到了如何使用 OCR 技术在本地计算机上使用 Microsoft OneNote 从图像文件中提取文本。接下来,让我们来看看目前网上可用的 OCR 软件。

在线OCR

[OnlineOCR](https://www.onlineocr.net/" target="_blank" rel="nofollow noopener noreferrer) 是一款专业的在线OCR服务,具有简洁明了的设计。 由于创建于 2009 年,该网站的外观可能看起来有些过时,但这也有助于让用户的 OCR 操作保持相当简单。

OnlineOCR 允许您识别扫描的 PDF 文档、照片和数码相机拍摄的图像,并将其转换为 Word、TXT 和 Excel 等可编辑文件。 可识别的语言有 46 种,包括英语、西班牙语、日语、中文和韩语。

Windows 10 中的 OCR,图 2:OnlineOCR

使用 OnlineOCR 完成 OCR 工作只需三个简单步骤。

步骤 1。 点击“选择文件”按钮上传 PDF 文件或 JPG、BMP、GIF、TIFF 格式的扫描文档。 您还可以一次性上传多个文件。 注意:上传文件的最大大小为 15 MB。

步骤2. 选择您上传文件的语言,并从Word、Excel和TXT中选择一种输出格式。

步骤 3。 点击“转换”开始识别和转换您的文件。

NewOCR

另一个免费的在线OCR工具是[](https://www.newocr.com/" target="_blank" rel="nofollow noopener noreferrer)NewOCR,它可以分析您上传的图像文件或PDF文档中的文本,然后将其转换为可以在您的计算机上轻松编辑的文本文档。 每位用户均可享受无限制上传,无需任何注册要求。 您上传的所有文件都将从服务器上删除,因此无需担心文件安全问题。

Windows 10 中的 OCR,图 3:NewOCR

首先,点击 "Choose File(选择文件)"从设备中添加图像或扫描文件,然后点击 "Preview(预览)"。

接下来,在语言框中选择一种或多种识别语言,然后根据需要旋转图片。 如果您上传的文件包含多栏文本,请勾选 "页面布局分析 "选项卡,将文本分栏。 最后,点击 "OCR "按钮。

Windows 10 中的 OCR,图 4:NewOCR

被识别的文本将显示在下面的文本框中。 您可以下载 TXT、Word 或 PDF 格式的文本。

Windows 10 中的 OCR,图 5:NewOCR

转换

[Convertio](https://convertio.co/ocr/" target="_blank" rel="nofollow noopener noreferrer) 是一个免费的在线OCR服务,具有现代且吸引人的设计。 免费、非注册用户最多可处理 10 页。 可以是 PDF 或 Word 文件。 您也可以使用扫描的 PDF 文件。如果您需要识别更多页面,只需注册即可获得更好的服务。

要使用 Convertio 在线执行 OCR,只需遵循以下三个步骤。

步骤 1. 点击“选择文件”以从您的本地设备、Google Drive、Dropbox 或网页中选择并上传文件。 您还可以将文件拖到页面上进行添加。

Windows 10中的OCR,图6:Convertio

转换

步骤 2 选择上传文件中使用的一种或两种语言。然后,将输出格式设置为 Word 文档、Excel 工作簿、PDF 文档、文本文件或任何您需要的格式。您可以在 "页码 "框中输入页面范围,选择识别所有页面或仅识别某些页面。

Windows 10中的OCR,图7:Convertio OCR设置

Convertio OCR 设置

步骤 3。 当识别和转换完成后,提取文本的已转换文档的下载链接会出现在顶部。只需将其保存到您想要的位置。

Windows 10 中的 OCR,图 8:Convertio 下载文件

从转换器下载文件

Convertio 提供的 OCR 在线服务选项最多,因此是最好的免费在线 OCR 软件。

IronOCR

IronOCR 是一款广受欢迎的OCR技术库,适用于需要从扫描文档或PDF文件中提取文本的.NET开发人员。 它可为成像、数字化和识别提供高精度、快速处理和稳定的实时性能。 该库是一个软件组件,通过自动扫描文档来简化文档的数字化过程。 它还支持其他流程,包括文档索引和图像处理。

IronOCR 的独特之处在于它能够自动检测并从不完全扫描的图像和文档中提取数据。 IronTesseract 类提供了当前任何平台上最先进的 Tesseract 构建,其速度和准确性都得到了提升。

让我们来看看从扫描图像文件中提取文本的代码示例。

var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Input.AddImage("test-files/redacted-employmentapp.png") var Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

输入图像提取文本

Windows 10中的OCR,图9:IronOCR,已编辑的员工数据

经过编辑的员工数据

提取文本输出

只需几行代码就能输出干净整洁、与原图相匹配的内容,译文输出完美,没有任何技术问题。

在 Windows 10 中的 OCR,图 10:IronOCR,图像输出

图像输出

许可

IronOCR 可完全免费用于开发目的。 它还为商业许可证提供了独特的定价结构。 Lite 套餐起价为 $749,无隐藏费用。 用户在购买 IronOCR 之前,可以通过免费试用版在生产中试用。 您可以选择一个开发人员、十个开发人员或 Unlimited License 开发人员的许可,从而选择与您的业务规模相匹配的套餐。

Iron Software 正在以大幅折扣提供其整个产品套件。 了解更多详细信息,请访问此页面

Kannaopat Udonpant
坎那帕·乌东攀
软件工程师
在成为软件工程师之前,Kannapat 从日本北海道大学完成了环境资源博士学位。在攻读学位期间,Kannapat 还成为了生物生产工程系车辆机器人实验室的成员。2022年,他利用自己的 C# 技能加入了 Iron Software 的工程团队,专注于 IronPDF。Kannapat 珍视他的工作,因为他能直接向编写 IronPDF 大部分代码的开发者学习。除了同伴学习,Kannapat 还享受在 Iron Software 工作的社交方面。不写代码或文档时,Kannapat 通常在 PS5 上玩游戏或重看《最后生还者》。
< 前一页
最佳中文OCR(免费和在线工具)
下一步 >
企业 OCR 软件比较