OCR工具

Windows 10中的OCR(免费在线工具)

发布 2022年十月30日
分享:

光学字符识别 (光学字符识别) 是将文本图像转换成机器可读格式的**过程。当图像或文件被扫描到计算机中时,就会被保存为图像文件。这使得文本编辑器无法编辑、搜索或计算图像文件中的文字。OCR 允许系统从图像中提取文本,然后将内容存储为可编辑的文本数据。

大多数业务工作流程都涉及使用印刷媒体传递信息。扫描文档和图像可能会带来挑战。OCR 技术通过将文本图像转换为文本数据来解决这一问题,而文本数据可由其他业务软件进行分析。这些数据可用于进行分析、简化操作、自动化流程和提高生产力。

本文将介绍一些可帮助用户高效管理文件的免费 OCR 程序。

Microsoft OneNote:最佳免费 OCR 软件

OneNote 是一款数字笔记应用程序,它提供了一个存放所有笔记、研究、计划和信息的单一位置。OneNote 支持光学字符识别 (光学字符识别)从图片或文件打印输出中提取文本的工具 (PDF 文档或 Word 文件) 并粘贴到笔记中,这样你就可以对文字进行修改。这是一种很好的方法,比如将名片上的信息复制到 OneNote 中。提取文本后,你可以将其粘贴到 OneNote 或其他程序(如 Outlook 或 Word)中的其他地方。你可以从微软商店下载最新版本,它通常已经安装在 Windows 系统中。它是用于文本识别的最佳免费 OCR 软件之一。

Windows 10 中的 OCR,图 1:OneNote OCR

从一张图片中提取文字

1.右键单击图片,然后单击从图片复制文本

2.单击要粘贴复制文本的位置,然后按 Ctrl+V

从多页文件打印输出的图像中提取文本

1.右键单击任何图像文件,然后执行以下操作之一:

- 单击**从打印输出的这一页复制文本**,仅从当前选定的图像复制文本 (页码).

- 单击 **从打印输出的所有页面复制文本** 从所有图像复制文本 (页面).

2.单击要粘贴复制文本的位置,然后按 Ctrl+V

在线 OCR 工具

我们刚刚看到了如何在本地计算机上使用 Microsoft OneNote 通过 OCR 技术从图像文件中提取文本。接下来,让我们来看看网上现有的 OCR 软件。

在线 OCR

在线OCR 是一款设计简洁的专业在线 OCR 服务。由于创建于 2009 年,该网站的外观可能看起来有点过时,但这也有助于让用户保持 OCR 操作的简洁性。

在线 OCR 可以识别扫描的 PDF 文档、照片和数码相机捕捉的图像,并将它们转换为 Word、TXT 和 Excel 等可编辑的文件。可识别的语言有 46 种,包括英语、西班牙语、日语、中文和韩语。

Windows 10 中的 OCR,图 2:OnlineOCR

使用 OnlineOCR 完成 OCR 工作只需三个简单步骤。

步骤 1. 点击 "选择文件 "按钮,上传 PDF 文件或 JPG、BMP、GIF 或 TIFF 格式的扫描文件。您也可以一次性上传多个文件。注意:上传文件的最大大小为 15 MB。

步骤 2. 选择上传文件的语言,并从 Word、Excel 和 TXT 中选择输出格式。

步骤 3. 点击 "转换",开始识别和转换文件。

NewOCR

另一个免费在线 OCR 工具是 NewOCR它可以分析你上传的图像文件或 PDF 文档中的文本,然后将其转换为可在电脑上轻松编辑的文本文档。每个用户都可以享受无限制上传,无需任何注册要求。你上传的所有文件都将从服务器上删除,因此无需担心文件安全问题。

Windows 10 中的 OCR,图 3:NewOCR

首先,点击 "选择文件 "从设备中添加图像或扫描文件,然后点击 "预览"。

接着,在语言框中选择一种或多种识别语言,然后根据需要旋转图像。如果上传的文件包含多栏文本,请勾选 "页面布局分析 "选项卡,将文本分成几栏。最后,点击 "OCR "按钮。

Windows 10 中的 OCR,图 4:NewOCR

识别出的文本将显示在下面的文本框中。您可以下载 TXT、Word 或 PDF 格式的文本。

Windows 10 中的 OCR,图 5:NewOCR

转换

转换 是一项免费的在线 OCR 服务,设计现代而美观。免费的非注册用户最多可处理 10 页文件。这些页面可以是 PDF 或 Word 文件。您也可以使用扫描的 PDF 文件。如果您需要识别更多页面,只需注册即可获得更好的服务。

使用转换在线执行 OCR,只需遵循以下三个步骤。

步骤 1. 点击 "选择文件",从本地设备、Google Drive、Dropbox 或网页中选择并上传文件。您也可以将文件拖到页面上进行添加。

OCR in Windows 10, Figure 6: 转换

转换

第 2 步。选择上传文件中使用的一种或两种语言。然后,将输出格式设置为 Word 文档、Excel 工作簿、PDF 文档、文本文件或任何你需要的格式。您可以在 "页码 "框中输入页码范围,选择识别所有页面或仅识别某些页面。

OCR in Windows 10, Figure 7: Convertio OCR 设置

Convertio OCR 设置

步骤 3. 识别和转换完成后,顶部会出现转换后文档中提取文本的下载链接。只需将其保存到所需位置即可。

Windows 10 中的 OCR,图 8:Convertio 下载文件

从转换器下载文件

Convertio 提供的 OCR 在线服务选项最多,因此是最好的免费在线 OCR 软件。

IronOCR

IronOCR 是一种流行的 OCR 技术库,适用于需要从扫描文档或 PDF 文件中提取文本的 .NET 开发人员。它为成像、数字化和识别提供了高精度、快速处理和稳定的实时性能。该库是一个软件组件,通过自动扫描文档简化了文档的数字化过程。它还支持其他流程,包括文档索引和图像处理。

IronOCR 的独特之处在于它能够自动检测并从不完全扫描的图像和文档中提取数据。IronTesseract "类在任何平台上提供了已知的最先进的 Tesseract 构建,并提高了速度和准确性。

让我们来看看从扫描图像文件中提取文本的代码示例。

var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Input.AddImage("test-files/redacted-employmentapp.png") var Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

输入图像提取文本

OCR in Windows 10, Figure 9: IronOCR, 经过编辑的员工数据

经过编辑的员工数据

提取文本输出

只需几行代码就能输出干净整洁、与原始图像相匹配的文本,实现完美输出,没有任何技术问题。

OCR in Windows 10, Figure 10: IronOCR, 图像输出

图像输出

Licensing

IronOCR 的开发完全免费。它还有一个独特的定价结构,用于 商业许可证.简装版起价为 $749,没有任何隐藏费用。在购买之前,用户可以通过免费试用版在生产中试用 IronOCR。您可以选择一个开发人员、十个开发人员或无限开发人员的许可,从而选择与您的业务规模相匹配的套餐。

Iron Software 提供的全套产品价格为 大折扣.了解更多详细信息 本页

< 前一页
最佳中文OCR(免费和在线工具)
下一步 >
企业 OCR 软件比较

准备开始了吗? 版本: 2024.9 刚刚发布

免费NuGet下载 总下载量: 2,319,721 查看许可证 >