如何使用IronOCR读取屏幕截图
截图是一种快速简单的方式,可以共享信息并快速捕捉重要信息发送给同事和同行。 然而,由于截图的尺寸和噪音,提取文本往往很困难。 这使得屏幕截图在发布OCR时成为一种效果较差的媒介。
然而,IronOCR 通过提供像 "ReadScreenShot" 这样的专门方法来解决这一问题。 ReadScreenshot 被优化用于读取截图并从中提取信息; 它还接受常见文件格式。
在本指南中,我们将快速演示如何使用IronOCR进行截图文本识别,介绍示例以及结果对象的属性。
如何使用IronOCR读取屏幕截图
- 下载用于读取截屏的C#库
- 导入截图图像进行处理
- 使用
读取屏幕截图
从图像中提取文本的方法 - 使用以检索提取的数据OcrPhotoResult用于进一步处理的属性
- 根据需要保存或导出提取的文本
立即在您的项目中开始使用IronOCR,并享受免费试用。
要使用此功能,您还必须安装IronOcr.Extension.AdvancedScan包装
阅读截图示例
要在IronOCR中读取屏幕截图,我们必须应用以下步骤:我们使用ReadScreenShot
方法,该方法以OcrInput
作为输入参数。 这种方法比库的标准Read
方法更适合截图。
请注意
- 该方法目前仅适用于英语、中文、日语、韩语和拉丁字母。
-
使用高级扫描在 .NET Framework 上需要项目运行在 x64 架构上。
输入
以下是我们的代码示例输入; 我们将通过混合不同的文本字体和大小来展示这种方法的多功能性。
代码
:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;
// Instantiate OCR engine
var ocr = new IronTesseract();
using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");
// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);
// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq
' Instantiate OCR engine
Private ocr = New IronTesseract()
Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")
' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)
' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
输出
如上面的控制台输出所示,它从屏幕截图中提取了所有文本实例。 让我们更深入地探讨OcrPhotoResult
的属性。
从OCR输入中提取的文本。
Confidence:一个“双精度”属性,指示每个字符平均统计准确性的置信度,其中1为最高,0为最低。
TextRegion:一个“TextRegion”数组,包含用于返回屏幕截图上找到文本区域的属性。 默认情况下,所有 TextRegion
是 IronOCR 模型中的派生 Rectangle
类。 它返回矩形的 x 和 y 坐标以及高度和宽度。