已更新 2025年2月16日
分享:

如何使用 IronOCR 讀取截圖

This article was translated from English: Does it need improvement?
Translated
View the article in English

由 Curtis Chau

截圖是一種快速且簡便的方法,可以共享信息並快速捕捉重要信息,以發送給同事和同行。 然而,由於截圖涉及的尺寸和噪聲,從截圖中提取文字往往被證明是困難的。 這使得截圖在OCR的發布中成為一種效果較差的媒介。

然而,IronOCR 通過提供專門的方法,如「ReadScreenShot」來解決這個問題。 ReadScreenshot 已針對閱讀截圖並從中提取信息進行了優化; 它也接受常見的文件格式。

在本指南中,我們將快速演示如何使用IronOCR進行截圖文字識別,逐步介紹示例及結果對象的屬性。

立即在您的專案中使用IronOCR,並享受免費試用。

第一步:
green arrow pointer

若要使用此功能,您還需要安裝IronOcr.Extension.AdvancedScan套件。

讀取螢幕截圖範例

要在IronOCR中讀取螢幕截圖,我們必須採用以下步驟。我們使用ReadScreenShot方法,它將OcrInput作為輸入參數。 此方法比該庫的標準Read對應方法更適合用於截圖。

[{我(

  • 該方法目前僅適用於英語、中文、日語、韓語和拉丁字母。
  • 使用高級掃描功能在 .NET Framework 上運行需要項目在 x64 架構上運行。

    )}]

輸入

以下是我們的程式範例輸入; 我們將通過混合不同的文字字體和大小來展示此方法的多功能性。

輸入

代碼

:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");

// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);

// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")

' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)

' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
VB   C#

輸出

輸出

如您從上面的控制台輸出中所見,它從截圖中提取了所有的文字實例。 讓我們更深入地探討OcrPhotoResult的屬性。

從OCR輸入中提取的文本。

信心:一個「雙精度浮點」屬性,表示每個字元平均的統計準確性信心水平,其中1表示最高,0表示最低。

TextRegionTextRegion 的数组,包含返回在截图中发现文字区域的属性。 預設情況下,所有 TextRegion 是從 IronOCR 模型中衍生出的 Rectangle 類別。 它返回矩形的x和y坐标以及高度和寬度。