How to Read Screenshots using IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

截圖是一種快速且簡便的方式來分享資訊,並快速捕捉重要資訊,以便傳送給同事和同儕。 然而,從截圖中提取文本經常很困難,因為截圖的尺寸和所涉及的噪聲。 這使得截圖在介紹 OCR 時成為一種效果不太理想的媒介。

然而,IronOCR 通過提供專門的方法,例如 ReadScreenshot 來解決這個問題。 ReadScreenshot 針對讀取截圖和從中提取信息進行了優化; 它還接受常見的文件格式。

要使用此功能,您還需安裝IronOcr.Extension.AdvancedScan套件。

快速開始:從截圖中讀取文本

通過使用 IronOCR 的 ReadScreenshot,只需將您的截圖加載到 OcrInput 中,調用 ReadScreenShot,然後立即通過 OcrPhotoResult 訪問提取的文本、置信度分數和文本區域。 這是將影像轉化為可用文本的最快方法,所需設置極少。

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    OcrPhotoResult result = new IronTesseract().ReadScreenShot(new OcrInput().LoadImage("screenshot.png"));
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer

在本指南中,我們將快速演示如何使用 IronOCR 進行截圖文本識別,並通過示例和結果對象的屬性進行講解。

class="hsg-featured-snippet">

簡化工作流程(5 步)

  1. 下載用於讀取截圖的 C# 庫
  2. 導入要處理的截圖影像
  3. 使用 ReadScreenshot 方法從影像中提取文本
  4. 使用 OcrPhotoResult 屬性檢索提取的資料以進一步處理
  5. 根據需要保存或匯出提取的文本

讀取截圖示例

要在 IronOCR 中讀取截圖,您需要執行以下步驟。 我們利用 ReadScreenshot 方法,它接受 OcrInput 作為輸入參數。 這個方法比庫的標準 Read 方法更適合於截圖。

請注意

  • 該方法目前支持的語言包括英語、中文、日語、韓語和基於拉丁字母的字母表。
  • 在 .NET Framework 上使用高級掃描需要項目在 x64 架構上運行。

輸入

以下是我們的程式碼示例輸入; 我們將通過混合不同的文字字型和大小來展示此方法的多功能性。

輸入

代碼

:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");

// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);

// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")

' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)

' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
$vbLabelText   $csharpLabel

輸出

輸出

從上面的控制台輸出可以看到,它從截圖中提取了所有文字實例。 讓我們深入探討 OcrPhotoResult 的屬性。

  • Text:從 OCR 輸入提取的文本。
  • Confidence:一個雙精度屬性,指示統計準確性信心,範圍為 0 到 1,其中 1 是最高的信心水平。
  • TextRegionTextRegion 對象的陣列,持有返回截圖中文字所在區域的屬性。 默認情況下,所有 TextRegion 都是從 IronOCR 模型衍生而來的 Rectangle 類。 它包括了矩形的 x 和 y 座標,以及矩形的高度和寬度。

常見問題解答

如何使用 C# 從螢幕截圖中提取文字?

您可以使用 IronOCR 的ReadScreenshot方法從螢幕截圖中提取文字。此方法針對螢幕截圖進行了最佳化,並支援多種語言。首先從 NuGet 下載 IronOCR 庫,然後匯入螢幕截圖並使用ReadScreenshot函數檢索文字。

ReadScreenshot 方法相容於哪些文件格式?

IronOCR 中的ReadScreenshot方法旨在接受常見的圖像檔案格式,因此可以靈活地從各種類型的螢幕截圖檔案中提取文字。

為什麼對於螢幕截圖來說,ReadScreenshot 方法更可取?

ReadScreenshot方法專門針對螢幕截圖中通常存在的尺寸和雜訊進行了最佳化,與標準 OCR 方法相比,可提供更準確的文字擷取。

IronOCR 支援哪些語言的 OCR 文字擷取?

IronOCR 支援多種語言的 OCR 文字擷取,包括英文、中文、日文、韓文和拉丁字母,使其適用於各種應用。

IronOCR 中的置信度屬性是如何運作的?

在 IronOCR 中, Confidence屬性是介於 0 到 1 之間的雙精確值,表示擷取文字的準確可能性。數值越接近 1,置信度越高。

IronOCR 中的 TextRegion 物件是什麼?

IronOCR 中的 TextRegion 物件代表在螢幕截圖上偵測到文字的特定區域。這些物件包含座標和尺寸信息,幫助使用者了解提取文字的佈局。

我是否需要額外的軟體包來增強 IronOCR 的功能?

是的,要使用 IronOCR 中的進階掃描功能,您應該從 NuGet 安裝 IronOcr.Extension.AdvancedScan 套件,該套件可以增強庫的效能和功能。

如何在我的 C# 專案中實現 IronOCR 來讀取螢幕截圖?

若要在 C# 專案中使用 IronOCR 讀取螢幕截圖,首先從 NuGet 下載庫,匯入螢幕截圖,然後使用ReadScreenshot方法提取文字。最後,使用OcrPhotoResult屬性處理擷取的資料。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。

準備好開始了嗎?
Nuget 下載 5,044,537 | 版本: 2025.11 剛剛發布