如何在 C# 中使用 IronOCR 讀取螢幕截圖

This article was translated from English: Does it need improvement?
Translated
View the article in English

螢幕截圖是一種快速簡便的資訊共享方式,可以快速捕獲重要資訊並發送給同事和同行。 然而,由於螢幕截圖的尺寸和雜訊等因素,從螢幕截圖中提取文字往往很困難。 這使得螢幕截圖在發布 OCR 時成為一種不太有效的媒介。

然而,IronOCR 透過提供ReadScreenshot等專門方法來解決這個問題。 ReadScreenshot專為讀取螢幕截圖和從中提取資訊而最佳化; 它還支援常見的文件格式。

若要使用此功能,您還必須安裝IronOcr.Extension.AdvancedScan軟體套件。

快速入門:從螢幕截圖中讀取文字

使用 IronOCR 的ReadScreenshot ,只需幾秒鐘即可開始使用——只需將螢幕截圖載入到OcrInput中,呼叫ReadScreenShot ,即可透過OcrPhotoResult立即存取提取的文字、置信度分數和文字區域。 這是將圖像轉換為可用文字的最快方法,而且設定極少。

Nuget Icon立即開始使用 NuGet 建立 PDF 檔案:

  1. 使用 NuGet 套件管理器安裝 IronOCR

    PM > Install-Package IronOcr

  2. 複製並運行這段程式碼。

    OcrPhotoResult result = new IronTesseract().ReadScreenShot(new OcrInput().LoadImage("screenshot.png"));
  3. 部署到您的生產環境進行測試

    立即開始在您的專案中使用 IronOCR,免費試用!
    arrow pointer

在本指南中,我們將快速示範如何使用 IronOCR 進行螢幕截圖文字識別,並透過範例和結果物件的屬性進行講解。

閱讀螢幕截圖範例

要在 IronOCR 中讀取螢幕截圖,我們需要執行以下步驟。 我們使用ReadScreenshot方法,該方法接受OcrInput作為輸入參數。 與庫的標準Read方法相比,此方法更適合螢幕截圖。

[{i:(

  • 該方法目前適用於英語、中文、日語、韓語以及拉丁字母等語言。
  • 在 .NET Framework 上使用進階掃描功能需要專案在 x64 架構上運作。 @@--括號關閉--@@

輸入

以下是我們為程式碼範例提供的輸入; 我們將透過混合使用不同的字體和字號來展示這種方法的通用性。

Input

程式碼

:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");

// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);

// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")

' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)

' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
$vbLabelText   $csharpLabel

輸出

Output

從上面的控制台輸出可以看出,它提取了螢幕截圖中的所有文字實例。 讓我們深入了解OcrPhotoResult的屬性。

  • Text :從 OCR 輸入中提取的文字。
  • Confidence :一個雙重屬性,表示統計準確度的置信度,範圍從 0 到 1,其中 1 為最高置信度。
  • TextRegionTextRegion物件數組,其中包含傳回螢幕截圖中文字所在區域的屬性。 預設情況下,所有TextRegion都是 IronOCR 模型中衍生的Rectangle類別。 它包括矩形的 x 和 y 座標,以及矩形的高度和寬度。

常見問題解答

如何使用 C# 從螢幕截圖中擷取文字?

您可以使用 IronOCR 的 ReadScreenshot 方法從螢幕截圖中擷取文字。此方法已針對螢幕快照進行最佳化,並支援多種語言。首先從 NuGet 下載 IronOCR 函式庫,然後匯入您的螢幕截圖,並使用 ReadScreenshot 函式擷取文字。

哪些檔案格式與 ReadScreenshot 方法相容?

IronOCR 中的 ReadScreenshot 方法可接受常見的圖像檔案格式,使其成為從各種類型的螢幕截圖檔案中提取文字的通用方法。

為什麼 ReadScreenshot 方法較適合螢幕截圖?

ReadScreenshot 方法針對螢幕截圖中通常存在的尺寸和雜訊進行了特別優化,與標準 OCR 方法相比,可提供更精確的文字擷取。

IronOCR 支援哪些語言的 OCR 文字擷取?

IronOCR 支援多種語言的 OCR 文字擷取,包括英文、中文、日文、韓文和拉丁字母,因此適用於多樣化的應用程式。

IronOCR 中的置信度屬性如何運作?

在 IronOCR 中,Confidence 屬性是一個範圍從 0 到 1 的雙值,表示擷取文字準確性的可能性。值越接近 1 表示置信度越高。

什麼是 IronOCR 中的 TextRegion 物件?

IronOCR 中的 TextRegion 物件代表截圖上偵測到文字的特定區域。這些物件包含座標和尺寸,可協助使用者瞭解擷取文字的佈局。

我需要額外的套件來增強 IronOCR 的功能嗎?

是的,要使用 IronOCR 中的進階掃描功能,您應該從 NuGet 安裝 IronOcr.Extension.AdvancedScan 套件,它可以增強函式庫的效能和功能。

如何在 C# 專案中實作 IronOCR 以閱讀螢幕截圖?

若要在您的 C# 專案中實作 IronOCR 來讀取螢幕截圖,請先從 NuGet 下載函式庫,匯入您的螢幕截圖影像,然後再使用 ReadScreenshot 方法來擷取文字。最後,使用 OcrPhotoResult 屬性處理擷取的資料。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。

準備好開始了嗎?
Nuget 下載 5,167,857 | Version: 2025.11 剛發表