如何在 C# 中使用 Tesseract OCR 置信度值 | IronOCR

如何使用 IronOCR 提升 C# OCR 讀取的信心

This article was translated from English: Does it need improvement?
Translated
View the article in English

OCR(光學字元辨識)的讀取置信度是指 OCR 系統對影像或文件中辨識出的文字的準確性所賦予的確定性或可靠性等級。 它是衡量 OCR 系統對識別文本正確性的信心程度的指標。

置信度分數越高,表示辨識結果的準確度越有把握;而信賴度分數越低,表示辨識結果的可靠性可能較低。

快速入門:一行掌握 OCR 讀取技巧

使用 IronTesseract 的Read方法和圖像檔案路徑,然後存取傳回的OcrResultConfidence屬性,以查看 IronOCR 對其文字辨識的確定性。 這是一種簡單可靠的評估 OCR 輸出準確性的方法。

Nuget Icon立即開始使用 NuGet 建立 PDF 檔案:

  1. 使用 NuGet 套件管理器安裝 IronOCR

    PM > Install-Package IronOcr

  2. 複製並運行這段程式碼。

    double confidence = new IronOcr.IronTesseract().Read("input.png").Confidence;
  3. 部署到您的生產環境進行測試

    立即開始在您的專案中使用 IronOCR,免費試用!
    arrow pointer


取得閱讀信心範例

對輸入影像執行 OCR 後,文字的置信度會儲存在Confidence屬性中。 使用"using"語句可以在使用後自動釋放物件。 分別使用OcrImageInputOcrPdfInput類別添加影像和 PDF 等文件。 Read方法將傳回一個OcrResult對象,允許存取Confidence屬性。

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-confidence.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get confidence level
double confidence = ocrResult.Confidence;
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get confidence level
Private confidence As Double = ocrResult.Confidence
$vbLabelText   $csharpLabel

提升不同層次的閱讀自信

您不僅可以獲得整個文件的置信度,還可以存取每一頁、每一段、每一行、每一個單字和每個字元的置信度。 此外,您還可以獲得區塊的置信度,該區塊表示一個或多個緊密相鄰的段落的集合。

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-confidence-level.cs
// Get page confidence level
double pageConfidence = ocrResult.Pages[0].Confidence;

// Get paragraph confidence level
double paragraphConfidence = ocrResult.Paragraphs[0].Confidence;

// Get line confidence level
double lineConfidence = ocrResult.Lines[0].Confidence;

// Get word confidence level
double wordConfidence = ocrResult.Words[0].Confidence;

// Get character confidence level
double characterConfidence = ocrResult.Characters[0].Confidence;

// Get block confidence level
double blockConfidence = ocrResult.Blocks[0].Confidence;
' Get page confidence level
Dim pageConfidence As Double = ocrResult.Pages(0).Confidence

' Get paragraph confidence level
Dim paragraphConfidence As Double = ocrResult.Paragraphs(0).Confidence

' Get line confidence level
Dim lineConfidence As Double = ocrResult.Lines(0).Confidence

' Get word confidence level
Dim wordConfidence As Double = ocrResult.Words(0).Confidence

' Get character confidence level
Dim characterConfidence As Double = ocrResult.Characters(0).Confidence

' Get block confidence level
Dim blockConfidence As Double = ocrResult.Blocks(0).Confidence
$vbLabelText   $csharpLabel

取得角色選擇

除了置信水準之外,還有另一個有趣的屬性叫做選擇。 選項中包含備選詞語清單及其統計相關性。 此資訊允許使用者存取其他可能的角色。

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-choices.cs
using IronOcr;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get choices
Choice[] choices = ocrResult.Characters[0].Choices;
Imports IronOcr
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get choices
Private choices() As Choice = ocrResult.Characters(0).Choices
$vbLabelText   $csharpLabel

檢索資訊

選擇

常見問題解答

在 OCR 中,閱讀信心意味著什麼?

在 OCR 中,閱讀信心指的是 OCR 系統對其識別的文本的準確性賦予的確定性或可靠性。高分表示可靠的文本識別,而低分則表明可能存在不準確性。

如何開始使用 C# 庫來獲取 OCR 閱讀信心?

首先從 NuGet 下載 IronOCR 庫。準備您的圖像或 PDF 文件進行處理,並使用 Read 方法從 OcrResult 對象中訪問 Confidence 屬性。

如何在 C# 中檢索識別文本的信心等級?

要檢索識別文本的信心等級,使用 IronOCR 的 Read 方法,該方法返回 OcrResult 對象。此對象包括一個 Confidence 屬性,用於指示文本的準確性水平。

我可以檢查文檔不同部分的信心水平嗎?

是的,IronOCR 允許您檢查文檔的各個部分,包括頁面、段落、行、詞和字符的信心水平。這提供了對 OCR 過程的詳細準確性評估。

什麼是字符選擇在 OCR 中的意義何在?

OCR 中的字符選擇提供替代詞選擇及其統計相關性列表。此功能有助於用戶訪問OCR系統識別的其他可能字符,提供對識別過程的附加見解。

如何在 C# OCR 庫中使用信心屬性?

C# OCR 庫中的 Confidence 屬性表明識別文本的準確度。它提供了一個數值分數,代表 OCR 系統對識別準確度的確定性。

在 C# OCR 庫中是否可以訪問塊級信心?

是的,您可以使用 IronOCR 訪問塊級信心水平。塊代表緊密位於一處的段落集合,可以檢查其信心水平以評估該層級的文本識別準確性。

OCR 中的 Choices 屬性的目的是什麼?

Choices 屬性提供替代詞選擇及其信心水平。在 OCR 系統提供的不同可能解釋中幫助用戶理解,增強識別文本的評估。

如何在 C# 中實施具有信心水平的 OCR?

通過使用 IronOCR 庫在 C# 中實施具有信心水平的 OCR。設置您的環境,準備您的輸入文檔,並使用 Read 方法獲取 OcrResult 對象,從中可以訪問 Confidence 屬性。

我應該遵循哪些步驟來評估使用 C# OCR 庫的閱讀信心?

要評估閱讀信心,下載 IronOCR 庫,準備文檔以進行 OCR 處理,使用 Read 方法獲取 OcrResult,並訪問 Confidence 屬性以評估識別文本的準確性。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。

審核人
Jeff Fritz
Jeffrey T. Fritz
首席程序经理 - .NET 社区团队
Jeff 也是 .NET 和 Visual Studio 团队的首席程序经理。他是 .NET Conf 虚拟会议系列的执行制作人,并主持“Fritz 和朋友”这一每周两次的开发者的直播节目,在节目上讨论技术并与观众一起编写代码。Jeff 撰写研讨会、主持演讲,并计划大型 Microsoft 开发者活动(包括 Microsoft Build、Microsoft Ignite、.NET Conf 和 Microsoft MVP Summit)的内容。
準備好開始了嗎?
Nuget 下載 5,167,857 | Version: 2025.11 剛發表