C#でのTesseract OCR信頼値の使用方法 | IronOCR

IronOCR で C# OCR の読み取り信頼性を高める方法

This article was translated from English: Does it need improvement?
Translated
View the article in English

OCR (光学式文字認識) における読み取り信頼性とは、OCR システムが画像または文書内で認識したテキストの正確さに割り当てる確実性または信頼性のレベルを指します。 これは、OCR システムが認識したテキストが正しいとどの程度確信しているかを示す指標です。

信頼スコアが高い場合、認識が正確であることの確実性が高いことを示し、信頼スコアが低い場合、認識の信頼性が低い可能性があることを示します。

クイックスタート: 1行でOCRの読み取り信頼性を実現

IronTesseract のReadメソッドを画像ファイル パスとともに使用し、返されたOcrResultConfidenceプロパティにアクセスして、IronOCR のテキスト認識の確実性を確認します。 これは、OCR 出力の精度を評価するためのシンプルで信頼性の高い方法です。

Nuget Icon今すぐ NuGet で PDF を作成してみましょう:

  1. NuGet パッケージ マネージャーを使用して IronOCR をインストールします

    PM > Install-Package IronOcr

  2. このコード スニペットをコピーして実行します。

    double confidence = new IronOcr.IronTesseract().Read("input.png").Confidence;
  3. 実際の環境でテストするためにデプロイする

    今すぐ無料トライアルでプロジェクトに IronOCR を使い始めましょう
    arrow pointer


読み取り信頼度の例

入力画像に対して OCR を実行した後、テキストの信頼度レベルがConfidenceプロパティに保存されます。 "using"ステートメントを利用して、使用後にオブジェクトを自動的に破棄します。 画像や PDF などのドキュメントは、それぞれOcrImageInputクラスとOcrPdfInputクラスを使用して追加します。 Readメソッドは、 Confidenceプロパティへのアクセスを許可するOcrResultオブジェクトを返します。

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-confidence.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get confidence level
double confidence = ocrResult.Confidence;
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get confidence level
Private confidence As Double = ocrResult.Confidence
$vbLabelText   $csharpLabel

さまざまなレベルでの信頼度を読み取ります

文書全体の信頼度レベルを取得できるだけでなく、各ページ、段落、行、単語、文字の信頼度レベルにアクセスすることもできます。 さらに、近接して配置された 1 つ以上の段落の集合を表すブロックの信頼度を取得することもできます。

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-confidence-level.cs
// Get page confidence level
double pageConfidence = ocrResult.Pages[0].Confidence;

// Get paragraph confidence level
double paragraphConfidence = ocrResult.Paragraphs[0].Confidence;

// Get line confidence level
double lineConfidence = ocrResult.Lines[0].Confidence;

// Get word confidence level
double wordConfidence = ocrResult.Words[0].Confidence;

// Get character confidence level
double characterConfidence = ocrResult.Characters[0].Confidence;

// Get block confidence level
double blockConfidence = ocrResult.Blocks[0].Confidence;
' Get page confidence level
Dim pageConfidence As Double = ocrResult.Pages(0).Confidence

' Get paragraph confidence level
Dim paragraphConfidence As Double = ocrResult.Paragraphs(0).Confidence

' Get line confidence level
Dim lineConfidence As Double = ocrResult.Lines(0).Confidence

' Get word confidence level
Dim wordConfidence As Double = ocrResult.Words(0).Confidence

' Get character confidence level
Dim characterConfidence As Double = ocrResult.Characters(0).Confidence

' Get block confidence level
Dim blockConfidence As Double = ocrResult.Blocks(0).Confidence
$vbLabelText   $csharpLabel

キャラクターの選択肢を取得する

信頼度の他に、 "選択肢"と呼ばれる興味深いプロパティがもう 1 つあります。 選択肢には、代替単語の選択肢とその統計的関連性のリストが含まれます。 この情報により、ユーザーは他の可能な文字にアクセスできるようになります。

:path=/static-assets/ocr/content-code-examples/how-to/tesseract-result-confidence-get-choices.cs
using IronOcr;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Get choices
Choice[] choices = ocrResult.Characters[0].Choices;
Imports IronOcr
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Get choices
Private choices() As Choice = ocrResult.Characters(0).Choices
$vbLabelText   $csharpLabel

取得した情報

選択肢

よくある質問

OCR での読み取り信頼度とは何ですか?

OCR での読み取り信頼度とは、認識されたテキストの正確性について、OCR システムによって割り当てられた確実性や信頼性のレベルを指します。高いスコアは信頼できるテキスト認識を示し、低いスコアは不正確な可能性を示唆します。

OCR の読み取り信頼度を取得するために C# ライブラリを使用し始める方法はありますか?

まず、IronOCR ライブラリを NuGet からダウンロードします。画像または PDF ドキュメントを処理用に準備し、OcrResult オブジェクトから Confidence プロパティにアクセスするために Read メソッドを使用します。

C# で認識されたテキストの信頼度レベルを取得するにはどうすればよいですか?

認識されたテキストの信頼度レベルを取得するには、IronOCR の Read メソッドを使用して OcrResult オブジェクトを返します。このオブジェクトには、テキストの正確性レベルを示す Confidence プロパティが含まれます。

ドキュメントの異なる部分の信頼度を確認することはできますか?

はい、IronOCR を使用すると、ページ、段落、行、単語、文字を含むドキュメントのさまざまな部分の信頼度を確認できます。これは、OCR プロセスの詳細な正確性評価を提供します。

OCR での文字選択肢とは何ですか?

OCR の文字選択肢は、代替単語の選択肢とその統計的関連性を提供します。この機能は、OCR システムによって認識された他の可能な文字へのアクセスをユーザーに提供し、認識プロセスに関する追加の洞察を提供します。

C# OCR ライブラリで信頼度プロパティはどのように使用されますか?

C# OCR ライブラリの Confidence プロパティは、認識されたテキストの正確性レベルを示します。これは、認識の正確性について OCR システムの確実性を表す数値スコアを提供します。

C# OCR ライブラリでブロックレベルの信頼度にアクセスすることは可能ですか?

はい、IronOCR を使用してブロックレベルの信頼度にアクセスできます。ブロックは密接に配置された段落の集合を表し、その信頼度をチェックして、このレベルでのテキスト認識の正確性を評価できます。

OCR での選択肢プロパティの目的とは何ですか?

Choices プロパティは、代替単語選択肢とその信頼度スコアを提供します。これは、認識されたテキストの評価を強化するために、OCR システムによって提供された他の潜在的なテキストの解釈をユーザーが理解するのに役立ちます。

信頼度レベルを使用して C# で OCR を実装するにはどうすればよいですか?

IronOCR ライブラリを使用して C# で信頼度レベルを使用して OCR を実装します。環境をセットアップし、入力ドキュメントを準備し、Read メソッドを使用して OcrResult オブジェクトを取得し、そこで Confidence プロパティにアクセスします。

C# OCR ライブラリを使用して読み取り信頼度を評価するためにどの手順に従うべきですか?

読み取り信頼度を評価するには、IronOCR ライブラリをダウンロードし、OCR 処理のためにドキュメントを準備し、OcrResult を取得するために Read メソッドを使用し、認識されたテキストの正確性を評価するために Confidence プロパティにアクセスします。

カーティス・チャウ
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。

レビュー済み
Jeff Fritz
Jeffrey T. Fritz
プリンシパルプログラムマネージャー - .NETコミュニティチーム
Jeffはまた、.NETとVisual Studioチームのプリンシパルプログラムマネージャーです。彼は.NET Conf仮想会議シリーズのエグゼクティブプロデューサーであり、週に二回放送される開発者向けライブストリーム『Fritz and Friends』のホストを務め、テクノロジーについて話すことや視聴者と一緒にコードを書くことをしています。Jeffはワークショップ、プレゼンテーション、およびMicrosoft Build、Microsoft Ignite、.NET Conf、Microsoft MVPサミットを含む最大のMicrosoft開発者イベントのコンテンツを企画しています。
準備はできましたか?
Nuget ダウンロード 5,167,857 | Version: 2025.11 リリース