C# を使用して OCR の DPI を設定する方法

This article was translated from English: Does it need improvement?
Translated
View the article in English

DPI (Dots Per Inch) は、スキャンした文書やデジタル写真の詳細レベルを決定する画像品質の基本的な測定単位です。 ドキュメントのスキャンは物理的な記録をデジタル化する高速かつ効率的な方法ですが、特にデフォルト設定や"クイック スキャン"設定を使用する場合、このプロセスによって低解像度のファイルが生成されることがよくあります。 この詳細の欠如により、テキストがぼやけたりピクセル化されたりして表示され、データ抽出に大きな障害が生じます。

ここで、OCR のパフォーマンスが直接影響を受けます。 OCR エンジンは、文字の正確な形状とパターンを分析して、機械が読み取り可能なテキストに変換することによって機能します。 画像の DPI が低い場合、各文字を明確に定義するのに十分なピクセルがないため、細かい詳細が失われ、結果が不正確になります。

ただし、IronOCR はこれらの一般的な課題を克服できるように設計されています。 225 DPI という低い解像度のスキャンでも高精度を実現できるように細かく調整されています。

クイックスタート: より鮮明な OCR 結果を得るための TargetDPI の設定

たった 1 行で、IronOCR を設定して低解像度の画像を拡大し、最小限の労力でテキストの明瞭さと認識を向上させることができます。 開発者は IronOCR のクリーンな API を使用してすぐに作業を開始できます。

Nuget Icon今すぐ NuGet で PDF を作成してみましょう:

  1. NuGet パッケージ マネージャーを使用して IronOCR をインストールします

    PM > Install-Package IronOcr

  2. このコード スニペットをコピーして実行します。

    var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrInput { TargetDPI = 300 }.LoadImage("low-res.png"));
  3. 実際の環境でテストするためにデプロイする

    今すぐ無料トライアルでプロジェクトに IronOCR を使い始めましょう
    arrow pointer

DPI設定例

この例では、約 100 DPI の低解像度のサンプル イメージを使用し、人工的なノイズを追加して、 TargetDPI機能の有効性を示します。

画像内の実際のテキストは、"テスト、テスト、テスト、ぼやけたテキスト、例、例、例"です。

ぼやけたテキスト画像

コード例

この例では、 TargetDPI 300 に設定して、画像の解像度を 300 DPI にアップスケールします。 その後、上から入力画像を読み込み、抽出したテストをTextで、信頼度レベルをConfidenceで出力します。

:path=/static-assets/ocr/content-code-examples/how-to/dpi-setting.cs
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

using var ocrInput = new OcrInput();
// Set the target DPI to 300 for better OCR accuracy
ocrInput.TargetDPI = 300;

ocrInput.LoadImage(@"images\image.png");

// Perform OCR on the image with the specified DPI
var ocrResult = ocrTesseract.Read(ocrInput);
// Display the text extracted from the image
Console.WriteLine(ocrResult.Text);
// Display the confidence level of the OCR result
Console.WriteLine(ocrResult.Confidence);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

出力

テキスト出力

出力が示すように、IronOCR は 85% の信頼スコアを達成しています。 ソース イメージのノイズが多く、初期 DPI が低いにもかかわらず、結果は非常に正確で、アップスケーリング機能の威力を実証しています。

IronOCR には、低解像度の画像を自動的に拡大して強化できる機能が組み込まれており、すべて単一のライブラリ内で実行されます。

DPI設定の比較

違いを説明するために、 TargetDPIプロパティを設定せずに同じ低解像度の画像を処理した結果を次に示します。

適切な DPI を見つけるにはバランスが重要です。 高 DPI はより正確ですが、速度は遅くなります。 低 DPI は高速ですが、信頼性は低くなります。 疑わしい場合は、Iron Tesseractの自動前処理に最適な設定を決定させてください。 TargetDPIプロパティを 0 に設定して、自動アップスケーリングを無効にすることもできます。

出力

テキスト出力

アップスケーリングを行わないと、信頼スコアは 79% に低下し、抽出されたテキストの精度は大幅に低下します。 この比較では、 TargetDPIを設定すると、低品質の画像の OCR 結果が劇的に改善されることが明確に示されています。

PDFのDPI設定

PDF を処理する場合、IronOCR はドキュメント内に含まれる画像だけでなく、ドキュメント全体をターゲット DPI に拡大します。

DPI を高くすると OCR の結果が良くなることがよくありますが、最適な設定は PDF によって大きく異なる場合があります。 どの値を使用すればよいかわからないとします。 その場合は、DPI をデフォルト設定のままにして、IronOCR がドキュメントに最適な構成を自動的に決定できるようにすることが最善です。

警告 TargetDPIの最大値は32,766です。この制限を超えるDPIを設定すると例外が発生します。 これは、結果の画像寸法が Tesseract の最大サポートサイズである 32,767 x 32,767 ピクセルを超えるために発生します。 制限を超えると、次のエラー メッセージが表示されます。
"TargetDPI が高すぎるため、Tesseract では画像が大きすぎます ({new_width} x {new_height})。" Tesseract の最大画像サイズは 32767 x 32767')}] です

よくある質問

OCR のコンテキストで DPI とは何ですか?

DPI は 1 インチあたりのドット数を表し、画像の解像度を測定します。OCR では、適切な DPI を設定することで、特に低解像度の画像において、テキスト認識の精度が向上します。

IronOCR では DPI 設定が OCR の精度にどのように影響しますか?

IronOCR で正しい DPI を設定することにより、特に低解像度画像において明瞭な画像入力を提供し、文字の認識エラーを減少させることでテキスト認識の精度を大幅に向上させることができます。

最適なOCR結果のために推奨されるDPI設定は何ですか?

最適な OCR 結果を得るためには、DPI が最低 300 の画像を使用することをお勧めします。しかし、IronOCR は画像をアップスケールする機能を提供しており、より低い DPI 画像でも効果的に OCR を実行できます。

IronOCR でより良い結果を得るために低解像度の画像をアップスケールできますか?

はい、IronOCR は低品質の画像の解像度を向上させ、OCR の精度を向上させる画像アップスケーリング機能を提供します。

IronOCR は自動 DPI 調整をサポートしていますか?

IronOCR はカスタマイズ可能な DPI 設定を提供しており、入力画像の品質に基づく OCR パフォーマンスの最適化を目的として自動調整を可能にします。

C# を使用して IronOCR で DPI を設定するにはどうすればよいですか?

IronOCR で DPI を設定するには、C# コードで希望する DPI 値を指定します。ドキュメントには、このプロセスを案内するコード例が記載されています。

カーティス・チャウ
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。

準備はできましたか?
Nuget ダウンロード 5,167,857 | Version: 2025.11 リリース