How to set DPI Setting in OCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

DPI(Dots Per Inch)とは、画質の基本的な測定方法で、スキャンした文書やデジタル写真に存在する細部のレベルを決定します。 ドキュメントをスキャンすることは、物理的な記録をデジタル化するための迅速かつ効率的な方法ですが、このプロセスでは、特にデフォルトまたは「クイックスキャン」設定を使用した場合、低解像度のファイルが作成されることがよくあります。 このように詳細な情報がないため、テキストがぼやけたり、ピクセル化されたりして見え、データ抽出に大きな障害となります。

ここで、OCRのパフォーマンスが直接影響を受けます。 OCRエンジンは、文字の正確な形やパターンを分析し、機械が読み取り可能なテキストに変換します。 画像のDPIが低いと、各文字を明確に定義するのに十分なピクセルがないため、細かいディテールが失われ、不正確な結果につながります。

しかし、IronOCRはこれらの一般的な課題を克服するように設計されています。 225DPIという低解像度のスキャンでも高い精度を達成できるよう、細かく調整されています。

クイックスタート: より鮮明な OCR 結果のために TargetDPI を設定する

IronOCRを設定し、低解像度の画像をアップスケールすることで、最小限の労力でテキストを明瞭に認識できるようになります。 開発者はIronOCRのクリーンなAPIを使ってすぐに始めることができます。

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrInput { TargetDPI = 300 }.LoadImage("low-res.png"));
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer
### コード例 この例では、画像の解像度を300 DPIにアップスケールするために、`TargetDPI`を300に設定します。 その後、上記の入力画像を読み込み、抽出されたテストを`Text`で、信頼度を`Confidence`で出力します。 ```csharp :path=/static-assets/ocr/content-code-examples/how-to/dpi-setting.cs ``` ### アウトプット
以下のようになります。
次のようにします。 テキスト出力
出力が示すように、IronOCRは85%の信頼スコアを達成しました。 ソース画像の初期DPIが低く、ノイズが多いにもかかわらず、結果は非常に正確で、アップスケーリング機能の威力を示しています。 IronOCRは、低解像度の画像を自動的にアップスケーリングする機能を内蔵しています。 ### DPI設定の比較 違いを説明するために、`TargetDPI`プロパティを設定せずに同じ低解像度の画像を処理した結果を示します。 正しいDPIを見つけることは、バランスをとることです。 高DPIはより正確ですが、速度が遅くなります; 低DPIは高速ですが、信頼性は低くなります。 不明な点があれば、Iron Tesseractの自動前処理が最適な設定を決定します。 `TargetDPI` プロパティを 0 に設定することで、自動アップスケーリングを無効にすることもできます。 #### アウトプット
以下のようになります。
次のようにします。 Text Output
アップスケーリングなしでは、信頼スコアは79%に低下し、抽出されたテキストの精度は著しく低下します。 この比較では、`TargetDPI` を設定することで、低画質画像の OCR 結果を劇的に改善できることが明確に示されています。 #### PDFのDPI設定 PDFを処理する際、IronOCRはドキュメント全体をターゲットDPIにアップスケールします。 DPIが高いほどOCR結果が良くなることがよくありますが、最適な設定はPDFによって大きく異なります。 どの値を使うべきかわからないとします。 その場合、DPIはデフォルトのままにしておき、IronOCRが自動的に最適な設定を決定するようにするのがベストです。 [`TargetDPI` の最大値は 32,766 です。この上限を超えるDPIを設定すると例外が発生します。 これは、Tesseractの最大サポートサイズである32,767 x 32,767ピクセルを超えてしまうためです。 制限を超えた場合、以下のエラーメッセージが表示されます: TargetDPIが高すぎるため、Tesseractでは画像が大きすぎる({new_width} x {new_height})。 Tesseractの最大画像サイズは32767×32767です。]

よくある質問

OCR のコンテキストで DPI とは何ですか?

DPI は 1 インチあたりのドット数を表し、画像の解像度を測定します。OCR では、適切な DPI を設定することで、特に低解像度の画像において、テキスト認識の精度が向上します。

IronOCR では DPI 設定が OCR の精度にどのように影響しますか?

IronOCR で正しい DPI を設定することにより、特に低解像度画像において明瞭な画像入力を提供し、文字の認識エラーを減少させることでテキスト認識の精度を大幅に向上させることができます。

最適なOCR結果のために推奨されるDPI設定は何ですか?

最適な OCR 結果を得るためには、DPI が最低 300 の画像を使用することをお勧めします。しかし、IronOCR は画像をアップスケールする機能を提供しており、より低い DPI 画像でも効果的に OCR を実行できます。

IronOCR でより良い結果を得るために低解像度の画像をアップスケールできますか?

はい、IronOCR は低品質の画像の解像度を向上させ、OCR の精度を向上させる画像アップスケーリング機能を提供します。

IronOCR は自動 DPI 調整をサポートしていますか?

IronOCR はカスタマイズ可能な DPI 設定を提供しており、入力画像の品質に基づく OCR パフォーマンスの最適化を目的として自動調整を可能にします。

C# を使用して IronOCR で DPI を設定するにはどうすればよいですか?

IronOCR で DPI を設定するには、C# コードで希望する DPI 値を指定します。ドキュメントには、このプロセスを案内するコード例が記載されています。

Curtis Chau
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。

準備はいいですか?
Nuget ダウンロード 5,044,537 | バージョン: 2025.11 ただ今リリースされました