C#で写真を読む方法 with IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCRのReadPhotoメソッドは、TIFFやGIFのような複雑な写真フォーマットからテキストを抽出し、テキスト領域と信頼度スコアを持つ構造化された結果を提供します。

大量のドキュメント、特にTIFFファイルのようなスキャン画像を扱う場合、手作業でテキストを抽出するのは時間がかかり、エラーが発生しやすくなります。 光学式文字認識(OCR)は、このプロセスを自動化し、テキストを画像からデジタルデータに変換します。 OCRテクノロジーは、スキャンした文書や写真のような複雑な画像を処理し、検索可能で編集可能なテキストに変換します。 これにより、文書処理がスピードアップし、正確なデータ抽出が可能になります。

. 。 [TIFFやGIF](https://ironsoftware.com/csharp/ocr/how-to/input-tiff-gif/)のようなフォーマットでOCRを使用すると、サイズや色深度、圧縮の問題にもかかわらず、膨大な量のデータをすばやくデジタル化できます。 IronOCRの`ReadPhoto`機能により、開発者は画像からテキストを抽出し、キーワード検索やスキャンデータを検索可能なPDFに変換するような高度な操作を行うことができます。 この技術は、効率的なデータ検索が重要な法的文書、アーカイブ、領収書を扱う業界に有益です。 このチュートリアルでは、`ReadPhoto`の使用と`results`オブジェクトの操作について説明します。 IronOCRの標準的な`Read`の代わりに`ReadPhoto`を使う場合について説明します。 一般的な画像処理については、[さまざまな画像フォーマットを読む](https://ironsoftware.com/csharp/ocr/how-to/input-images/)を参照してください。 この機能を使用するには、[IronOcr.Extension.AdvancedScan](https://www.nuget.org/packages/IronOcr.Extensions.AdvancedScan)パッケージをインストールしてください。 *as-heading:2(クイックスタート: ReadPhoto を使用して複雑な画像からテキストを抽出する)* すぐに始められます: IronOCRの`ReadPhoto`メソッドを画像フレームを読み込んだ`OcrInput`上で使用し、すべてのテキストと領域を抽出します。 TIFF、GIF、および類似の写真フォーマットに最適化されています。 ```cs :title=Quickly Extract Text from Photos with ReadPhoto var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0)); ``` ## ReadPhotoを使用してTIFF画像からテキストを抽出するには? TIFFやGIFのような高品質な写真フォーマットの読み込みはIronOCRを使えば簡単です。 まず、`OcrInput`変数を作成し、`LoadImageFrame`を使って画像をロードします。 次に、`ReadPhoto`メソッドを使用して結果を取得します。 [multi-page TIFF OCR tutorial](https://ironsoftware.com/csharp/ocr/examples/csharp-tesseract-multipage-tiff/) では、さらに複数ページのドキュメント例を提供しています。 ブラケットオープン - TIFFには複数のフレームが含まれています; `PageNumber`パラメータは、ゼロベースのインデックスでは必須です。 - 現在、英語、中国語、日本語、韓国語、ラテンアルファベットに対応しています。 - .NET Frameworkで高度なスキャンを使用するには、x64アーキテクチャが必要です。 ブラケットを閉じる ### どのような入力形式を使用すればよいですか? ブラウザはネイティブでTIFF形式をサポートしていないため、TIFF入力[こちら](/static-assets/ocr/how-to/read-photo/input.tiff)をダウンロードしてください。 以下の表示バージョンはWEBPに変換されています。 ![入力](/static-assets/ocr/how-to/read-photo/input.webp) ### どのように ReadPhoto メソッドを実装しますか? この実装では、TIFF画像からテキストと領域情報を抽出することを示します。 その他の例については、[フォトリーディングコード例](https://ironsoftware.com/csharp/ocr/examples/read-photo/)をご覧ください。 ```csharp :path=/static-assets/ocr/content-code-examples/how-to/read-photo-read-photo.cs ``` ### OcrPhotoResultはどのようなプロパティを提供しますか? [Debug output showing OCR text extraction with phone number, coordinates, and confidence score from processed image](/static-assets/ocr/how-to/read-photo/output.webp). `OcrPhotoResult`クラスは、抽出されたテキストを分析するための主要なプロパティを提供します。 OCR結果の操作に関する詳細情報は、[データ出力と結果の操作](https://ironsoftware.com/csharp/ocr/how-to/read-results/)のガイドを参照してください。 **`Text`** : OCR 入力から抽出されたテキスト。 **`信頼度`**:統計的な正確さの信頼度(0~1スケール、1が最高)。 [結果の信頼性スコア](https://ironsoftware.com/csharp/ocr/how-to/tesseract-result-confidence/)については、こちらをご覧ください。 **`TextRegions`**:位置データを持つテキスト領域のリスト。 [ターゲット抽出のための OCR 領域の定義](https://ironsoftware.com/csharp/ocr/how-to/ocr-region-of-an-image/)に似ています。
## どのような場合にReadの代わりにReadPhotoを使用すべきですか? . 特徴 TIFF(タグ付き画像ファイル形式) JPG/JPEG (共同写真専門家グループ) 圧縮 ロスレスまたは非圧縮(品質を保持) 非可逆圧縮(ファイルサイズを小さくすると品質が低下します) ファイルサイズ 大きい(高品質とオプションの圧縮なしのため) より小さく、ウェブ使用と高速読み込みに最適化されています 画像の品質 高(プロフェッショナルな使用に最適、すべての詳細を保持) 低め(非可逆圧縮のため、画質が多少犠牲になります) カラー深度 高い色深度をサポート(チャネルあたり最大16ビットまたは32ビット) 24ビットカラー(1670万色) 使用事例 プロフェッショナルな写真撮影、出版、スキャン、アーカイブ ウェブ画像、ソーシャルメディア、日常の写真 透明性 透明度とアルファチャンネルをサポート 透明性をサポートしていません 編集 複数回の編集に適しています(再保存しても品質が低下しません) 編集と保存を繰り返すと品質が低下します 互換性 プロフェッショナルソフトウェアで広くサポートされています すべてのプラットフォームとデバイスで普遍的にサポートされています アニメーション アニメーションをサポートしていません アニメーションをサポートしていません メタデータ 広範なメタデータ(EXIF、レイヤーなど)を保存します EXIFメタデータを保存しますが、制限があります ### 自分のアプリケーション用にReadPhotoとReadのどちらを選べばよいですか? アプリケーションのパフォーマンスを最適化するために、それぞれの生産ユースケースを考慮してください。 `ReadPhoto`は複雑なTIFF画像に適していますが、処理が遅くなります。 JPEGは処理が高速ですが、品質が低いため、OCRの信頼率が低くなる可能性があります。 必要に応じて、[画質補正フィルター](https://ironsoftware.com/csharp/ocr/how-to/image-quality-correction/)を使用して、結果を改善します。 `OcrPhotoResults`または任意の`IOcrResult`インターフェイス・クラスの`confidence`プロパティは、結果の精度を示し、開発者がテストして最適化できるようにします。最高の精度を必要とする場合、高品質の TIFF 画像を使用した `ReadPhoto` は、特に精度が重要なアーカイブや法的文書処理で最高の結果を提供します。 画像が一定の品質基準を満たすようにすることで、効率と正確さのバランスを見つけます。 ドキュメントの種類が混在している場合は、ハイブリッドなアプローチを実施します。高い精度が要求される重要なドキュメントには`ReadPhoto`を使用し、スピードを優先する日常的なタスクには標準の`Read`を使用します。

よくある質問

ReadPhotoメソッドはどの画像形式をサポートしていますか?

IronOCRのReadPhotoメソッドは、TIFFやGIFのような複雑な写真フォーマットに最適化されています。高品質のスキャン文書や写真からテキストを抽出するために特別に設計されており、テキスト領域と信頼度スコアで構造化された結果を提供します。

TIFF画像からテキストを抽出する方法を教えてください。

IronOCRを使ってTIFF画像からテキストを抽出するには、OcrInput変数を作成し、LoadImageFrameを使って画像をロードし、ReadPhotoメソッドを適用します。プロセスは簡単です: var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0));

ReadPhoto機能を使用するには、どのような追加パッケージが必要ですか?

IronOCRでReadPhoto関数を使用するには、NuGetからIronOcr.Extension.AdvancedScanパッケージをインストールする必要があります。この拡張機能はReadPhotoメソッドに必要な高度なスキャン機能を提供します。

標準のReadメソッドではなく、ReadPhotoを使用するのはどのような場合ですか?

TIFFやGIFのような複雑な写真フォーマットを扱う場合、特に正確なOCR処理を必要とする高品質のスキャン文書には、IronOCRのReadPhotoメソッドを使用してください。標準のReadメソッドは一般的な画像処理に適しています。

ReadPhotoはどのような結果をもたらしますか?

IronOCRのReadPhotoメソッドは、抽出されたテキスト領域と信頼度スコアを含む構造化されたOCR結果を提供します。OcrPhotoResultプロパティを通してこれらにアクセスし、抽出されたデータを見たり操作したりすることができます。

ReadPhotoは複数ページの文書を処理できますか?

はい、IronOCRのReadPhotoメソッドは複数ページのドキュメント、特に複数のフレームを含むことが多いTIFFファイルを処理できます。LoadImageFrameメソッドでは、複数ページのドキュメントで処理するフレームを指定できます。

写真にOCR技術を使用すると、どのような業界でメリットがありますか?

IronOCRは、法的文書、アーカイブ、領収書、効率的なデータ検索が重要な大量のスキャン文書を扱うビジネスに役立ちます。ReadPhotoメソッドは、これらの複雑な画像フォーマットからのテキスト抽出を自動化します。

カーティス・チャウ
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。

準備はできましたか?
Nuget ダウンロード 5,246,844 | バージョン: 2025.12 リリース