IronOCR ハウツー 写真を読む IronOCR を使って C# で写真を読み取る方法 カーティス・チャウ 更新日:6月 9, 2025 IronOCR をダウンロード NuGet ダウンロード DLL ダウンロード Windows 版 無料トライアル LLM向けのコピー LLM向けのコピー LLM 用の Markdown としてページをコピーする ChatGPTで開く このページについてChatGPTに質問する ジェミニで開く このページについてGeminiに問い合わせる ジェミニで開く このページについてGeminiに問い合わせる 困惑の中で開く このページについてPerplexityに問い合わせる 共有する Facebook で共有 Xでシェア(Twitter) LinkedIn で共有 URLをコピー 記事をメールで送る This article was translated from English: Does it need improvement? Translated View the article in English 大量のドキュメント、特に TIFF ファイルなどのスキャンされた画像を扱う場合、手動でテキストを抽出すると時間がかかり、人為的エラーが発生しやすくなります。 ここで光学文字認識 (OCR) が登場し、画像内のテキストをデジタル データに正確に変換する自動化された方法が提供されます。 OCR テクノロジーは、スキャンされた文書や写真などの画像の複雑さを処理し、検索可能で編集可能なテキストに変換できます。 これにより、ドキュメント処理が高速化されるだけでなく、手作業による転記に比べてより正確なデータ抽出が保証されます。 サイズ、色深度、圧縮などの理由で読み取りが難しい場合がある TIFF などの形式で OCR を使用すると、企業や開発者は膨大な量のデータを迅速にデジタル化して管理できるようになります。 IronOCR のReadPhoto機能などの OCR ソリューションを使用すると、開発者は画像からテキストを抽出したり、キーワードの検索やスキャンしたデータを検索可能な PDF に変換するなどの高度な操作を実行したりできます。 このテクノロジーは、効率的なデータ検索が重要な法的文書、アーカイブ、領収書を扱う業界にとって特に役立ちます。 このチュートリアルでは、 ReadPhoto使用方法と結果オブジェクトの操作方法について、入力と例を簡単に説明します。 また、開発者が IronOCR の標準のReadではなくReadPhotoを使用することを好むシナリオについても説明します。 この機能を使用するには、 IronOCR.Extension.AdvancedScanパッケージもインストールする必要があります。 クイックスタート: ReadPhoto を使用して複雑な画像からテキストを抽出する すぐに始めましょう: 画像フレームがロードされた OcrInput で IronOCR の ReadPhoto メソッドを使用して、すべてのテキストと領域を一度に取得します。 TIFF、GIF、その他同様の写真中心の形式に最適化されており、スムーズな OCR エクスペリエンスを実現します。 今すぐ NuGet で PDF を作成してみましょう: NuGet パッケージ マネージャーを使用して IronOCR をインストールします PM > Install-Package IronOcr このコード スニペットをコピーして実行します。 var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0)); 実際の環境でテストするためにデプロイする 今すぐ無料トライアルでプロジェクトに IronOCR を使い始めましょう 30日間無料トライアル 最小限のワークフロー(5ステップ) 写真を読み取るためのC#ライブラリをダウンロードする 処理のために画像をインポートする 画像の種類に基づいて適切なインポート方法を使用する ReadPhotoメソッドを使用して画像からデータを抽出します OcrPhotoResultプロパティにアクセスして、抽出されたデータを表示および操作します。 写真の読み取り例 IronOCR を使用すると、 tiffやgifなどの高品質の写真形式を読み取るのは比較的簡単です。 まず、新しい変数を作成し、それをOcrInputとして割り当て、 LoadImageFrameを使用して画像を読み込みます。 最後に、 ReadPhotoメソッドを使用して結果を取得します。 ブラケットオープン Tiff では単一の画像内に複数のフレームが含まれるため、 PageNumberパラメータが必要です。 さらに、インデックスは 1 ではなく 0 から始まります。 この方法は現在、英語、中国語、日本語、韓国語、ラテン語アルファベットでのみ機能します。 .NET Framework で詳細スキャンを使用するには、プロジェクトを x64 アーキテクチャで実行する必要があります。 ブラケットを閉じる 入力 ほとんどのブラウザは TIFF 形式をネイティブでサポートしていないため、ここからTIFF 入力をダウンロードできます。 TIFFファイルを表示するためにWEBPに変換しました。 コード :path=/static-assets/ocr/content-code-examples/how-to/read-photo-read-photo.cs using IronOcr; using IronSoftware.Drawing; using System; // Instantiate OCR engine var ocr = new IronTesseract(); using var inputPhoto = new OcrInput(); inputPhoto.LoadImageFrame("ocr.tiff", 0); // Read photo OcrPhotoResult result = ocr.ReadPhoto(inputPhoto); // Index number refer to region order in the page int number = result.TextRegions[0].PageNumber; // Extract the text in the first region string textinregion = result.TextRegions[0].TextInRegion; //Extract the co_ordinates of the first text region Rectangle region = result.TextRegions[0].Region; var output = $"Text in First Region: {textinregion}\n" + $"Text Region:\n" + $"Starting X: {region.X}\n" + $"Starting Y: {region.Y}\n" + $"Region Width: {region.Width}\n" + $"Region Height: {region.Height}\n" + $"Result Confidence: {result.Confidence}\n\n" + $"Full Scnned Photo Text: {result.Text}"; Console.WriteLine(output); Imports Microsoft.VisualBasic Imports IronOcr Imports IronSoftware.Drawing Imports System ' Instantiate OCR engine Private ocr = New IronTesseract() Private inputPhoto = New OcrInput() inputPhoto.LoadImageFrame("ocr.tiff", 0) ' Read photo Dim result As OcrPhotoResult = ocr.ReadPhoto(inputPhoto) ' Index number refer to region order in the page Dim number As Integer = result.TextRegions(0).PageNumber ' Extract the text in the first region Dim textinregion As String = result.TextRegions(0).TextInRegion 'Extract the co_ordinates of the first text region Dim region As Rectangle = result.TextRegions(0).Region Dim output = $"Text in First Region: {textinregion}" & vbLf & $"Text Region:" & vbLf & $"Starting X: {region.X}" & vbLf & $"Starting Y: {region.Y}" & vbLf & $"Region Width: {region.Width}" & vbLf & $"Region Height: {region.Height}" & vbLf & $"Result Confidence: {result.Confidence}" & vbLf & vbLf & $"Full Scnned Photo Text: {result.Text}" Console.WriteLine(output) $vbLabelText $csharpLabel 出力 Text : OCR 入力から抽出されたテキスト。 Confidence : 各文字の平均の統計的精度の信頼性を示す"double"プロパティ。1 が最高、0 が最低です。 TextRegions : 入力内の OCR テキストとその位置を示す" TextRegions "プロパティのリスト。 上記の例では、フレーム番号とテキストを含む四角形を印刷しました。 ReadPhotoとReadの違い ReadPhotoメソッドと標準のReadの主な違いは、結果オブジェクトとそれが受け取るファイル形式です。 LoadImageFrame具体的にはtiffとgifのみを受け入れ、いくつかの理由によりjpegなどの形式はサポートしていません。 TIFF画像とJPEG画像の比較 ファイル形式としての TIFF はロスレスであり、通常は複数のページと複数のフレームを 1 つの形式に圧縮するために使用されます。 通常、高品質の複数画像 (法務文書、医療画像など) の保存に使用されます。 これは標準の JPEG 形式よりもはるかに複雑なため、そこからテキストを完全に抽出するには別の方法が必要です。 さらに、TIFF 画像は異なる圧縮方法を使用するため、IronOCR は特殊な方法を使用してテキストを解読する必要があります。 比較のために、TIFF と JPEG の詳細な内訳を以下に示します。 特徴 TIFF(タグ付き画像ファイル形式) JPG/JPEG (共同写真専門家グループ) 圧縮 ロスレスまたは非圧縮(品質を保持) 非可逆圧縮(ファイルサイズを小さくすると品質が低下します) ファイルサイズ 大きい(高品質とオプションの圧縮なしのため) より小さく、ウェブ使用と高速読み込みに最適化されています 画像の品質 高(プロフェッショナルな使用に最適、すべての詳細を保持) 低め(非可逆圧縮のため、画質が多少犠牲になります) カラー深度 高い色深度をサポート(チャネルあたり最大16ビットまたは32ビット) 24ビットカラー(1670万色) 使用事例 プロフェッショナルな写真撮影、出版、スキャン、アーカイブ ウェブ画像、ソーシャルメディア、日常の写真 透明性 透明度とアルファチャンネルをサポート 透明性をサポートしていません 編集 複数回の編集に適しています(再保存しても品質が低下しません) 編集と保存を繰り返すと品質が低下します 互換性 プロフェッショナルソフトウェアで広くサポートされています すべてのプラットフォームとデバイスで普遍的にサポートされています アニメーション アニメーションをサポートしていません アニメーションをサポートしていません メタデータ 広範なメタデータ(EXIF、レイヤーなど)を保存します EXIFメタデータを保存しますが、制限があります さまざまなシナリオ 開発者は、アプリケーションをさらに最適化し、効率的に実行できるようにするために、運用環境での各ユースケースを考慮する必要があります。 ReadPhoto上記のようなTIFFなどの複雑な画像に適していますが、結果の処理は遅くなります。 一方、 JPEG品質が低くなる可能性がありますが、一般的に操作は高速になります。 ただし、ノイズがあるなどの画像品質では、OCR の信頼度が低くなります。 OcrPhotoResultsまたはインターフェイスIOcrResultを使用する任意のクラスのconfidenceプロパティを使用すると、結果の精度がわかり、開発者は必要に応じてテスト、反復、最適化を行うことができます。 開発者は、効率性と精度の間の微妙なバランスを見つけ、画像が一貫性を保つために一定の基準を満たしていることを確認する必要があります。 よくある質問 C#のReadPhotoメソッドとは何ですか? C#用のIronOCRのReadPhotoメソッドは、TIFFやGIFのような複雑な画像形式からテキストを抽出し、光学式文字認識(OCR)を使用して検索可能なデジタルデータに変換するように設計されています。 標準のRead関数の代わりにReadPhotoを使用する理由は何ですか? ReadPhotoは、TIFFやGIFのような複雑な画像形式を処理するために最適化されており、これらの形式の画像にとって圧縮と品質の特性により特別な処理が必要なため、標準のRead関数と比べてこれらの画像にはより適しています。 C#でOCRを使用して最適なテキスト抽出を保証するにはどうすればよいですか? C#でOCRを使用して最適なテキスト抽出を保証するには、画像の品質と形式を考慮します。TIFFのような高品質で複雑な形式に対してIronOCRのReadPhotoメソッドを使用することで、精度と効率を向上させることができます。 ReadPhotoメソッドはどの画像形式をサポートしていますか? IronOCRのReadPhotoメソッドは、TIFFやGIFのような複雑な画像形式をサポートしており、高品質なテキスト抽出作業に最適です。 OCRを使用してTIFFファイルを変換するメリットは何ですか? IronOCRのReadPhotoメソッドを使用してTIFFファイルをOCRで変換することで、高品質な画像を検索可能で編集可能なデジタルデータに変換でき、ドキュメント管理やアーカイブに役立ちます。 OCR技術はどのようにして文書処理を向上させますか? OCR技術は、画像からテキストをデジタルデータに変換する自動化により、特に大量の文書を管理する際に処理速度と正確性を大幅に向上させます。 OCRでの画像処理方法の選択に影響を与える要因は何ですか? 選択に影響を与える要因には、画像の形式と品質、処理速度、特定の使用ケースの要件が含まれます。IronOCRのReadPhotoは高品質で複雑な画像に最適で、他の方法はより単純な形式に対してより効率的であるかもしれません。 IronOCRのReadPhotoメソッドはカラー画像に使用できますか? はい、IronOCRのReadPhotoメソッドはカラー画像、特にTIFFやGIF形式の画像を処理でき、フルカラーの文書での正確なテキスト抽出を可能にします。 'confidence'プロパティはOCRの結果においてどのような役割を果たしますか? OCRの結果における'confidence'プロパティは、テキスト抽出の精度に関する統計的な指標を提供し、開発者がデジタル化データの信頼性を評価するのに役立ちます。 開発者はReadPhotoのOCR結果をどのようにアプリケーションで使用できますか? 開発者は、IronOCRのReadPhotoからのOCR結果をOcrPhotoResultプロパティにアクセスすることで使用でき、これには抽出されたテキスト、信頼度スコア、テキスト領域が含まれており、さらなるデータ処理とアプリケーション統合を可能にします。 カーティス・チャウ 今すぐエンジニアリングチームとチャット テクニカルライター Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。 準備はできましたか? Nuget ダウンロード 5,167,857 | Version: 2025.11 リリース NuGet 無料版 総ダウンロード数: 5,167,857 ライセンスを見る