How to Read Photos Using IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

大量のドキュメント、特にTIFFファイルのようなスキャン画像を扱う場合、手作業でテキストを抽出するのは時間がかかり、人為的なミスが発生しやすくなります。 そこで、画像からテキストをデジタルデータに正確に変換する自動化された方法を提供する光学式文字認識(OCR)の出番です。 OCR技術は、スキャンした文書や写真などの複雑な画像を処理し、検索可能で編集可能なテキストに変換することができます。 これにより、文書処理がスピードアップするだけでなく、手作業によるテープ起こしよりも正確なデータ抽出が可能になります。

TIFFのように、サイズや色の濃さ、圧縮のために読み取りが困難なフォーマットにOCRを使用することで、企業や開発者は膨大な量のデータを迅速にデジタル化し、管理することができます。 IronOCRのReadPhoto機能のようなOCRソリューションにより、開発者は画像からテキストを抽出し、キーワード検索やスキャンしたデータを検索可能なPDFに変換するような高度な操作まで行うことができます。 この技術は、効率的なデータ検索が重要な法的文書、アーカイブ、領収書を扱う業界で特に役立ちます。

このチュートリアルでは、ReadPhotoの使い方と結果オブジェクトの操作方法について、入力と例を簡単に説明します。 また、開発者がIronOCRの標準的なReadの代わりにReadPhotoを使うことを好むかもしれないシナリオについても説明します。

この機能を使用するには、IronOcr.Extension.AdvancedScanパッケージもインストールする必要があります。

クイックスタート: 複雑な画像からテキストを抽出するためにReadPhotoを使用する

IronOCRのReadPhotoメソッドを画像フレームがロードされたOcrInputで使用し、すべてのテキストとリージョンを一度に取り込みます。 TIFF、GIF、および類似の写真を多用するフォーマットに最適化されており、スムーズなOCR体験を提供します。

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0));
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer
### 入力 ほとんどのブラウザはTIFFフォーマットをネイティブにサポートしていないため、TIFF入力[こちら](/static-assets/ocr/how-to/read-photo/input.tiff)をダウンロードできます。 TIFFファイルを表示するために、WEBPに変換しました。 [入力](/static-assets/ocr/how-to/read-photo/input.webp)。 ### コード ```csharp :path=/static-assets/ocr/content-code-examples/how-to/read-photo-read-photo.cs ``` ### アウトプット [出力](/static-assets/ocr/how-to/read-photo/output.webp)。 **`テキスト`**:OCR入力から抽出されたテキスト。 **`自信`**:すべての文字の平均の統計的な精度の信頼度を示す「double」プロパティで、1が最高、0が最低です。 **`テキストリージョン`**:`TextRegions`」プロパティのリストで、OCRテキストとその位置が入力内のどこにあるかを示します。 上の例では、テキストを含む長方形だけでなく、フレーム番号も印刷しています。
## `ReadPhoto`と`Read`の違い `ReadPhoto`メソッドと標準の`Read`メソッドの主な違いは、結果オブジェクトと、それが受け取るファイル形式です。 `LoadImageFrame`は、具体的には`tiff`と`gif`のみを取り込み、いくつかの理由から`jpeg`のようなフォーマットをサポートしません。 ### TIFF画像とJPEG画像の比較

特徴。 TIFF(タグ付き画像ファイル形式)。 JPG/JPEG (ジョイント フォトグラフィック エキスパート グループ)。 圧縮ロスレスまたは非圧縮 (画質を維持)。 ロスレス圧縮(ファイルサイズを小さくするために画質を落とします) ファイルサイズ大きい(高画質とオプションの非圧縮による)ファイルサイズが小さく、ウェブ用に最適化され、読み込みが速い 画像品質高品質 (理想的なプロユース 詳細まで保持) 低画質 (非可逆圧縮のため、若干の画質が犠牲になります。) (*SNRは信号の量に対するノイズの量で単位はdB[デシベル]で表されます。 24 ビットカラー(1670 万色) (*SNRは信号の量に対するノイズの量で単位はdB[デシベル]で表されます。 プロフェッショナル写真、出版、スキャン、アーカイブ ウェブ画像、ソーシャルメディア、日常の写真 透過性透過およびアルファチャネルをサポート。 透過をサポートしません。 編集複数回の編集に適しています (再保存による品質低下はありません)。 編集と保存を繰り返すと品質が落ちる 互換性プロフェッショナル向けソフトウェアで広くサポートすべてのプラットフォームおよびデバイスでユニバーサルにサポート アニメーションアニメーションをサポートしていません。 アニメーションはサポートしていません。 メタデータ広範なメタデータを保存 (EXIF、レイヤーなど)EXIFメタデータを保存しますが、より制限されます。

よくある質問

C#のReadPhotoメソッドとは何ですか?

C#用のIronOCRのReadPhotoメソッドは、TIFFやGIFのような複雑な画像形式からテキストを抽出し、光学式文字認識(OCR)を使用して検索可能なデジタルデータに変換するように設計されています。

標準のRead関数の代わりにReadPhotoを使用する理由は何ですか?

ReadPhotoは、TIFFやGIFのような複雑な画像形式を処理するために最適化されており、これらの形式の画像にとって圧縮と品質の特性により特別な処理が必要なため、標準のRead関数と比べてこれらの画像にはより適しています。

C#でOCRを使用して最適なテキスト抽出を保証するにはどうすればよいですか?

C#でOCRを使用して最適なテキスト抽出を保証するには、画像の品質と形式を考慮します。TIFFのような高品質で複雑な形式に対してIronOCRのReadPhotoメソッドを使用することで、精度と効率を向上させることができます。

ReadPhotoメソッドはどの画像形式をサポートしていますか?

IronOCRのReadPhotoメソッドは、TIFFやGIFのような複雑な画像形式をサポートしており、高品質なテキスト抽出作業に最適です。

OCRを使用してTIFFファイルを変換するメリットは何ですか?

IronOCRのReadPhotoメソッドを使用してTIFFファイルをOCRで変換することで、高品質な画像を検索可能で編集可能なデジタルデータに変換でき、ドキュメント管理やアーカイブに役立ちます。

OCR技術はどのようにして文書処理を向上させますか?

OCR技術は、画像からテキストをデジタルデータに変換する自動化により、特に大量の文書を管理する際に処理速度と正確性を大幅に向上させます。

OCRでの画像処理方法の選択に影響を与える要因は何ですか?

選択に影響を与える要因には、画像の形式と品質、処理速度、特定の使用ケースの要件が含まれます。IronOCRのReadPhotoは高品質で複雑な画像に最適で、他の方法はより単純な形式に対してより効率的であるかもしれません。

IronOCRのReadPhotoメソッドはカラー画像に使用できますか?

はい、IronOCRのReadPhotoメソッドはカラー画像、特にTIFFやGIF形式の画像を処理でき、フルカラーの文書での正確なテキスト抽出を可能にします。

'confidence'プロパティはOCRの結果においてどのような役割を果たしますか?

OCRの結果における'confidence'プロパティは、テキスト抽出の精度に関する統計的な指標を提供し、開発者がデジタル化データの信頼性を評価するのに役立ちます。

開発者はReadPhotoのOCR結果をどのようにアプリケーションで使用できますか?

開発者は、IronOCRのReadPhotoからのOCR結果をOcrPhotoResultプロパティにアクセスすることで使用でき、これには抽出されたテキスト、信頼度スコア、テキスト領域が含まれており、さらなるデータ処理とアプリケーション統合を可能にします。

Curtis Chau
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。

準備はいいですか?
Nuget ダウンロード 5,044,537 | バージョン: 2025.11 ただ今リリースされました