IronOCR チュートリアル 専門文書 How to Read Specialized Documents Curtis Chau 更新日:10月 12, 2025 Download IronOCR NuGet Download テキストの検索と置換 テキストと画像のスタンプ Start Free Trial Copy for LLMs Copy for LLMs Copy page as Markdown for LLMs Open in ChatGPT Ask ChatGPT about this page Open in Gemini Ask Gemini about this page Open in Grok Ask Grok about this page Open in Perplexity Ask Perplexity about this page Share Share on Facebook Share on X (Twitter) Share on LinkedIn Copy URL Email article This article was translated from English: Does it need improvement? Translated View the article in English 標準的なテキスト文書、ナンバープレート、パスポート、写真など、特定の文書を一般的な単数法で正確に読み取ることは非常に困難です。 これらの課題は、各文書タイプの多様なフォーマット、レイアウト、コンテンツに加え、画質、歪み、特殊なコンテンツのバリエーションに起因しています。 また、文脈を理解し、パフォーマンスと効率のバランスを取ることは、文書の種類が増えるにつれて複雑になっていきます。 IronOCRは、標準的なテキスト文書、ナンバープレート、パスポート、写真などの特定の文書に対してOCRを実行し、最適な精度とパフォーマンスを達成するための具体的な方法を紹介します。 クイックスタート: パスポートを1行で読む。 IronOCRのReadPassportエクステンションを使えば、最小限のセットアップでパスポートの詳細を抽出できます。IronOCRとAdvancedScanがインストールされていれば、たった一行のコードで、名前、パスポート番号、国などの構造化された結果データを素早く簡単に得ることができます。 Get started making PDFs with NuGet now: Install IronOCR with NuGet Package Manager PM > Install-Package IronOcr Copy and run this code snippet. var result = new IronTesseract().ReadPassport(new OcrInput().LoadImage("passport.jpg")); Deploy to test on your live environment Start using IronOCR in your project today with a free trial Free 30 day Trial (英語 最小限のワークフロー (5 つのステップ) ナンバープレート、パスポート、写真を読み取る C# ライブラリをダウンロードする。 OCR用に画像とPDF文書を準備する。 ReadLicensePlateメソッドを設定して、ナンバープレートを読み取ります。 パスポートから情報を取得するためにReadPassportメソッドを設定する。 ReadPhotoメソッドおよびReadScreenShotメソッドを使用して、読みにくいテキストを含む画像を読み取ります。 ## パッケージについて `ReadLicensePlate`、`ReadPassport`、`ReadPhoto`、`ReadScreenShot`メソッドはベースとなるIronOCRパッケージの拡張メソッドであり、[IronOcr.Extensions.AdvancedScan](https://www.nuget.org/packages/IronOcr.Extensions.AdvancedScan)パッケージがインストールされている必要があります。 方法は、ブラックリストやホワイトリストなどのOCRエンジン設定に対応しています。中国語、日本語、韓国語、および LatinAlphabet を含む複数の言語が、`ReadPassport` メソッドを除くすべてのメソッドでサポートされています。 各言語には、[IronOcr.Languages](https://www.nuget.org/packages?q=ironocr.languages&includeComputedFrameworks=true&prerel=true&sortby=relevance)という追加の言語パッケージが必要ですのでご注意ください。 .NET Frameworkで高度なスキャンを使用するには、プロジェクトがx64アーキテクチャで実行される必要があります。 プロジェクト設定に移動し、"Prefer 32-bit" オプションのチェックを外してください。 詳しくは、以下のトラブルシューティングガイドをご覧ください:"[Advanced Scan on .NET Framework](/csharp/ocr/troubleshooting/advanced-scan-on-net-framework/)". ## 文書の例を読む `ReadDocument`メソッドは、テキストを多く含むスキャン文書や紙文書の写真に特化した、堅牢な文書読み取りメソッドです。 **PageSegmentationMode**の設定は、異なるレイアウトのテキスト文書を読む際に非常に重要です。 例えば、**SingleBlock**と**SparseText**型は、テーブルレイアウトから多くの情報を取り出すことができます。 というのも、**SingleBlock**はテキストがブロックとして残ることを想定しているのに対し、**SparseText**はテキストが文書全体に散らばっていることを想定しているからです。 ```csharp :path=/static-assets/ocr/content-code-examples/how-to/read-specific-document-document.cs ``` 以下のメソッドはIronOCRパッケージの拡張メソッドであり、[IronOcr.Extensions.AdvancedScan](https://www.nuget.org/packages/IronOcr.Extensions.AdvancedScan)パッケージがインストールされている必要があります。 ## ナンバープレートの例を読む `ReadLicensePlate` メソッドは、写真からナンバープレートを読み取るために最適化されています。 このメソッドから返される特別な情報は、**Licenseplate**プロパティで、提供されたドキュメント内のライセンスプレートの位置の情報が含まれています。 ```csharp :path=/static-assets/ocr/content-code-examples/how-to/read-specific-document-license-plate.cs ``` ## パスポートの例を読む `ReadPassport`メソッドは、機械可読ゾーン(MRZ)コンテンツをスキャンすることによって、パスポート写真からパスポート情報を読み取り、抽出するために最適化されています。 MRZとは、パスポート、IDカード、ビザなどの公式文書で特別に定義されたゾーンのことです。 MRZには通常、所持者の氏名、生年月日、国籍、文書番号などの重要な個人情報が含まれています。 現在、この方法は英語しかサポートしていません。 ```csharp :path=/static-assets/ocr/content-code-examples/how-to/read-specific-document-passport.cs ``` ### 結果 以下のようになります。 次のようにします。 文書にはパスポートの画像のみが含まれるようにしてください。 ヘッダーとフッターのテキストは、メソッドを混乱させ、予期しない出力をもたらす可能性があります。 写真の例を読む よくある質問 C# で OCR を使用してナンバープレートを読むにはどうすればよいですか? IronOCR が提供する ReadLicensePlate メソッドを使用すると、写真からナンバープレートを正確に読み取ることができます。このメソッドは、ナンバープレートテキストとその位置情報を返します。 パスポート写真から情報を抽出する最良の方法は何ですか? IronOCR の ReadPassport メソッドは、パスポート写真の機械可読領域(MRZ)をスキャンして、名前、生年月日、文書番号などの重要な情報を抽出することを目的としています。 IronOCR は読みづらいテキストが含まれる写真からテキストを読み取れますか? はい、IronOCR の ReadPhoto メソッドは、読みづらいテキストのある画像を読むように最適化されており、検出されたテキストとその領域についての詳細データを提供します。 IronOCR を使用してスクリーンショットからテキストを読み取ることは可能ですか? もちろん、IronOCR の ReadScreenShot メソッドは、スクリーンショットのテキスト処理に特化して最適化されており、詳細なテキスト領域情報を提供します。 複雑なレイアウトのドキュメントで OCR の精度を向上させるにはどうすればよいですか? 複雑なドキュメントレイアウトの OCR 精度を高めるためには、IronOCR の PageSegmentationMode を設定します。SingleBlock や SparseText などのオプションは、表形式のレイアウトからの情報抽出に特に有用です。 IronOCR の高度なスキャン機能が .NET Framework プロジェクトで動作しない場合、どうすればよいですか? .NET Framework 上の IronOCR の高度なスキャン機能に関する問題を解決するには、プロジェクト設定で「32 ビット優先」オプションのチェックを外して、プロジェクトを x64 アーキテクチャで実行するように設定します。 IronOCR に言語サポートの制約はありますか? IronOCR は、中国語、日本語、韓国語、ラテンアルファベットを含む複数の言語をサポートしています。ただし、ReadPassport メソッドは現在、英語の文書のみをサポートしています。 IronOCR の高度なスキャン機能を使用するにはどうすればよいですか? IronOCR の高度なスキャン機能を使用するには、IronOcr.Extensions.AdvancedScan パッケージが必要で、これは Windows でのみ利用可能です。 Curtis Chau 今すぐエンジニアリングチームとチャット テクニカルライター Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。 準備はいいですか? Nuget ダウンロード 5,044,537 | バージョン: 2025.11 ただ今リリースされました 試用ライセンスキーがメールで送信されました。 総ダウンロード数: 5,044,537 ライセンスを見る