C#でスキャンされたドキュメントを読む方法 | IronOCR

How to Read Scanned Documents Using IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

多くのPDFには、検索不可能な画像ベースのテキストが含まれています。 IronOCRはこれを検索可能なコンテンツに変換し、特定の情報を見つけやすくし、特に視覚障害者のために文書のアクセシビリティを向上させます。

テキストや画像を手作業でコピーしたり再作成したりする代わりに、自動抽出によって正確性と効率性を確保します。 これは、PDFの特定の部分を再利用することが一般的な研究、法律文書、コンテンツ作成に特に役立ちます。

企業は、分析やシステム統合のためにPDFから重要なデータを抽出し、ワークフローを合理化することができます。 また、デザイナーやマーケティング担当者は、さまざまなプロジェクトでの強化や再利用のために画像を抽出することができます。

このチュートリアルでは、OcrPdfInputメソッドを探求し、利用可能なオプションとパラメーターを網羅し、IronOCRが様々なアプリケーションのためにPDFのテキストと画像の抽出をどのように簡素化するかを紹介します。

この機能を使用するには、IronOcr.Extensions.AdvancedScanパッケージもインストールする必要があります。

クイックスタート: スキャンしたPDFまたは画像からテキストを抽出する</em

たった一行のコードで、IronOCRのOcrInput.LoadPdfまたはLoadImageを使ってスキャンしたPDFや画像を読み込み、ReadDocumentを使ってテキストを即座に抽出することができます。 OCRの迅速な稼働を望む開発者に最適です。

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    var text = new IronOcr.IronTesseract().ReadDocument(new IronOcr.OcrInput().LoadPdf("scanned.pdf")).Text;
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer
### 入力 [入力](/static-assets/ocr/how-to/read-scan-document/input.webp)。 ### コード ```csharp :path=/static-assets/ocr/content-code-examples/how-to/read-scanned-document-read-scanned-document.cs ``` ### アウトプット [出力](/static-assets/ocr/how-to/read-scan-document/output.webp)。 代わりにPDFファイルでOCRを実行する必要がある場合は、単に`LoadImage`メソッドを`LoadPdf`に置き換えてください。 これによりIronOCRはスキャンしたPDFから同じようにテキストを処理し抽出することができます。

よくある質問

C#を使ってスキャンされたドキュメントをどのように読むことができますか?

IronOCRを使用してC#でスキャンされたドキュメントを読むことができます。まず、NuGetからC#ライブラリをダウンロードし、画像にはLoadImageメソッド、PDFにはLoadPdfメソッドを使用してスキャンされたドキュメントをインポートします。最後に、ReadDocumentメソッドを用いてテキストを抽出します。

PDFの画像ベースのテキストを検索可能コンテンツに変換する目的は?

IronOCRを使用してPDFの画像ベースのテキストを検索可能なコンテンツに変換すると、アクセシビリティが向上し、特定の情報を簡単に見つけられるようになり、視覚障害を持つ方にも役立ちます。

IronOCRで画像やPDFからテキストを抽出できますか?

はい、IronOCRを使用して画像とPDFの両方からテキストを抽出できます。画像にはLoadImageメソッドを、PDFにはLoadPdfメソッドを使用し、その後ReadDocumentメソッドを実行して抽出を行います。

IronOCR の言語サポート機能はどのようなものですか?

IronOCRは、英語、中国語、日本語、韓国語、ラテンアルファベットでのテキスト抽出をサポートしており、マルチリンガルなドキュメント処理に適しています。

IronOCRで高度なスキャン機能を使用するために必要なアーキテクチャは何ですか?

IronOCRの高度なスキャン機能を.NET Frameworkで使用するには、プロジェクトをx64アーキテクチャで実行する必要があります。

IronOCRをビジネスアプリケーションで自動テキスト抽出に利用するにはどうすればよいですか?

IronOCRはビジネスアプリケーションでの自動テキスト抽出に利用できます。スキャンされたドキュメントをインポートし、LoadPdfまたはLoadImageメソッドを使用してテキストを抽出するReadDocumentメソッドを使うことにより、ワークフローを合理化し、企業が重要なデータを分析および統合する効率を向上させます。

IronOCRを使用してスキャンされたPDFからテキストを抽出するにはどのような手順がありますか?

スキャンされたPDFからIronOCRを使用してテキストを抽出するには、ライブラリをダウンロードし、LoadPdfメソッドを使用してPDFをインポートし、その後ReadDocumentメソッドでテキストを抽出します。抽出されたテキストは必要に応じて保存またはエクスポートできます。

IronOCRはデザイナーやマーケターにどのような利益をもたらしますか?

IronOCRはデザイナーやマーケターがPDFから画像やテキストを抽出して、さまざまなプロジェクトでの改善や再利用を可能にし、効率성과創造的な可能性を高めます。

IronOCRの高度な機能を使用するにはどのパッケージをインストールする必要がありますか?

IronOCRの高度な機能にアクセスするためには、NuGetからIronOcr.Extensions.AdvancedScanパッケージをインストールする必要があります。

Curtis Chau
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。

準備はいいですか?
Nuget ダウンロード 5,044,537 | バージョン: 2025.11 ただ今リリースされました