C#でスキャンされたドキュメントを読む方法 | IronOCR

IronOCR を使用して C# でスキャンしたドキュメントを読み取る

This article was translated from English: Does it need improvement?
Translated
View the article in English

多くの PDF には、検索できない画像ベースのテキストが含まれています。 IronOCR はこれを検索可能なコンテンツに変換できるため、特定の情報を見つけやすくなり、特に視覚障害のある人にとってドキュメントのアクセシビリティが向上します。

テキストや画像を手動でコピーまたは再作成する代わりに、自動抽出によって正確性と効率性が確保されます。 これは、PDF の特定の部分を再利用することが一般的な研究、法的文書、コンテンツ作成に特に役立ちます。

企業は分析やシステム統合のために PDF から重要なデータを抽出し、ワークフローを合理化できます。 デザイナーやマーケティング担当者は、さまざまなプロジェクトで強化および再利用するために画像を抽出することもできます。

このチュートリアルでは、 OcrPdfInputメソッドについて説明し、使用可能なオプションとパラメーターを説明して、IronOCR がさまざまなアプリケーションの PDF テキストと画像の抽出を簡素化する方法を紹介します。

この機能を使用するには、 IronOcr.Extensions.AdvancedScanパッケージもインストールする必要があります。

クイックスタート: スキャンしたPDFまたは画像からテキストを抽出する

わずか数秒で開始できます。1 行のコードで、IronOCR のOcrInput.LoadPdfまたはLoadImageを使用してスキャンした PDF または画像を読み込み、 ReadDocumentを介して即座にテキストを抽出します。 OCR をすぐに起動して実行したい開発者に最適です。

Nuget Icon今すぐ NuGet で PDF を作成してみましょう:

  1. NuGet パッケージ マネージャーを使用して IronOCR をインストールします

    PM > Install-Package IronOcr

  2. このコード スニペットをコピーして実行します。

    var text = new IronOcr.IronTesseract().ReadDocument(new IronOcr.OcrInput().LoadPdf("scanned.pdf")).Text;
  3. 実際の環境でテストするためにデプロイする

    今すぐ無料トライアルでプロジェクトに IronOCR を使い始めましょう
    arrow pointer

スキャンした文書の読み取り例

ドキュメント内のすべての画像からテキストを抽出するには、 ReadDocumentメソッドを使用します。 このメソッドはドキュメントを処理し、抽出されたテキストを含むオブジェクトを返します。このオブジェクトには、Text プロパティを通じてアクセスできます。 以下の例は、サンプル TIFFファイルでこの方法を使用する方法を示しています。

ブラケットオープン

  • この方法は現在、英語、中国語、日本語、韓国語、ラテン語アルファベットでのみ機能します。
  • .NET Framework で詳細スキャンを使用するには、プロジェクトを x64 アーキテクチャで実行する必要があります。 ブラケットを閉じる

入力

input

コード

:path=/static-assets/ocr/content-code-examples/how-to/read-scanned-document-read-scanned-document.cs
using IronOcr;
using System;

// Instantiate OCR engine
var ocr = new IronTesseract();

// Configure OCR engine
using var input = new OcrInput();
input.LoadImage("potter.tiff");

// Perform OCR
OcrResult result = ocr.ReadDocument(input);

Console.WriteLine(result.Text);
Imports IronOcr
Imports System

' Instantiate OCR engine
Private ocr = New IronTesseract()

' Configure OCR engine
Private input = New OcrInput()
input.LoadImage("potter.tiff")

' Perform OCR
Dim result As OcrResult = ocr.ReadDocument(input)

Console.WriteLine(result.Text)
$vbLabelText   $csharpLabel

出力

output

代わりに PDF ファイルで OCR を実行する必要がある場合は、 LoadImageメソッドをLoadPdfに置き換えるだけです。 これにより、IronOCR はスキャンされた PDF から同じ方法でテキストを処理および抽出できるようになります。

よくある質問

C#を使ってスキャンされたドキュメントをどのように読むことができますか?

IronOCRを使用してC#でスキャンされたドキュメントを読むことができます。まず、NuGetからC#ライブラリをダウンロードし、画像にはLoadImageメソッド、PDFにはLoadPdfメソッドを使用してスキャンされたドキュメントをインポートします。最後に、ReadDocumentメソッドを用いてテキストを抽出します。

PDFの画像ベースのテキストを検索可能コンテンツに変換する目的は?

IronOCRを使用してPDFの画像ベースのテキストを検索可能なコンテンツに変換すると、アクセシビリティが向上し、特定の情報を簡単に見つけられるようになり、視覚障害を持つ方にも役立ちます。

IronOCRで画像やPDFからテキストを抽出できますか?

はい、IronOCRを使用して画像とPDFの両方からテキストを抽出できます。画像にはLoadImageメソッドを、PDFにはLoadPdfメソッドを使用し、その後ReadDocumentメソッドを実行して抽出を行います。

IronOCR の言語サポート機能はどのようなものですか?

IronOCRは、英語、中国語、日本語、韓国語、ラテンアルファベットでのテキスト抽出をサポートしており、マルチリンガルなドキュメント処理に適しています。

IronOCRで高度なスキャン機能を使用するために必要なアーキテクチャは何ですか?

IronOCRの高度なスキャン機能を.NET Frameworkで使用するには、プロジェクトがx64アーキテクチャで実行されている必要があります。

IronOCRをビジネスアプリケーションで自動テキスト抽出に利用するにはどうすればよいですか?

IronOCRはビジネスアプリケーションでの自動テキスト抽出に利用できます。スキャンされたドキュメントをインポートし、LoadPdfまたはLoadImageメソッドを使用してテキストを抽出するReadDocumentメソッドを使うことにより、ワークフローを合理化し、企業が重要なデータを分析および統合する効率を向上させます。

IronOCRを使用してスキャンされたPDFからテキストを抽出するにはどのような手順がありますか?

スキャンされたPDFからIronOCRを使用してテキストを抽出するには、ライブラリをダウンロードし、LoadPdfメソッドを使用してPDFをインポートし、その後ReadDocumentメソッドでテキストを抽出します。抽出されたテキストは必要に応じて保存またはエクスポートできます。

IronOCRはデザイナーやマーケターにどのような利益をもたらしますか?

IronOCRはデザイナーやマーケターがPDFから画像やテキストを抽出して、さまざまなプロジェクトでの改善や再利用を可能にし、効率성과創造的な可能性を高めます。

IronOCRの高度な機能を使用するにはどのパッケージをインストールする必要がありますか?

IronOCRの高度な機能にアクセスするためには、NuGetからIronOcr.Extensions.AdvancedScanパッケージをインストールする必要があります。

カーティス・チャウ
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。

準備はできましたか?
Nuget ダウンロード 5,167,857 | Version: 2025.11 リリース