IronOCRとAWS Textract OCRの比較
OCRとは何ですか?
テキストの画像を機械可読なテキスト形式に変換するために使用される手順は、Optical Character Recognition(OCR)として知られています。 例えば、フォーム、請求書、またはレシートをスキャンすると、コンピュータはスキャンを画像ファイルとして保存します。画像ファイル内のデータは、テキストエディタを使用して編集、検索、または数えることができません。 しかし、OCRソリューションを使用して、画像ファイルをテキストデータとしてその内容が保存されるテキスト文書に変換することができます。
この現代の時代では、ほとんどのビジネスワークフローは印刷メディアから情報を受け取ることを含みます。 紙のフォーム、請求書、スキャンした法的文書、表の抽出、および印刷されたテキストや契約書を含む異なる文書は、すべてビジネスプロセスの一部を構成します。 さらに、そのような文書化コンテンツをデジタル化することによって、それ内部に隠されたテキストを持つ画像が作成されます。 画像のテキストは、ワードプロセシングツールによってテキスト文書と同じようには処理できません。 OCR技術は、テキスト画像を他のビジネスソフトウェアで分析可能なテキストデータに変換することによって問題を解決します。
OCRはどのように機能しますか?
OCRエンジンは以下のステップを使用して動作します:
画像取得
このプロセスでは、スキャナーが文書を読み取り、それをバイナリーデータに変換します。 OCRソフトウェアはスキャンされた画像を識別し、明るい部分を背景として、暗い部分をテキストとして分類します。
前処理
OCRソフトウェアはまず画像をクリーンにし、エラーを取り除いてデータを読み取り用に準備します。
テキスト認識
テキスト認識のための2つの主要なOCRアルゴリズムは、パターンマッチングと特徴抽出です。
パターンマッチング
パターンマッチングプロセスを通じて、キャラクターピクチャまたはグリフが分離され、事前に記録されたグリフと比較されます。
特徴抽出
特徴抽出のプロセスを通じて、グリフは線、閉じたループ、線の方向、線の交点のような特徴に分割されます。
後処理
テクノロジーは解析後に抽出したテキストデータをデジタルファイルに変換します。 一部のOCRシステムは、スキャンした文書の前後のバージョンを含む注釈付きPDF文書を作成することができます。
この記事では、OCRのための2つの最も普及しているアプリケーションとドキュメントライブラリの比較について説明します:
- IronOCR
- AWS OCR Textract
IronOCRライブラリ
IronOCRは、C# .NETライブラリで、スキャン、検索、画像やPDFの読み取りを提供します。 125以上のグローバル言語パックが付属しています。 出力はテキスト、構造化データ、または検索可能なPDFとして達成されます。 .NETの6、5、Core、Standard、Frameworkバージョンをサポートしています。
IronOCRは、不完全にスキャンされた画像や文書からデータを自動的に検出し抽出するユニークな能力を持っています。 'IronTesseract'クラスは最も簡潔なAPIを持っています。 それは、どのプラットフォームでも知られている最も高度なテッサラクトのビルドを、スピード、精度、そしてネイティブのDLLとAPIの向上と共に提供します。
IronOCRはまた、すべての画像形式からバーコードとQRコードをスキャン・読み取り、最新のTesseract 5エンジンを使用してテキストを読み取り、PDFをスキャンします。
特徴
- それは.NETアプリケーションのために純粋に作られています。
- 125の異なる言語をサポートできます。 アラビア語、中国語、英語、フィンランド語、フランス語、ドイツ語、日本語および他の多くの言語がIronOCRでサポートされています。
- 傾いた画像の位置を訂正し、ノイズを除去して精確な出力を提供することができます。
- DPIが低い低解像度の画像でも非常に優れた性能を発揮します。
- 複数種類のQRコードとバーコードを読み取ることができます。
- GifとTiffフォーマットにも対応しています。
- 多くのスレッドを同時に許可します。 これは他のOCRライブラリにはない優れた特徴です。 それはプロセスをスムーズにします。
- PDFファイルに簡単にOCRを実行し、OCRを使用して検索可能なPDF文書をエクスポートできます。
さて、次はAWS OCRについて見てみましょう。
AWS OCR Textract
AmazonのAWS Textractは、機械学習(ML)サービスで、スキャンされた文書からテキストとデータを自動的に抽出します。 単純な光学式文字認識(OCR)を超えて、深層学習技術を使用して、フォームやテーブルからデータを識別、理解、および抽出します。
AWS OCR Textractは、機械学習を使用して、あらゆる種類の文書を読み取り、処理し、手動での努力なしでテキスト、表形式データ、およびその他のデータを正確に抽出します。 データを抽出するのに数時間または数日かかる代わりに、Textractはそれを迅速に行うことができます。 さらに、Amazon Augmented Artificial Intelligence(AI)を使用して、人間のレビューを追加し、モデルの監視や機密データのチェックを行うことができます。
特徴
- ファイナンシャルレポート、医療記録、テーブル、税務フォームを含む様々な文書からテキストを検出します。
- ドキュメント分析APIを使用して、構造化データを持つドキュメントからテキスト、フォーム、テーブルデータを抽出します。
- Analyze Document API内でのQueries機能を使用して、ドキュメントから情報を指定して抽出します。
- Analyze Expense APIを使用して請求書および領収書を処理します。
- 米国政府が発行した運転免許証やパスポートなどのID文書を処理します。 Analyze ID APIを使用して。
- スケーラブルな文書分析で、意思決定を加速できます。
この記事の残りの部分は以下の通りです:
- Visual Studioプロジェクトの作成
- IronOCRのインストール
- AWS OCR Textractのインストール
- PDFをテキストに変換
- 画像をテキストに変換
- バーコードおよびQRをテキストに変換
- ライセンス
- 結論
1. Visual Studioプロジェクトの作成
このチュートリアルでは、Visual Studio 2022バージョンを使用するので、インストールされていることを前提とします。
- Visual Studio 2022を開いてください。
- 新しい.NET Coreプロジェクトを生成し、次にコンソールアプリを選択します。

コンソール アプリケーション
- プロジェクトに名前を付けてください。 例: TextReader。
- .NETフレームワークの最新で最も安定したバージョンは6.0です。これを使用します。

- 作成ボタンをクリックすると、プロジェクトが作成されます。
次に、使用するライブラリを1つずつインストールします。
2. IronOCRのインストール
IronOCRライブラリはいくつかの方法でダウンロードしてインストールできます。 以下の方法があります:
- Visual Studio NuGetパッケージマネージャを使用します。
- NuGetウェブサイトから直接ダウンロードします。
- IronOCRウェブページから直接ダウンロードします。
2.1. ビジュアルスタジオNuGetマネージャを使用
2.1. Visual Studio NuGetマネージャの使用
ツールを展開するか、ソリューションエクスプローラを右クリックします。
- ツールを展開するか、ソリューションエクスプローラーで右クリックします。
- NuGet パッケージ マネージャーを拡張します。
- ソリューションのための NuGet パッケージの管理をクリックするか、ソリューション エクスプローラーで [NuGet パッケージの管理] をクリックします。

NuGet パッケージの管理
右側のプロジェクトボックスをチェックし、インストールをクリックします。 右側のプロジェクトボックスをチェックし、インストールをクリックします。

IronOCRを閲覧する
この方法を使用することで、開発者はIronOCRライブラリと開発者が選択した任意の言語パックをインストールできます。
2.2. NuGetウェブサイトからの直接ダウンロード
IronOCRは、次の手順に従ってNuGetウェブサイトから直接ダウンロードできます:
- リンク"https://www.nuget.org/packages/IronOcr/"に移動します。
- 右側のメニューからダウンロードパッケージオプションを選択します。
- ダウンロードパッケージをダブルクリックします。 自動的にインストールされます。
- 次に、ソリューションを再読み込みし、プロジェクトで使用を開始します。
開発者はリンクを使用してIronOCRライブラリをウェブサイトから直接ダウンロードできます。
開発者は、このリンクを使用して、IronOCRライブラリをウェブサイトから直接ダウンロードできます。
- ソリューションウィンドウからプロジェクトを右クリックします。
- 次に、オプションの参照を選択し、ダウンロードした参照の場所を参照します。
- 次に、OKをクリックして参照を追加します。
2.4. Visual Studioでのコマンドラインの使用
- パッケージマネージャコンソールタブに次の行を入力します:
- パッケージマネージャーコンソールタブに次の行を入力します:
Install-Package IronOcr

コンソール アプリケーション

コンソール アプリケーション

NuGet パッケージマネージャー

AWS Textract

サンプルPDF

IronOCR出力

AWS Textract 出力

編集された従業員データ

画像出力

IronOCR 料金プラン

SAASサービス

価格表
よくある質問
光学文字認識(OCR)とは何ですか?
光学文字認識(OCR)は、スキャンされた紙のドキュメント、PDF、デジタルカメラで撮影された画像など、さまざまな種類のドキュメントを編集可能で検索可能なデータに変換する技術です。IronOCRは、先進的なアルゴリズムを使用してこのプロセスを強化する強力なC# .NETライブラリです。
C#を使用してテキストの画像を機械可読テキストに変換するにはどうすればよいですか?
テキストの画像を機械可読テキストに変換するには、C# .NETライブラリであるIronOCRを使用できます。これは、先進的なOCRアルゴリズムを介して画像を処理し、プログラム的に操作しやすいフォーマットで認識されたテキストを出力します。
IronOCRは不完全にスキャンされた画像をどのように処理しますか?
IronOCRは、不完全にスキャンされた画像を効果的に管理および処理するために設計されています。スキュー補正、テキストコントラストの強化、画像の品質の向上を含む前処理機能を備え、OCRの精度を向上させます。
IronOCRをマルチスレッド処理に使用できますか?
はい、IronOCRはマルチスレッドをサポートしており、複数のドキュメントを同時に処理することで、文書集約型アプリケーションのパフォーマンスとスループットを大幅に向上させます。
IronOCRはOCRタスクにどの言語をサポートしていますか?
IronOCRは125以上の言語をサポートしており、複数の言語のドキュメントを処理してテキストに変換する必要があるグローバルアプリケーションに適した多目的ツールです。
IronOCRをVisual Studioプロジェクトにどのようにインストールしますか?
IronOCRはNuGetパッケージマネージャーを介してVisual Studioプロジェクトにインストールできます。NuGetコンソールで'IronOCR'を検索してインストールし、.NETアプリケーションにOCR機能を統合することができます。
IronOCRの価格モデルは何ですか?
IronOCRは一度支払いのライセンスモデルを提供しています。これは、30日間の返金保証付きの永続的なライセンスを含み、開発者に柔軟性と安心感を提供します。
AWS TextractとIronOCRは技術的にはどう違うのですか?
AWS Textractは機械学習とディープラーニング技術を使用してテキストとデータを抽出し、ドキュメントの内容を詳細に分析します。一方、IronOCRは.NETプロジェクト内での使いやすさと統合に焦点を当てており、包括的な言語サポートを持つ堅牢なOCRソリューションを提供します。
IronOCRはバーコードやQRコードを読み取り処理できますか?
はい、IronOCRはバーコードとQRコードの両方を読み取り処理できます。各コードに関する詳細情報を抽出しつつ、同時にテキストをスキャンすることで、ドキュメント処理の包括的なツールとなっています。
IronOCRはどのプラットフォームと環境でサポートされていますか?
IronOCRは、Windows、Linux、Mac、Azure、AWS、およびLambdaを含むさまざまな環境に対応しています。.NET Framework、.NET Standard、および.NET Coreプロジェクトをサポートしており、さまざまな開発エコシステムでの柔軟性を確保します。






