フッターコンテンツにスキップ
他のコンポーネントと比較する

IronOCRとAWS Textract OCRの比較

OCRとは何ですか?

テキストの画像を機械可読なテキスト形式に変換するために使用される手順は、Optical Character Recognition(OCR)として知られています。 例えば、フォーム、請求書、またはレシートをスキャンすると、コンピュータはスキャンを画像ファイルとして保存します。画像ファイル内のデータは、テキストエディタを使用して編集、検索、または数えることができません。 しかし、OCRソリューションを使用して、画像ファイルをテキストデータとしてその内容が保存されるテキスト文書に変換することができます。

この現代の時代では、ほとんどのビジネスワークフローは印刷メディアから情報を受け取ることを含みます。 紙のフォーム、請求書、スキャンした法的文書、表の抽出、および印刷されたテキストや契約書を含む異なる文書は、すべてビジネスプロセスの一部を構成します。 さらに、そのような文書化コンテンツをデジタル化することによって、それ内部に隠されたテキストを持つ画像が作成されます。 画像のテキストは、ワードプロセシングツールによってテキスト文書と同じようには処理できません。 OCR技術は、テキスト画像を他のビジネスソフトウェアで分析可能なテキストデータに変換することによって問題を解決します。

OCRはどのように機能しますか?

OCRエンジンは以下のステップを使用して動作します:

画像取得

このプロセスでは、スキャナーが文書を読み取り、それをバイナリーデータに変換します。 OCRソフトウェアはスキャンされた画像を識別し、明るい部分を背景として、暗い部分をテキストとして分類します。

前処理

OCRソフトウェアはまず画像をクリーンにし、エラーを取り除いてデータを読み取り用に準備します。

テキスト認識

テキスト認識のための2つの主要なOCRアルゴリズムは、パターンマッチングと特徴抽出です。

パターンマッチング

パターンマッチングプロセスを通じて、キャラクターピクチャまたはグリフが分離され、事前に記録されたグリフと比較されます。

特徴抽出

特徴抽出のプロセスを通じて、グリフは線、閉じたループ、線の方向、線の交点のような特徴に分割されます。

後処理

テクノロジーは解析後に抽出したテキストデータをデジタルファイルに変換します。 一部のOCRシステムは、スキャンした文書の前後のバージョンを含む注釈付きPDF文書を作成することができます。

この記事では、OCRのための2つの最も普及しているアプリケーションとドキュメントライブラリの比較について説明します:

  • IronOCR
  • AWS OCR Textract

IronOCRライブラリ

IronOCRは、C# .NETライブラリで、スキャン、検索、画像やPDFの読み取りを提供します。 125以上のグローバル言語パックが付属しています。 出力はテキスト、構造化データ、または検索可能なPDFとして達成されます。 .NETの6、5、Core、Standard、Frameworkバージョンをサポートしています。

IronOCRは、不完全にスキャンされた画像や文書からデータを自動的に検出し抽出するユニークな能力を持っています。 'IronTesseract'クラスは最も簡潔なAPIを持っています。 それは、どのプラットフォームでも知られている最も高度なテッサラクトのビルドを、スピード、精度、そしてネイティブのDLLとAPIの向上と共に提供します。

IronOCRはまた、すべての画像形式からバーコードとQRコードをスキャン・読み取り、最新のTesseract 5エンジンを使用してテキストを読み取り、PDFをスキャンします。

特徴

  • それは.NETアプリケーションのために純粋に作られています。
  • 125の異なる言語をサポートできます。 アラビア語、中国語、英語、フィンランド語、フランス語、ドイツ語、日本語および他の多くの言語がIronOCRでサポートされています。
  • 傾いた画像の位置を訂正し、ノイズを除去して精確な出力を提供することができます。
  • DPIが低い低解像度の画像でも非常に優れた性能を発揮します。
  • 複数種類のQRコードとバーコードを読み取ることができます。
  • GifとTiffフォーマットにも対応しています。
  • 多くのスレッドを同時に許可します。 これは他のOCRライブラリにはない優れた特徴です。 それはプロセスをスムーズにします。
  • PDFファイルに簡単にOCRを実行し、OCRを使用して検索可能なPDF文書をエクスポートできます。

さて、次はAWS OCRについて見てみましょう。

AWS OCR Textract

AmazonのAWS Textractは、機械学習(ML)サービスで、スキャンされた文書からテキストとデータを自動的に抽出します。 単純な光学式文字認識(OCR)を超えて、深層学習技術を使用して、フォームやテーブルからデータを識別、理解、および抽出します。

AWS OCR Textractは、機械学習を使用して、あらゆる種類の文書を読み取り、処理し、手動での努力なしでテキスト、表形式データ、およびその他のデータを正確に抽出します。 データを抽出するのに数時間または数日かかる代わりに、Textractはそれを迅速に行うことができます。 さらに、Amazon Augmented Artificial Intelligence(AI)を使用して、人間のレビューを追加し、モデルの監視や機密データのチェックを行うことができます。

特徴

  • ファイナンシャルレポート、医療記録、テーブル、税務フォームを含む様々な文書からテキストを検出します。
  • ドキュメント分析APIを使用して、構造化データを持つドキュメントからテキスト、フォーム、テーブルデータを抽出します。
  • Analyze Document API内でのQueries機能を使用して、ドキュメントから情報を指定して抽出します。
  • Analyze Expense APIを使用して請求書および領収書を処理します。
  • 米国政府が発行した運転免許証やパスポートなどのID文書を処理します。 Analyze ID APIを使用して。
  • スケーラブルな文書分析で、意思決定を加速できます。

この記事の残りの部分は以下の通りです:

  1. Visual Studioプロジェクトの作成
  2. IronOCRのインストール
  3. AWS OCR Textractのインストール
  4. PDFをテキストに変換
  5. 画像をテキストに変換
  6. バーコードおよびQRをテキストに変換
  7. ライセンス
  8. 結論

1. Visual Studioプロジェクトの作成

このチュートリアルでは、Visual Studio 2022バージョンを使用するので、インストールされていることを前提とします。

  • Visual Studio 2022を開いてください。
  • 新しい.NET Coreプロジェクトを生成し、次にコンソールアプリを選択します。
Aws Ocr Alternatives 1 related to 1. Visual Studioプロジェクトの作成

コンソール アプリケーション

  • プロジェクトに名前を付けてください。 例: TextReader。
  • .NETフレームワークの最新で最も安定したバージョンは6.0です。これを使用します。

.NET Framework

  • 作成ボタンをクリックすると、プロジェクトが作成されます。

次に、使用するライブラリを1つずつインストールします。

2. IronOCRのインストール

IronOCRライブラリはいくつかの方法でダウンロードしてインストールできます。 以下の方法があります:

  1. Visual Studio NuGetパッケージマネージャを使用します。
  2. NuGetウェブサイトから直接ダウンロードします。
  3. IronOCRウェブページから直接ダウンロードします。

    2.1. ビジュアルスタジオNuGetマネージャを使用

2.1. Visual Studio NuGetマネージャの使用

  1. ツールを展開するか、ソリューションエクスプローラを右クリックします。

  2. ツールを展開するか、ソリューションエクスプローラーで右クリックします。
  3. NuGet パッケージ マネージャーを拡張します。
  4. ソリューションのための NuGet パッケージの管理をクリックするか、ソリューション エクスプローラーで [NuGet パッケージの管理] をクリックします。
Manage NuGet Package

NuGet パッケージの管理

右側のプロジェクトボックスをチェックし、インストールをクリックします。 右側のプロジェクトボックスをチェックし、インストールをクリックします。

IronOCRを閲覧する

IronOCRを閲覧する

この方法を使用することで、開発者はIronOCRライブラリと開発者が選択した任意の言語パックをインストールできます。

2.2. NuGetウェブサイトからの直接ダウンロード

IronOCRは、次の手順に従ってNuGetウェブサイトから直接ダウンロードできます:

  1. リンク"https://www.nuget.org/packages/IronOcr/"に移動します。
  2. 右側のメニューからダウンロードパッケージオプションを選択します。
  3. ダウンロードパッケージをダブルクリックします。 自動的にインストールされます。
  4. 次に、ソリューションを再読み込みし、プロジェクトで使用を開始します。

開発者はリンクを使用してIronOCRライブラリをウェブサイトから直接ダウンロードできます。

開発者は、このリンクを使用して、IronOCRライブラリをウェブサイトから直接ダウンロードできます。

  1. ソリューションウィンドウからプロジェクトを右クリックします。
  2. 次に、オプションの参照を選択し、ダウンロードした参照の場所を参照します。
  3. 次に、OKをクリックして参照を追加します。

2.4. Visual Studioでのコマンドラインの使用

  1. パッケージマネージャコンソールタブに次の行を入力します:
  2. パッケージマネージャーコンソールタブに次の行を入力します:
Install-Package IronOcr
![Package Manager Console](/static-assets/ocr/blog/aws-ocr-alternatives/aws-ocr-alternatives-4.webp)
Package Manager Console

コンソール アプリケーション

Install IronOCR

コンソール アプリケーション

### 2.5. IronOCRネームスペースの追加 ### 2.5. IronOCRネームスペースの追加 それではAWS Textractをインストールしましょう。 ```csharp using IronOcr; ``` ## 3. AWS Textract OCRのインストール Amazon Textractを初めて使用する前に、次のタスクを完了してください: 1. AWSサービスへのサインアップ。 1. AWS サービスにサインアップします。 2. IAM ユーザーを作成します。 アカウントのサインアップと IAM ユーザーの作成に成功したら、C# を使用して API にプログラム的にアクセスするために、AWS コンソールでアクセスキーを設定できます。 - SecretAccessKey - SecretAccessKey - SecretAccessKey ### 3.1. NuGetパッケージマネージャの使用 ### 3.1. NuGetパッケージマネージャーの使用 - NuGetパッケージマネージャーからAWS Textract SDKをダウンロードおよびインストールできます。
NuGet パッケージマネージャー

NuGet パッケージマネージャー

- ブラウズをクリックして、AWS Textractを検索します:
AWS Textract

AWS Textract

### 3.2. AWS OCR 名前空間の追加 AWS Textractを使用するために、次の名前空間を含めます。 ```csharp using Amazon.Textract; using Amazon.Textract.Model; ``` 両方のライブラリはPDFファイルからテキストを抽出できます。 両方のライブラリは、PDF ファイルからテキストを抽出できます。 それでは、コードを一つずつ見ていきましょう。 IronOCRは、進化したTesseractを使用してPDF文書形式からテキストを認識して読み取ることを可能にします。 **IronOCR** は、Advanced Tesseract を使用して PDF ドキュメント形式からテキストを認識し、読み取ることを可能にするライブラリです。 次のシンプルなコードが情報を抽出するために使用されます。 ```csharp var Ocr = new IronTesseract(); using (var input = new OcrInput()) { input.AddPdf("example.pdf", "password"); // We can also select specific PDF page numbers to OCR var Result = Ocr.Read(input); Console.WriteLine(Result.Text); Console.WriteLine($"{Result.Pages.Count()} Pages"); // Read every page of the PDF } ``` #### 入力PDFファイル
![サンプルPDF](/static-assets/ocr/blog/aws-ocr-alternatives/aws-ocr-alternatives-8.webp)
サンプルPDF

サンプルPDF

#### 出力
IronOCR出力

IronOCR出力

Amazon Textractはアプリケーションに文書テキストの検出と分析を簡単に追加することができます。 次のコードはPDFを読み取り、同じPDFが渡されます: コードは少しトリッキーで、長く、オブジェクトを渡したり取得したりする際に注意が必要です。 ```csharp public static async void ReturnResult() { AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1); var request = new StartDocumentTextDetectionRequest(); request.DocumentLocation = new DocumentLocation { S3Object = new S3Object { Bucket = "your_bucket_name", Name = "your_bucket_key" } }; var id = await client.StartDocumentTextDetectionAsync(request); var jobId = id.JobId; var response = client.GetDocumentTextDetectionAsync(new GetDocumentTextDetectionRequest{ JobId = jobId }); response.Wait(); if (response.Result.JobStatus.Equals("SUCCEEDED")) { foreach (var block in response.Result.Blocks) { if (block.BlockType == "WORD" || block.BlockType == "PAGE" || block.BlockType == "LINE") { Console.WriteLine(block.Text); } } } } static void Main(String[] args) { ReturnResult(); } ``` 最初に、3つのパラメータを持つ`AmazonTextractClient`オブジェクトを作成する必要があります:`AccessKeyId`、`SecretAccessKey`、`Region`。 次に`StartDocumentTextDetectionRequest()`メソッドを使用してリクエストを開始します。 リクエストオブジェクトはその後、バケット名とキーを使用して`DocumentLocation`を設定します。 リクエストオブジェクトは、バケット名とキーを使用して `DocumentLocation` を設定します。 このリクエストは、次に `StartDocumentTextDetectionAsync()` メソッドに渡されます。 非同期メソッドであるため、`await` キーワードを使用し、`ReturnResult` 関数を非同期にする必要があります。 成功すると、結果が返され、jobId が保存されます。 jobId は `GetDocumentTextDetectionAsync()` メソッドに渡され、`SUCCEEDED` レスポンスを待ちます。 最後に、`Main`メソッドでこのメソッドを呼び出して文書加工を行います。 最後に、文書処理のために`Main`メソッド内でこのメソッドを呼び出します。 #### 出力 出力はIronOCRに非常に似ています。
AWS Textract 出力

AWS Textract 出力

## 5. 画像からテキストへ 画像からデータを読み取るのは難しいです。画像の品質が情報抽出の重要な役割を果たします。 両方のライブラリは、テキストを抽出する機能を提供します。 ここではpngファイルを使用します。 ### 5.1. IronOCRの使用 コードは以前のものとほぼ似ています。 ここでは、`AddPDF`メソッドが`AddImage`メソッドに置き換えられています。 ```csharp var Ocr = new IronTesseract(); using (var Input = new OcrInput()) { Input.AddImage("test-files/redacted-employmentapp.png"); //... you can add any number of images var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } ``` #### 入力画像
編集された従業員データ

編集された従業員データ

#### 出力 出力はクリーンで、元の画像と一致し、わずか数行のコードで、技術的な難しさもなく完璧な出力を得ることができます。
画像出力

画像出力

### 5.2. AWS Textractの使用 次のコードは、画像からテキストを検出するのに役立ちます。 ```csharp public static async void ReturnResult() { AmazonTextractClient client = new AmazonTextractClient("your_access_key_id", "your_secret_access_key", Amazon.RegionEndpoint.AFSouth1); var request = new DetectDocumentTextRequest(); request.Document = new Document { Bytes = new MemoryStream(File.ReadAllBytes(@"test-files/redacted-employmentapp.png")) }; var result = await client.DetectDocumentTextAsync(request); foreach (var block in result.Blocks) { if (block.BlockType == "WORD") { Console.WriteLine(block.Text); } } } static void Main(String[] args) { ReturnResult(); } ``` 再び、コードは以前のものとほぼ似ています。 ここでは、`DetectDocumentTextRequest()`メソッドを使用してリクエストを開始する必要があります。 リクエストオブジェクトは、すべてのバイトを読み取ることでドキュメントを設定します。 このリクエストは次に`DetectDocumentTextAsync()`メソッドに渡されます。 非同期メソッドであるため、`await` キーワードを使用し、`ReturnResult` 関数を非同期にする必要があります。 成功すると、結果がブロックに分かれて返されます。 `foreach`ループを使用して各ブロックをループ処理し、それが"WORD"であるかどうかをチェックし、テキスト認識を表示します。 最後に、文書処理のために`Main`メソッド内でこのメソッドを呼び出します。 出力はIronOCRに似ていますが、最初にファイルをAWSバケットにアップロードする必要があります。 ## 6. バーコードとQRコードをテキストに変換 IronOCRのユニークな機能は、テキストをスキャンしている間にドキュメントからバーコードとQRコードを読み取ることができることです。 クラス`OcrResult.OcrBarcode`のインスタンスは、開発者に各スキャンしたバーコードに関する詳細情報を提供します。 AWS Textractはこの機能を提供しません。 IronOCRのコードは以下の通りです: ```csharp var Ocr = new IronTesseract(); Ocr.Configuration.ReadBarCodes = true; using (var input = new OcrInput()) { input.AddImage("test-files/Barcode.png"); var Result = Ocr.Read(input); foreach (var Barcode in Result.Barcodes) { Console.WriteLine(Barcode.Value); // type and location properties also exposed } } ``` このコードは自己説明的で、理解しやすいです。 ## 7. ライセンス **IronOCR** は、開発者ライセンスを無料で提供するライブラリです。 Liteバンドルは$799から始まり、隠れた費用はありません。 Liteバンドルは$799から始まり、隠れた手数料はありません。 SaaSとOEM製品の再配布も可能です。 すべてのライセンスには、30日間の返金保証、1年間のソフトウェアサポートとアップグレード、開発/ステージング/本番の有効性、そして永久ライセンス(1回限りの購入)が付いています。 IronOCRの全価格構造とライセンスの詳細を見るには、[こちら](/csharp/ocr/licensing/)をクリックしてください。
IronOCR 料金プラン

IronOCR 料金プラン

無償のサービスでSaaSおよびOEM製品の再配布を$1,599のワンタイム購入で得ることができます。
SAASサービス

SAASサービス

**AWS Textract API** は、開発者に AWS Free Tier サービスを提供します。Amazon Textract を無料で始めることができます。 Free Tier は3か月間続き、価格は以下に示されています。 ![価格一覧](/static-assets/ocr/blog/aws-ocr-alternatives/aws-ocr-alternatives-16.webp)
価格表

価格表

You can have a look at the pricing details from this link. さらに、価格計算機を使用してニーズに合わせて価格を調整することも可能です。 ## 8. 結論 IronOCRはWindows、Linux、Mac、Azure、AWS、Lambdaにデプロイ可能であり、*.NET Framework*プロジェクトだけでなく、*.NET Standard*と*.NET Core*もサポートしています。 IronOCR は、Windows、Linux、Mac、Azure、AWS、Lambda にデプロイでき、*.NET Framework* プロジェクト、*.NET Standard* および *.NET Core* をサポートします。 私たちはOCRスキャンでバーコードを読み取ることもでき、OCRをHTMLおよび検索可能なPDFとしてエクスポートすることもできます。 次のコードはPDFを読み取り、同じPDFが渡されます: Amazon Textractは、Amazonのコンピュータビジョンサイエンティストによって開発された、実績のある高スケーラブルなディープラーニング技術に基づいており、毎日数十億の画像や動画を分析します。 使用するのに機械学習の専門知識は必要ありません。 Amazon Textractは常に新しいデータから学び、Amazonはサービスに新機能を継続的に追加しています。 IronOCRのライセンスは開発者ベースで、製品を使用する開発者の数に基づいて常にライセンスを購入する必要があります。 AWS Textractのライセンスは、情報を抽出しデータを分析する文書のページ数に基づいています。 ライセンスは月額制で、IronOCRライセンスと比較して非常に多くのページ数に高い価格がつけられます。 さらに、IronOCRライセンスは一度購入すると生涯使用可能で、OMEとSaaSの配布をサポートしています。 さらに、IronOCRのライセンスは一度の購入で生涯使用でき、OMEおよびSaaS配布をサポートしています。 全体的な比較では、IronOCRとAWS OCRの両方がドキュメントや画像からテキストを検出するための機械学習機能を持っています。 IronOCRは、速度が速く時間を節約できる点でAWS OCRよりわずかに優位性があります。 コードはシンプルで、ドキュメントからテキストを検出する際も簡単です。 このタスクは、いくつかのメソッドで達成されます。 一方、AWS Textractは同じタスクを達成するために多くの方法を使用します。 完璧ではない文書でもIronOCRに入力すると、悪くフォーマットされた、傾いた、デジタルノイズを持つ文書であっても約99%の統計精度でその内容を正確に読み取ることができます。IronOCRは、パフォーマンスの調整や入力画像の大幅な変更を行う必要なく、即座に使用できます。 IronOCRに不完全なドキュメントを入力しても、その内容を約99%の統計的精度で正確に読み取ることができることがわかります。ドキュメントが悪いフォーマットであったり、歪んでいたり、デジタルノイズがあったりしても、IronOCRはすぐに使用でき、入力画像をパフォーマンスチューニングしたり、大幅に変更したりする必要がありません。 速度は驚異的です:IronOCR.2020+は最大10倍の速さで、以前のビルドよりも250%以上少ないエラーを出します。 さらに、Iron Softwareは現在、2つの価格で5つのツールパッケージを提供しています。 - IronPDF - IronBarcode - IronPDF - IronOCR - IronWebScraper [Iron Suite](/csharp/barcode/licensing/)を探索するためにこのリンクを訪れてください。 [IRONSUITE](/csharp/barcode/licensing/)について詳しくは、このリンクをご覧ください。

よくある質問

光学文字認識(OCR)とは何ですか?

光学文字認識(OCR)は、スキャンされた紙のドキュメント、PDF、デジタルカメラで撮影された画像など、さまざまな種類のドキュメントを編集可能で検索可能なデータに変換する技術です。IronOCRは、先進的なアルゴリズムを使用してこのプロセスを強化する強力なC# .NETライブラリです。

C#を使用してテキストの画像を機械可読テキストに変換するにはどうすればよいですか?

テキストの画像を機械可読テキストに変換するには、C# .NETライブラリであるIronOCRを使用できます。これは、先進的なOCRアルゴリズムを介して画像を処理し、プログラム的に操作しやすいフォーマットで認識されたテキストを出力します。

IronOCRは不完全にスキャンされた画像をどのように処理しますか?

IronOCRは、不完全にスキャンされた画像を効果的に管理および処理するために設計されています。スキュー補正、テキストコントラストの強化、画像の品質の向上を含む前処理機能を備え、OCRの精度を向上させます。

IronOCRをマルチスレッド処理に使用できますか?

はい、IronOCRはマルチスレッドをサポートしており、複数のドキュメントを同時に処理することで、文書集約型アプリケーションのパフォーマンスとスループットを大幅に向上させます。

IronOCRはOCRタスクにどの言語をサポートしていますか?

IronOCRは125以上の言語をサポートしており、複数の言語のドキュメントを処理してテキストに変換する必要があるグローバルアプリケーションに適した多目的ツールです。

IronOCRをVisual Studioプロジェクトにどのようにインストールしますか?

IronOCRはNuGetパッケージマネージャーを介してVisual Studioプロジェクトにインストールできます。NuGetコンソールで'IronOCR'を検索してインストールし、.NETアプリケーションにOCR機能を統合することができます。

IronOCRの価格モデルは何ですか?

IronOCRは一度支払いのライセンスモデルを提供しています。これは、30日間の返金保証付きの永続的なライセンスを含み、開発者に柔軟性と安心感を提供します。

AWS TextractとIronOCRは技術的にはどう違うのですか?

AWS Textractは機械学習とディープラーニング技術を使用してテキストとデータを抽出し、ドキュメントの内容を詳細に分析します。一方、IronOCRは.NETプロジェクト内での使いやすさと統合に焦点を当てており、包括的な言語サポートを持つ堅牢なOCRソリューションを提供します。

IronOCRはバーコードやQRコードを読み取り処理できますか?

はい、IronOCRはバーコードとQRコードの両方を読み取り処理できます。各コードに関する詳細情報を抽出しつつ、同時にテキストをスキャンすることで、ドキュメント処理の包括的なツールとなっています。

IronOCRはどのプラットフォームと環境でサポートされていますか?

IronOCRは、Windows、Linux、Mac、Azure、AWS、およびLambdaを含むさまざまな環境に対応しています。.NET Framework、.NET Standard、および.NET Coreプロジェクトをサポートしており、さまざまな開発エコシステムでの柔軟性を確保します。

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。