Google OCRとIronOCRの比較
OCRは光学文字認識の略です。 - RegionEndPoint - この例の場合:アフリカ南部1 スキャンされた文書は常にコンピュータによって画像ファイルとして保存されます。 これらの画像ファイル内のデータは、通常のテキストエディタやワードプロセッシングアプリケーションを使用しても検索、編集、またはテキスト形式で保存することはできません。 OCR処理は、これらの画像をユーザーによるさらなる処理のために機械可読テキストに変換するのを手助けします。
この現代の時代において、インターネットで共有されるスキャンされた文書はデジタル形式であり、主にPDFや画像の形を取ります。 画像をテキストに変換するオンラインリソースはたくさんあります。 しかし、多くの企業はこの機能をソフトウェアアプリケーションに組み込む必要があります。 このことを念頭に置いて、ソフトウェアアプリケーションに埋め込むためのOCR処理技術を提供する多くのライブラリがあります。
この記事では、C#用の最も人気のあるOCRライブラリの2つについて話し合います。 以下のような方法です:
- IronOCR
- Google Cloud Vision OCR (Vision API)
IronOCR - C#ライブラリ
IronOCR for .NETは、画像とPDFをスキャン、検索、読み取るためのC#ライブラリです。 それは画像やPDFファイルを入力として取り、最新のTesseract 5カスタムビルド.NET OCRエンジンを使用して、テキスト、構造化データ、または検索可能なPDF文書を出力します。 Tesseractは125以上の言語で利用可能で、.NET Coreおよび.NET Standardのクロスプラットフォームサポートを提供し、2.0から7までカバーしています。
IronOCRは、IronTesseractクラスとAPIキーを使用して、C#開発者が画像をテキストに自動的に変換できるユーザーフレンドリーなAPIです。 それはスピード、正確さ、および使いやすさを優先します。 また、コンピュータビジョンAPIをトレーニングモデルを使用してテキストを見つけるのを支援します。
IronOCRのもう1つの強力な機能は、すべての画像ファイルからバーコードやQRコードをスキャンしてそのテキストを読み取ることができることです。 IronOCRの他の重要な機能を以下に示します。
特徴
- 国際言語: 125以上の言語サポートとカスタム言語サポート、高速かつ高品質なパフォーマンス
- テキストとバーコードの読み取り: 複数言語から一度にテキストと数値を読み取る
- 専門的文書: レシート、小切手、請求書から特にテキストを読み取る
- 多くの形式から読み取る: 画像 (PNG, JPG, GIF, TIFF, BMP),
System.Drawing Objects, ストリーム, PDF文書 (最適化されたターゲットDPI) - フィルター: フィルタウィザード、画像補正、画像の向き修正、画像の色修正
- 簡単データ出力: .NETテキストストリング、バーコードおよびQRデータ、画像
では、Google Cloud Vision APIを見てみましょう。
Google Cloud Vision OCR
Google Cloud Vision APIは、C#言語をサポートするGoogle Cloud OCRクライアントライブラリです。 それは、C#開発者がコンピュータビジョン検出機能をソフトウェアアプリケーションに簡単に統合できるようにします。 それはOCRを実行し、画像ファイルからテキストを検出し、画像ラベル、顔認識、ランドマーク検出を行います。
画像ファイルを機械エンコードされたテキストに変換する機能があります。 Cloud Vision APIを使用すると、すばやく数百の事前定義されたカテゴリに画像を分類できます。 また、オブジェクトを検出し、印刷された文書や手書きテキストからテキストを読み取ることもできます。
特徴
- 画像テキスト検出: 画像をOCRしてテキスト認識を行い、機械言語コードに変換
- 文書テキスト検出: ファイル(PDF/TIFF)のOCR、密なテキスト
- ランドマーク検出: 検出されたオブジェクトの座標を返す
- ロゴ検出: テキストによる説明を返す
- ラベル検出: 画像の一般化されたラベルを返す
この記事の残りの部分は以下の通りです:
- Visual Studioプロジェクトの作成
- IronOCRのインストール
- Google OCRのインストール
- 画像をテキストに変換
- バーコードとQRコードをテキストに変換
- PDFをテキストに変換
- ライセンス
- 結論
1. Visual Studioプロジェクトの作成
このチュートリアルでは、最新バージョンであるVisual Studio 2022を使用します。 したがって、すでにC#用にダウンロードしてインストールしていることを前提とします。 ない場合は、Visual Studioのウェブサイトからダウンロードできます。
さて、両方のライブラリを開始するためにはコンソールプロジェクトを作成する必要があります。 プロジェクトを作成する手順に従ってください:
- Visual Studio 2022を開く。
- 新しいプロジェクトの作成をクリックします。

- 与えられたオプションからC#コンソールアプリケーションを選択します。

- 新しいプロジェクトに名前と場所を設定します。 例えば "OCRProject"。
- 次へをクリックします。

- 追加情報から、最も安定しているバージョンである.NET 6.0フレームワークを選択します。

- さて、作成をクリックすると、指定した場所にプロジェクトが作成されます。
次に、比較のためにプロジェクトにライブラリをインストールします。
2. IronOCRのインストール
IronOCRライブラリをインストールするには複数の方法があります。 それらを一つずつ見てみましょう。
2.1. Visual Studio NuGetパッケージマネージャーを使用する
NuGetはプロジェクトに依存関係をダウンロードしてインストールするためのパッケージマネージャーです。 そのパッケージにはコンパイルされたコード (DLL) とマニフェストファイルが含まれています。以下の方法を使用してアクセスします:
- ツールタブをクリックします
- NuGetパッケージマネージャーオプションを拡張します
- ソリューションのNuGetパッケージを管理をクリックします

- または、ソリューションエクスプローラーを右クリック
- NuGetパッケージを管理をクリックします

さて、NuGetパッケージマネージャーウィンドウが開きます。 IronOCRを検索してインストールをクリックします。

2.2. NuGetウェブサイトからダウンロード
それはNuGet公式ウェブサイトから直接ダウンロードできます。以下の手順に従ってください:
- NuGetウェブサイトへのリンクをクリックします。
- ページの右側のダウンロードパッケージオプションをクリックします。
- ダウンロードしたパッケージを開くと、それがインストールされ始めます。
- 最後にソリューションをリロードして完了です。
2.3. IronOCRウェブページを使用してダウンロード
Iron Softwareのウェブサイトにアクセスし、IronOCR for .NETのウェブページに移動します。 下にスクロールしてDLLのダウンロードまたはWindowsインストーラーのダウンロードをクリックします。

Zipファイルがダウンロードされます。 それを解凍してプロジェクトファイルに追加するか、Windowsインストーラーを実行してください。 以下の手順に従ってプロジェクトに追加します。
- Visual Studioのソリューションエクスプローラーでプロジェクトの依存関係を右クリックします。
- 次に、プロジェクトリファレンスの追加オプションを選択します。
- ダウンロードしたDLLファイルの場所を参照します。
- 最後にOKをクリックしてプロジェクトリファレンスを追加します。
2.4. Visual Studioのコマンドプロンプトを使用
- Visual Studioのツールタブに移動します。
- NuGetパッケージマネージャーオプションを拡張します。
- パッケージマネージャーコンソールを選択し、以下のコマンドを入力します:
Install-Package IronOcr
これにより、プロジェクトにIronOCRが自動的にダウンロードおよびインストールされます。
さて、プロジェクトでIronOCRを使用する準備が整いました。
2.5. 必要なIronOCRネームスペースの追加
必要なのはたった1つのネームスペースで、機能にアクセスする必要があるソースコードファイルの上部に追加する必要があります。
using IronOcr;using IronOcr;さて、Google Vision OCRをインストールしましょう。
3. Google OCRのインストール
C#プロジェクトでVision APIを使用できるようにするには、次の前提条件を満たす必要があります:
- Googleアカウントを作成する
- Google Cloudコンソールから新しいプロジェクトを作成する
- 課金を有効にする
- Vision APIを有効にする
- サービスアカウントを作成し、資格情報を設定する
- サービスアカウントキーの資格情報をJSONファイル形式でダウンロードする
Google Cloud Visionの設定と要件の詳細については、公式ドキュメントをこちらでご覧いただけます。
さて、Visual StudioでOCR処理を行うためにGoogle Cloudクライアントライブラリをインストールするには、NuGetパッケージマネージャーを使用する必要があります。
3.1. NuGetパッケージマネージャーの使用
次の方法でアクセスしてください:
- ツールタブをクリックします
- NuGetパッケージマネージャーオプションを拡張します
- ソリューションのNuGetパッケージを管理をクリックします

- または、ソリューションエクスプローラーを右クリック
- NuGetパッケージを管理をクリックします

さて、NuGetパッケージマネージャーウィンドウが開きます。 Google Cloud Vision OCRを検索してインストールをクリックします。

3.2. Google Vision APIネームスペースの追加
以下のネームスペースを追加してGoogle OCR Vision APIを使用してください:
using Google.Cloud.Vision.V1;using Google.Cloud.Vision.V1;また、JSONファイル形式でダウンロードされたキークレデンシャルで環境変数を設定します。
Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json");Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json");これで、すべて設定され使用準備が整いました。
4. 画像をテキストに変換
画像からデータを読み取ることは骨の折れる作業です。 画像の解像度と品質は、コンテンツを抽出する際に重要な役割を果たします。 両方のライブラリは、画像からテキストを抽出する光学文字認識(OCR)機能を提供します。
IronOCRは、進化したTesseractを使用してPDF文書形式からテキストを認識して読み取ることを可能にします。
IronOCRは、IronTesseractクラスを使えば、開発者が画像ファイルの内容を読み取るのを非常に簡単にします。 ここでは、PNG画像を使用して画像ファイルからテキストを読み取る方法を示し、コードは以下の通りです:
var ocr = new IronTesseract();
using (var input = new OcrInput())
{
// Add the image to be processed
input.AddImage("test-files/employmentapp.png");
// Process the image
var result = ocr.Read(input);
// Output the extracted text
Console.WriteLine(result.Text);
}var ocr = new IronTesseract();
using (var input = new OcrInput())
{
// Add the image to be processed
input.AddImage("test-files/employmentapp.png");
// Process the image
var result = ocr.Read(input);
// Output the extracted text
Console.WriteLine(result.Text);
}入力画像

出力

IronOCRの出力は与えられたオリジナル画像に一致します。 コードは簡潔でわかりやすく、技術的なことは何もありません。
4.2. Google OCRの使用
Google Cloud Vision OCRも様々なフォントで画像をテキストに変換します。 最初に、クレデンシャルファイルを使用してクライアントを作成する必要があります。その後、このクライアントオブジェクトを使用してDetectTextメソッドを呼び出し、注釈形式で応答を取得できます。 コードは以下の通りです:
Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json");
var client = ImageAnnotatorClient.Create();
var image = Google.Cloud.Vision.V1.Image.FromFile("test-files/employmentapp.png");
var response = client.DetectText(image);
foreach (var annotation in response)
{
if (annotation.Description != null)
{
Console.WriteLine(annotation.Description);
}
}Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", "key.json");
var client = ImageAnnotatorClient.Create();
var image = Google.Cloud.Vision.V1.Image.FromFile("test-files/employmentapp.png");
var response = client.DetectText(image);
foreach (var annotation in response)
{
if (annotation.Description != null)
{
Console.WriteLine(annotation.Description);
}
}両方のライブラリの出力を比較するために、同じ画像が入力として与えられます。

上記の出力からわかるように、IronOCRは画像の出力フォーマットを保持しています。 Google OCRは正確な出力テキストを提供しましたが、テーブルのフォーマットは保存されていません。 IronOCRは与えられた画像でのテーブルのフォーマットを正確に保存しています。
5. バーコードおよびQRコードからテキストへの変換
5.1. IronOCRの使用
IronOCRは画像を読み取る際にユニークで便利な機能を提供しており、バーコードとQRコードを読み取ることができます。 バーコードを検出し、その値を簡単に表示できます。 最初にReadBarCodes設定をtrueに設定し、OCR結果の各バーコードを反復処理します。 バーコードを読み取るコードは以下に示します:
var ocr = new IronTesseract();
ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
// Add the image to be processed
input.AddImage("test-files/Barcode.png");
// Process the image
var result = ocr.Read(input);
// Iterate and output barcode values
foreach (var barcode in result.Barcodes)
{
Console.WriteLine(barcode.Value);
}
}var ocr = new IronTesseract();
ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
// Add the image to be processed
input.AddImage("test-files/Barcode.png");
// Process the image
var result = ocr.Read(input);
// Iterate and output barcode values
foreach (var barcode in result.Barcodes)
{
Console.WriteLine(barcode.Value);
}
}入力画像

出力

入力内の3つのバーコードすべてが正常に読み取られ、その隠されたテキストが表示されます。
5.2. Google OCRの使用
Google Vision APIはまだこの機能を提供していません。 バーコードを読み取ることはソフトウェアアプリケーションに便利です。 しかし、Google OCRを使用すると、スキャンされたドキュメントから画像ファイルとしてテキストを取得できます。ラベル検出のコードは以下の通りです:
var client = ImageAnnotatorClient.Create();
var image = Google.Cloud.Vision.V1.Image.FromUri("gs://cloud-samples-data/vision/using_curl/shanghai.jpeg");
var labels = client.DetectLabels(image);
Console.WriteLine("Labels (and confidence score):");
Console.WriteLine(new String('=', 30));
foreach (var label in labels)
{
Console.WriteLine($"{label.Description} ({(int)(label.Score * 100)}%)");
}var client = ImageAnnotatorClient.Create();
var image = Google.Cloud.Vision.V1.Image.FromUri("gs://cloud-samples-data/vision/using_curl/shanghai.jpeg");
var labels = client.DetectLabels(image);
Console.WriteLine("Labels (and confidence score):");
Console.WriteLine(new String('=', 30));
foreach (var label in labels)
{
Console.WriteLine($"{label.Description} ({(int)(label.Score * 100)}%)");
}出力

6. PDFをテキストに変換
6.1. IronOCRを使用
IronOCRでPDFファイルを読み取るのは画像ファイルを読み取るのと同じくらい簡単です。 画像読み取りコードでAddImageメソッドをAddPdfに変更するだけで済みます。 コードは次の通りです:
var ocr = new IronTesseract();
using (var input = new OcrInput())
{
// Add the PDF to be processed
input.AddPdf("test-files/example.PDF");
// Process the PDF
var result = ocr.Read(input);
// Output the extracted text
Console.WriteLine(result.Text);
}var ocr = new IronTesseract();
using (var input = new OcrInput())
{
// Add the PDF to be processed
input.AddPdf("test-files/example.PDF");
// Process the PDF
var result = ocr.Read(input);
// Output the extracted text
Console.WriteLine(result.Text);
}出力
抽出されたテキストはPDFファイルと同じ形式で提供されます。

6.2. Google OCRを使用
Google OCRもPDF/TIFF文書からテキストを抽出する機能を提供します。 ただし、ファイルがGoogle Cloud Storageにある場合にのみテキストを検出します。 これにはGoogle Storageバケットを作成する必要があります。 C#用のコードは直ちに実装するのは難しく、非常に長いです。 C#でファイル内のテキストを検出するサンプルはありません。 参考としてJavaコードをご覧ください。
7. ライセンス
IronOCRは開発目的で無料ですが、商用利用にはライセンスが必要です。 すべての可能性を確認するための無料トライアルも提供されています。 Liteパッケージは特定の金額から始まり、無料トライアルが用意されています。 IronOCRは1年間の製品サポートとアップデートを無料で提供し、その後は1年で399ドルかかります。すべてのライセンスは永続的であり、一度の購入で隠れた料金はありません。 また、わずか1999ドルの一括購入でSaaSおよびOEM製品のロイヤリティフリーの再配布カバレッジを選択できます。 ライセンスパッケージと価格プランの詳細については、こちらのリンクをご覧ください。

Google Cloud Vision料金プランは、アプリケーションが画像に対して行う操作の数に基づいています。 PDFのように複数のページを持つファイルでは、各ページは1枚の画像として扱われます。 さらに、画像に適用される各機能は個別の請求単位です。 たとえば、同じ画像にテキスト検出とラベル検出を適用した場合、各機能は別々に請求されます。 料金プランは以下に示されており、詳細についてはこのリンクをご覧ください。

8. 結論
IronOCRは、私たちが知る限り、あらゆるプラットフォームで最も高度なTesseract APIをC#開発者に提供します。 IronOCRはWindows、Linux、Mac、Azure、AWS、Lambdaにデプロイでき、.NET Frameworkプロジェクトと.NET Standardおよび.NET Coreプロジェクトにも対応しています。 私たちはOCRスキャンでバーコードを読み取ることもでき、OCRをHTMLおよび検索可能なPDFとしてエクスポートすることもできます。
Google Cloud Vision APIは、高度なAIによって構築されたAPIです。 それは画像分析機能の多様な種類を提供し、MLアプリケーションの構築に非常に役立ちます。 開発者がAPIキーを使用してGoogle Cloudと直接通信することができるので、ファイルをローカルに保存する必要がありません。
IronOCRライセンスはユーザーベースであるため、製品を使用する開発者の数に基づいてライセンスを購入する必要があります。 Google Cloud Visionライセンスは情報を抽出し、データを分析するための画像の数に基づいています。 ライセンスは月ごとのもので、IronOCRライセンスと比較して多くの画像の価格が非常に高くなります。 さらに、IronOCRライセンスは一度の購入で生涯使用可能であり、OEMおよびSaaS配布もサポートしています。
全体として、両方のライブラリは機械学習の能力を持っています。 IronOCRは、C# .NETフレームワーク用に特に構築されており、高速で時間節約になるため、Google OCRよりも少し優れています。 非常に少ないコード行で全機能を提供し、開発者の負担を減らし、長いコードを書く必要がありません。 最も人気のあるTesseract 5 APIを基に構築されているため、画像や他のファイルフォーマットを正確に統合および分析するのが簡単です。 一方、Google Vision OCRはAIを基にしており、Java、Python、RESTにより焦点が当てられており、Google Cloudに接続されている場合にのみ実行できます。 これは、サーバーサイドから応答が返ってくるため、時間がかかる可能性があります。あなたの特定のニーズに応じてライブラリを選択することができます。
今、2つの価格で5つのIron製品が入手できます。Iron Suiteに含まれるツールは次の通りです:
- IronBarcode
- IronPDF
- IronOCR
- IronWebScraper
- IronWebscraper
こちらのリンクでさらに探索してください。
IronOCRをこちらからダウンロードできます。
よくある質問
C#を使用して画像をテキストに変換するにはどうすればよいですか?
IronOCRを使用して、Tesseract 5エンジンを利用して画像を機械可読テキストに変換できます。125以上の言語をサポートし、複数のプラットフォームと互換性があり、C#アプリケーションでのテキスト抽出に最適です。
IronOCRをバーコードとQRコードのスキャンに使用する利点は何ですか?
IronOCRは、画像とPDFをテキストに変換するだけでなく、バーコードとQRコードのスキャンにも優れています。迅速かつ正確なデータ抽出を提供し、包括的なOCR機能を必要とするアプリケーションにとって多用途のツールです。
IronOCRはどのように異なる言語を処理しますか?
IronOCRは125以上の言語をサポートし、カスタム言語サポートを提供します。この広範な言語互換性により、国際的なアプリケーションに対して高度に適応可能で、さまざまな言語でのテキスト認識を保証します。
C#プロジェクトにおけるIronOCRのインストール要件は何ですか?
C#プロジェクトにIronOCRをインストールするには、Visual StudioのNuGetパッケージマネージャを使用します。NuGetパッケージマネージャでIronOCRを検索し、インストールすることで、アプリケーションにOCR機能をシームレスに統合します。
IronOCRのライセンスモデルは、クラウドベースのOCRサービスとどのように比較されますか?
IronOCRは永久ライセンスを伴う一度の購入モデルを提供し、長期的価値を提供します。一方、Google Cloud VisionのようなクラウドベースのOCRサービスは通常、使用量に基づく料金モデルを使用し、高使用時には高価になる可能性があります。
IronOCRがサポートするプラットフォームは何ですか?
IronOCRは、Windows、Linux、Mac、Azure、AWS、Lambdaなどのさまざまなプラットフォームにデプロイ可能です。これは.NET Framework、.NET Standard、および.NET Coreプロジェクトをサポートし、さまざまな開発環境に対する多様性を提供します。
IronOCRはオフラインで機能できますか?
はい、IronOCRはオフラインで機能可能で、これはクラウドベースのソリューションに対する大きな利点です。この機能により、OCR処理がインターネット接続に依存せず、更なるコントロールとセキュリティを提供します。
IronOCRはOCR処理において精度と速度をどのように確保しますか?
IronOCRは高度なアルゴリズムとTesseract 5エンジンを活用して、高速かつ正確なOCR処理を提供します。その画像補正フィルタにより、テキスト認識の精度がさらに向上し、高品質のOCRタスクにおいて信頼性のある選択肢となります。

![Windows 10用ベストOCRソフトウェア:完全比較ガイド [2025]](/static-assets/ocr/blog/best-ocr-software-win-10/best-ocr-software-win-10-4.webp)






