フッターコンテンツにスキップ
他のコンポーネントと比較する

OCR API Microsoft Azure Vision とIronOCR: どちらがドキュメント画像をより適切に処理しますか?

光学式文字認識 (OCR) は、スキャンされたドキュメントやデジタル ドキュメントから印刷されたテキストや手書きのテキストを抽出する必要がある.NETアプリケーションにとって不可欠なものになっています。 OCR API Microsoft Azure Vision サービスとIronOCR はどちらも強力な OCR 機能を提供しますが、テキスト抽出に対するアプローチは根本的に異なります。 この記事では、これら 2 つのツールを比較し、精度、展開の柔軟性、言語サポート、コストといった最も重要な機能について、各 OCR エンジンのパフォーマンスを分析します。

無料のIronOCRトライアルを開始して、実際のプロジェクトでこれらの機能を並べてテストしてください。

フィーチャー Azure Vision OCR IronOCR
デプロイメント クラウド サービス (Azure AI サービス) ローカル.NETライブラリ (NuGet)
OCR対応言語 164+ (OCRモデルの読み取り) 言語パック経由125以上
サポートされているファイル形式 JPEG、PNG、BMP、PDF、TIFFファイル JPEG、PNG、GIF、BMP、TIFF、PDFファイル、複数ページのTIFF
手書きテキスト抽出 はい - 混合モード(印刷と手書き) はい — AdvancedScan拡張機能経由
価格 トランザクションごとの支払い(約 1.50 ドル/1,000 通話) 無料枠: 5,000/月 1 回限りの永久ライセンス。 取引ごとの手数料なし
データプライバシー Azureクラウドに送信された画像データ すべての処理はローカルで実行され、データはマシンから出ません

Microsoft はドキュメント画像からテキストを抽出するための OCR API を提供していますか?

はい。 Microsoft は、Azure Vision サービス (旧 Azure Cognitive Services、現在は Azure AI Services の一部) を通じて光学式文字認識 (OCR) を提供しています。 Read OCR モデルはこのオファリングの中核であり、一般的な画像分析用の Azure Vision と、PDF や TIFF ファイル、HTML ドキュメント、請求書などのスキャンされたデジタル ドキュメント用の Document Intelligence という 2 つの主要なパスをサポートしています。

Read API は、画像全体を含む画像を受け取り、認識されたテキスト行、単語、テキスト ブロック、境界ボックスの座標、および信頼スコアを返します。 英語、スペイン語、中国語(簡体字)、デーヴァナーガリー文字、ラテン文字、キリル文字、アラビア文字の複数の言語の印刷テキストをサポートします。 手書きテキストは英語といくつかの追加言語をサポートしています。 同期 API は単一の非ドキュメントの画像のみのシナリオを処理しますが、非同期バージョンはより大きなドキュメント画像を処理するための操作 ID を返します。

インテリジェントなドキュメント処理は、この基礎技術に基づいて構築されます。 Document Intelligence には、フォーム、領収書、請求書から構造、関係性、その他のドキュメント中心の洞察を抽出できる、ドキュメントに最適化されたバージョンの Read が含まれています。 この機能により、多くの一般的なワークフローで手動によるデータ入力が不要になります。

ローカル OCR エンジンとクラウドベースのテキスト抽出を比較するとどうなりますか?

アーキテクチャ上の最大の違いは、処理が行われる場所です。 Azure Vision は、すべての画像を Microsoft のサーバーに送信する必要があるクラウド サービスです。 IronOCR は、ネイティブ.NETライブラリとして完全にローカル マシン上で実行されるため、インターネット接続、API キー、呼び出しごとの料金は不要です。

IronOCR は、 .NET向けに最適化されたカスタムビルドの Tesseract 5 OCR エンジンを使用し、実際のドキュメント画像に対して最大 99.8% の精度を実現します。 ノイズ、歪み、解像度の問題を自動的に処理するイメージ前処理が組み込まれているため、スキャンしたテキスト、写真、道路標識、製品ラベル、低品質のスキャンから印刷されたテキストや手書きのテキストを読み取ります。

それぞれのアプローチによるテキスト認識は次のようになります。

Azure Vision OCR (C#)

// Azure Vision OCR — extract printed and handwritten text from an image
using Azure;
using Azure.AI.Vision.ImageAnalysis;
var client = new ImageAnalysisClient(
    new Uri("https://your-resource.cognitiveservices.azure.com"),
    new AzureKeyCredential("your-subscription-key"));
var result = await client.AnalyzeAsync(
    new Uri("https://example.com/document.png"),
    VisualFeatures.Read);
foreach (var block in result.Value.Read.Blocks)
    foreach (var line in block.Lines)
        Console.WriteLine(line.Text);
// Azure Vision OCR — extract printed and handwritten text from an image
using Azure;
using Azure.AI.Vision.ImageAnalysis;
var client = new ImageAnalysisClient(
    new Uri("https://your-resource.cognitiveservices.azure.com"),
    new AzureKeyCredential("your-subscription-key"));
var result = await client.AnalyzeAsync(
    new Uri("https://example.com/document.png"),
    VisualFeatures.Read);
foreach (var block in result.Value.Read.Blocks)
    foreach (var line in block.Lines)
        Console.WriteLine(line.Text);
$vbLabelText   $csharpLabel

Azure Vision 出力

OCR API Microsoft Azure Vision vs. IronOCR: どちらがドキュメント画像をより適切に処理しますか?: 画像 1 - OCR API Microsoft Azure Vision 出力

Azure アプローチには、アクティブな Azure サブスクリプション、プロビジョニングされた Computer Vision リソース、およびネットワーク接続が必要です。 すべての通話は課金対象の取引となります。 応答には、検出された単語ごとに境界ボックス データと信頼スコアのサポートを含むテキスト行が含まれており、スキャンされたテキストのデジタル バージョンにアクセスできます。 PDF、Office、HTML ドキュメントの OCR については、Microsoft では別の Document Intelligence Read エンドポイントを推奨しています。

IronOCR (C#)

// IronOCR — extract text locally from document images and PDFs
using IronOcr;
var ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
using var input = new OcrInput();
input.LoadImage("document.png");
input.LoadPdf("report.pdf");
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
// IronOCR — extract text locally from document images and PDFs
using IronOcr;
var ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
using var input = new OcrInput();
input.LoadImage("document.png");
input.LoadPdf("report.pdf");
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
$vbLabelText   $csharpLabel

IronOCR出力

OCR API Microsoft Azure Vision vs. IronOCR: どちらがドキュメント画像をより適切に処理しますか?: 画像 2 - IronOCR OCR 出力

IronOCRのAPIは、特に簡潔です。IronTesseractクラスはすべてのOCRエンジン設定を処理し、OcrInputは画像、 PDFファイル、複数ページのTIFFファイルを単一の統合ローダーで受け入れます。 OcrResult オブジェクトは、段落、テキスト行、単語、境界ボックスの座標、および各要素の信頼スコアを含む構造化データを返します。 Azure サブスクリプションやネットワークの依存関係は必要ありません。 混合言語で作業する開発者は、簡体字中国語からアラビア語、デーバナーガリー文字まですべてをカバーするNuGet言語パックを通じて国際言語を追加できます。

光学式文字認識において、より優れたデータ プライバシーとサポートされるファイル形式を提供するソリューションはどれですか?

OCR データのプライバシーに関しては、展開モデルが重要です。 Azure Vision は、すべての画像データを Microsoft のクラウド インフラストラクチャ上で処理します。 Microsoft の顧客データに関するポリシーには暗号化とコンプライアンス認証が含まれていますが、データは依然としてローカル環境から出ていきます。 Azure Vision では、オンプレミス展開のサポートが Docker コンテナーを通じて提供されますが、これは Read OCR モデルの以前の GA バージョン (v3.2) のみを対象としており、最新の機能は対象としていません。

IronOCR はすべてをローカルで処理します。 画像データ、スキャンされたテキスト、顧客データは開発マシンや本番マシンから一切外部に流出しません。これは、データセキュリティ要件が厳しい医療、法律、金融業界の機密文書を扱うアプリケーションにとって大きなメリットとなります。

ファイル形式の範囲に関しては、両方のソリューションとも一般的な画像形式と PDF ファイルを処理します。 IronOCR は、マルチページ/フレーム TIFF および GIF 、System.Drawing オブジェクト、およびストリームのネイティブ サポートを追加します。 Azure Vision は、個別の読み取りバージョン、ファイル サイズの制約が小さい画像のみのシナリオ用の同期 API、および大きな PDF および TIFF ファイル用の非同期ドキュメント インテリジェンスを通じて、それぞれのシナリオを処理します。 IronOCR、 OCR 結果を検索可能な PDF および hOCR HTML 出力としてエクスポートすることもできるため、プレーン文字列以外の形式で認識されたテキストにアクセスできるようになります。

OCR API は無料ですか?また価格はどのように比較されますか?

Microsoft の OCR クラウド API では、1 か月あたり約 5,000 件のトランザクションが無料レベル (F0) で提供されます。 Azure Visionサービスの標準プランでは、1,000トランザクションあたり約1.50ドルの料金がかかります。Document Intelligenceによる大量のインテリジェントドキュメント処理には、専用の料金プランがあります。 コストは直線的に増加し、毎日何千ものドキュメント画像を処理する本番アプリケーションでは、継続的な費用がかなり蓄積される可能性があります。

IronOCR は、トランザクションごとの料金やボリュームに結びついた定期的なコストのない、1 回限りの永久ライセンス モデルを使用します。 1 つのライセンスで、ローカルでの OCR 操作を無制限に実行できます。 両方の OCR API オプションを評価しているチームにとって、この通常得られるコスト上の利点は規模に応じて大幅に増大します。 IronOCR のライセンス オプションを調べて、個々の開発者、チーム、エンタープライズ展開の層を比較します。

考慮 Azure Vision OCR IronOCR
最適な用途 Azure エコシステムにすでに存在するクラウドネイティブ アプリ ローカルのオフラインOCR処理を必要とする.NETアプリ
注意してください 大規模なトランザクションごとのコスト。 クラウド依存 .NET環境が必要です。 フォーム/請求書AIが組み込まれていない
OCRの共通機能 印刷されたテキストと手書きのテキスト、信頼スコア、境界ボックス、混合言語の抽出 印刷されたテキストと手書きのテキストの抽出、信頼度スコア、境界ボックス、混合言語、バーコード/QR 読み取り

結論

Azure Vision OCR とIronOCR はどちらも、ドキュメント画像からテキストを抽出するための強力な光学文字認識機能を提供しますが、それぞれ異なるニーズに対応します。 Azure Visionは、Azureエコシステムに既に投資しており、より広範なクラウドサービスパイプラインの一部としてOCRを活用したユーザーエクスペリエンスを必要とするチームに最適です。IronOCRは、ローカル処理、予測可能な価格設定、そして画像の前処理テキスト抽出ワークフローの詳細な制御を備えた自己完結型OCRエンジンを必要とする.NET開発者にとって、より優れた選択肢となります。

スキャンされたドキュメントやデジタル ドキュメント全体で印刷されたテキストや手書きのテキストを処理するアプリケーションを構築する C# 開発者にとって、 IronOCR は、クラウド資格情報、ネットワーク遅延、または OCR 関連のトランザクション課金の管理のオーバーヘッドなしで必要なものすべてを提供します。

今IronOCRを始めましょう。
green arrow pointer

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me