IronOCRとAsprise OCRの比較
OCR とは、光学式文字認識を指します。 この用語は、ビジネスの世界では、テキストベースのドキュメント (スキャンまたは FAX されたページなど) の画像またはグラフィック表現を、コンピューター ソフトウェアを使用して編集可能な Word 形式またはテキスト検索可能なドキュメント形式に変換するプロセスを指すためによく使用されます。
OCR は光学式文字認識 (Optical Character Recognition) の略で、この目的のために特別に設計されたコンピュータ ソフトウェアによって実行されるタスクです。 このタイプのソフトウェアは、ページをスキャンしてそこに含まれるテキスト情報を認識し、それをデジタル形式に変換して、品質を損なうことなくデジタルで編集および再現できるようにします。
OCR にはさまざまな用途がありますが、最も一般的な使用例は、スキャンした文書をデータベースでフォーマットおよびインデックス付けして分析できるデジタル ファイルに変換することです。
この記事では、OCR および PDF ドキュメント画像用の最も一般的な 2 つのライブラリとアプリケーションを比較します。 以下のような方法です:
- アスプライズOCR
- IronOCR
1.0 はじめに
1.1 Asprise OCR の概要と機能
Asprise C# .NET OCR (光学式文字認識) およびバーコード認識 SDK は、スキャンしたドキュメントからテキストやバーコード情報を抽出する機能を C# .NET アプリケーション (Windows アプリケーション、Silverlight、ASP.NET Web サービス アプリケーション、ActiveX コントロールなど) に装備するための高性能 API ライブラリを提供します。
画像 (JPEG、PNG、TIFF、PDF などのさまざまな形式) を編集可能なドキュメント形式 (Word、XML、検索可能な PDF など) に変換できます。 Asprise Image Scanning SDK (スキャナーからドキュメントをキャプチャする) などの他の製品と併用することで、完全なドキュメント管理ソリューションを簡単に実装できます。
Asprise OCRの機能
正確なテキスト認識
強化された画像処理とテキスト検出アルゴリズムにより、Asprise OCR は画像品質の悪い難しい文書も簡単に認識できます。 パラメータを使用すると、速度よりも精度をわずかに優先することができます。
高速OCRエンジン
Asprise OCR は最適化された OCR エンジンを使用して、短時間で優れた認識を実行します。 マルチスレッドとオプションの GPU アクセラレーションにより、速度をさらに向上できます。
20以上の言語をサポート
Asprise OCR は、英語、スペイン語、フランス語、ドイツ語、イタリア語、ハンガリー語、フィンランド語、スウェーデン語、ルーマニア語、ポーランド語、マレー語、アラビア語、インドネシア語、ロシア語など 20 以上の言語を認識します。
すべての一般的なバーコード形式
一般的なバーコード形式はすべてサポートされています: EAN-8、EAN-13、UPC-A、UPC-E、ISBN-10、ISBN-13、Interleaved 2 of 5、Code 39、Code 128、PDF417、QR コード。
画像を検索可能なPDFに変換
数行のコードで、JPEG、PNG、TIFF、PDF などのさまざまな形式の画像を検索可能な PDF ファイルに変換できます。
簡単な導入
ソフトウェア保護ドングルやライセンス サーバーは必要ありません。 Asprise OCR SDK の導入は、開発と同じくらい簡単です。
予算に優しく、ロイヤリティフリー
ロイヤリティフリーとは、開発ライセンスを注文するときに料金を支払うことになりますが、ソフトウェアを何千台ものサーバーや何千人ものエンドユーザーに展開するときに再度料金を支払う必要がないことを意味します。
受賞歴のあるサポート
彼らのチームはフレンドリーなだけでなく、一流の技術サポートを提供することもできます。
1.2 IronOCR — 序論と特徴
IronOCR は、IronOCR for .NET を使用して .NET アプリや Web サイトの写真や PDF からテキスト コンテンツを読み取るエンジニア向けのソフトウェアを提供します。 写真のテキストとバーコードをスキャンし、世界中の多数の言語をサポートします。 その後、出力をプレーンテキストまたは構造化データのいずれかとして提供します。 Iron SoftwareのOCRライブラリは、MVC、ウェブ、コンソール、デスクトップアプリケーションの.NETで使用できます。 商業展開のためには、開発チームからの直接の支援とともにライセンスが提供されます。
- 最新のTesseract 5エンジンを使用し、IronOCRは任意の写真またはPDF形式からテキスト、バーコード、QRコードを読み取ります。 このライブラリは、デスクトップ、コンソール、ウェブアプリケーションにすばやくOCRを追加します。
- IronOCRは125の国際言語をサポートします。 カスタム言語や単語リストもサポートします。
- IronOCRは20以上のバーコード形式とQRコードを読み取ることができます。
- IronOCR は、複数ページの GIF および TIFF 画像形式をサポートしています。
- IronOCRは質の低いスキャン画像の補正を提供します。
- IronOCRはマルチスレッドをサポートしており、1つ以上のプロセスを同時に実行します。
- IronOCRはページ、段落、行、単語、文字などの構造化データ出力を提供することができます。
- IronOCRはWindows、Linux、macOSなどのさまざまなオペレーティングシステムをサポートしています。
2.0 Visual Studioで新しいプロジェクトを作成する
Visual Studioソフトウェアを開き、"ファイルメニュー"に進みます。 "新規プロジェクト"を選択し、"コンソールアプリケーション"を選択します。












よくある質問
光学文字認識とは何ですか?
光学文字認識(OCR)は、スキャンされた紙の文書、PDF、またはデジタルカメラで撮影された画像など、異なるタイプの文書を編集および検索可能なデータに変換するために使用される技術です。IronOCRのようなツールは、テキストの画像を実際のテキストデータに変換することにより、OCRを実行します。
C#を使用して画像をテキストに変換するにはどうすればよいですか?
IronOCRは、C#で画像をテキストに変換するための強力なソリューションを提供します。その強力なOCR機能を使用して、低品質の画像からでも、Tesseract 5エンジンを用いてテキストを処理し抽出できます。
IronOCRがOCR操作に対応しているフォーマットは何ですか?
IronOCRは、JPEG、PNG、GIF、BMP、TIFF、PDFを含む広範囲のフォーマットに対応しています。また、複数ページの文書やパスワード保護されたPDFも処理できます。
C#プロジェクトにIronOCRをインストールする方法は?
Visual StudioのNuGetパッケージマネージャを使用することで、C#プロジェクトにIronOCRをインストールできます。あるいは、コマンドラインでInstall-Package IronOCRを使用するか、IronOCRのウェブサイトから直接ダウンロードすることもできます。
他のOCRライブラリよりIronOCRを使用する利点は何ですか?
IronOCRは多言語サポート、低品質の画像に対する優れたパフォーマンス、バーコードやQRコード認識などの機能を提供します。費用対効果の高いライセンスを提供し、複数のプラットフォームを単一価格でサポートし、開発者にとって汎用性のある選択肢となります。
IronOCRは複数ページの文書を処理できますか?
はい、IronOCRはTIFFやPDFを含む複数ページの文書を処理し、各ページから効率的にテキストを抽出できます。これは、大量の文書やバッチ処理を扱う際に特に有用です。
IronOCRのライセンスオプションにはどのようなものがありますか?
IronOCRは柔軟な永続ライセンスオプションを提供しており、Lite、Professional、Unlimitedライセンスを含みます。これらのライセンスはロイヤリティフリーで、SaaSおよびOEMサービスをサポートし、さまざまな展開シナリオに適しています。
IronOCRは低品質の画像のテキスト抽出をどのように処理しますか?
IronOCRは、OCRを実行する前に画像品質を向上させる高度な前処理技術を利用して、低品質の画像からのテキスト抽出に優れています。これにより、テキスト認識の精度が大幅に向上します。






