他のコンポーネントと比較

IronOCRとAsprise OCRの比較

公開済み 2022年6月8日
共有:

OCRについて話すとき、それは光学文字認識を指します。 この用語は、ビジネスの世界でテキストベースのドキュメントの画像やグラフィカルな表現を変換するプロセスを指すためによく使用されます。 (例: スキャンされたページまたはファックスされたページ) コンピュータソフトウェアを利用して、編集可能なワード形式またはテキスト検索可能なドキュメント形式に変換する。

OCRという略語は、光学式文字認識(Optical Character Recognition)を意味し、このタスクは専用に設計されたコンピュータソフトウェアによって実行されます。 このタイプのソフトウェアはページをスキャンし、そこにあるすべてのテキスト情報を認識してデジタル形式に変換するため、品質を損なうことなく編集およびデジタルで再現することができます。

OCRには多くの用途がありますが、最も一般的な使用例は、スキャンした文書をデータベースにフォーマットしてインデックス付けし、分析できるデジタルファイルに変換することです。 他の例としては、手書きのメモをタイプしたメモに変換することや、名刺上のテキストを対応する連絡先情報に変換することが挙げられます。

この記事では、OCRおよびPDFドキュメントの画像処理においてよく使用される2つのライブラリとアプリケーションを比較します。 これらは:

  • アスプライスOCR
  • IronOCR

1.0 はじめに

Asprise OCR の導入および特徴

Asprise C# .NET OCR (光学文字認識) バーコード認識SDKは、C# .NET アプリケーションに装備するための高性能なAPIライブラリを提供します。 (Windowsアプリケーション、Silverlight、ASP.NETウェブサービスアプリケーション、ActiveXコントロールなど。) スキャンされたドキュメントからテキストおよびバーコード情報を抽出する機能と共に。

画像を変換することができます (JPEG、PNG、TIFF、PDFなどのさまざまな形式で) 編集可能なドキュメント形式に (ワード、XML、検索可能なPDFなど。). その他の提供製品、例えばAsprise Image Scanning SDKとともに (スキャナーからドキュメントをキャプチャする)、フルドキュメント管理ソリューションを簡単に実装できます。

Asprise OCRの特長

正確な文字認識

強化された画像処理およびテキスト検出アルゴリズムを搭載したAsprise OCRは、画像品質が悪い難解なドキュメントを容易に認識することができます。 パラメータを使用して、速度よりも精度を若干優先させることができます。

高速OCRエンジン

Asprise OCRは、最適化されたOCRエンジンを使用して、短時間で優れた認識を実行します。 マルチスレッドとオプションのGPUアクセラレーションによって、さらに速度を向上させることができます。

20以上の言語に対応

Asprise OCRは、英語、スペイン語、フランス語、ドイツ語、イタリア語、ハンガリー語、フィンランド語、スウェーデン語、ルーマニア語、ポーランド語、マレー語、アラビア語、インドネシア語、ロシア語など、20以上の言語を認識します。

すべての一般的なバーコード形式

すべての一般的なバーコード形式に対応しています:EAN-8、EAN-13、UPC-A、UPC-E、ISBN-10、ISBN-13、Interleaved 2 of 5、Code 39、Code 128、PDF417、そしてQR Code。

画像を検索可能なPDFへ

数行のコードで、JPEG、PNG、TIFF、PDFなどのさまざまな画像フォーマットを検索可能なPDFファイルに変換できます。

簡単なデプロイ

ソフトウェア保護ドングルやライセンスサーバーは不要です。 Asprise OCR SDKの展開は、その開発と同様に簡単です。

予算に優しい、ロイヤリティフリー

ロイヤリティフリーとは、開発ライセンスを注文する際に支払いをしますが、ソフトウェアを数千のサーバーや数千のエンドユーザーに展開するときには再度支払いを行う必要がないことを意味します。

受賞歴のあるサポート

彼らのチームは親切なだけでなく、一流の技術サポートを提供する能力も備えています。

1.2 IronOCR — 紹介と機能

IronOCRは、.NETアプリやウェブサイトで写真やPDFからテキストコンテンツを読み取るためにIronOCR for .NETを使用するエンジニア向けのソフトウェアを提供しています。 写真をテキストやバーコードのためにスキャンし、多数の世界中の言語をサポートします。 それは、プレーンテキストまたは構造化データとして出力を提供できます。 Iron SoftwareのOCRライブラリは、MVC、Web、コンソール、およびデスクトップの.NETアプリケーションで使用できます。 商業展開のためには、ライセンスは開発チームからの直接の支援を受けて提供されます。

  • 最新のTesseract 5エンジンを使用して、IronOCRは任意の画像やPDF形式からテキスト、バーコード、およびQRコードを読み取ります。 このライブラリは、デスクトップ、コンソール、ウェブアプリケーションに迅速にOCR機能を追加します。
  • IronOCRは127の国際言語をサポートしています。 また、カスタム言語および単語リストにも対応しています。
  • IronOCRは、20種類以上のバーコードフォーマットとQRコードを読み取ることができます。
  • IronOCRは、マルチページのGIFおよびTIFF画像フォーマットをサポートしています。
  • IronOCRは低品質なスキャン画像の補正を提供します。
  • IronOCRはマルチスレッドに対応しており、同時に1つ以上のプロセスを実行します。
  • IronOCRは、ページ、段落、行、単語、文字などの構造化データ出力を提供できます。
  • IronOCRは、Windows、Linux、macOSなどのさまざまなオペレーティングシステムをサポートしています。

Visual Studioで新しいプロジェクトを作成する

Visual Studioソフトウェアを開き、「ファイルメニュー」に移動します。 「新しいプロジェクト」を選択し、「コンソールアプリケーション」を選択します。

プロジェクト名を入力し、適切なテキストボックスにファイルパスを選択してください。 次に、作成ボタンをクリックし、以下のスクリーンショットのように必要な .NET Framework を選択します。

Visual Studio プロジェクトは、選択されたアプリケーションの構造を生成します。コンソール、Windows、およびウェブアプリケーションを選択した場合、program.cs ファイルが開かれ、ここでコードを入力し、アプリケーションをビルド/実行することができます。

次に、コードをテストするためにライブラリを追加します。

インストール 3.0

3.1 Asprise OCRのインストール

Asprise OCRをダウンロードできます これ.

以下の二つの方法から選択できます:NuGetを使用してインストールするか、SDKを手動でダウンロードする asprise.com.

オプション1: NuGet PM> Install-Package asprise-ocr-api

まず、新しい Visual C# / Visual Basic Windowsフォームアプリケーションプロジェクターを作成するか、既存のプロジェクトを使用します。 このソリューションを開いた状態で、 NuGet パッケージ マネージャー コンソール次のコマンドを入力してください:

Install-Package asprise-ocr-api

完了したら、次のコードをProgram.csにコピーして、OCRデモフォームを起動することができます。 (C#用):

static class Program 
{ 
    [STAThread]
    static void Main() {
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
static class Program 
{ 
    [STAThread]
    static void Main() {
        Application.EnableVisualStyles();
        Application.SetCompatibleTextRenderingDefault(false);
        Application.Run(new asprise_ocr_api.OcrSampleForm());
    }
}
Friend Module Program
	<STAThread>
	Sub Main()
		Application.EnableVisualStyles()
		Application.SetCompatibleTextRenderingDefault(False)
		Application.Run(New asprise_ocr_api.OcrSampleForm())
	End Sub
End Module
VB   C#

オプション2:Asprise.comからOCR SDKをダウンロード

アスプライスOCR SDKのコピーをダウンロードするには www.asprise.com/product/ocr. 空のフォルダに解凍するだけです。

Asprise OCR SDK配布のファイル構成は次のとおりです: もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。

OCR SDK (オーシーアール エスディーケー)

--- aocr.dll, aocr_x64.dll [必要なDLL]

サンプルプロジェクト [.NET APIおよびサンプルプロジェクト]

+--- 画像 [サンプル画像] もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。

サンプルプロジェクトフォルダに移動し、ソリューションファイル: ocr-samples-vs.slnを開いてください。 以下は日本語への翻訳です:

プロジェクトは2つあります:

  • asprise-ocr-api: .NET OCR API
  • asprise-ocr-api-sample:デモプログラム

    asprise-ocr-api-sampleプロジェクトを右クリックして「スタートアッププロジェクトとして設定」を選択し、「開始」ボタンをクリックするか、F5キーを押すと、同じUIが表示されます。

3.2 IronOCR のインストール

IronOCRライブラリは、4つの方法でダウンロードおよびインストールできます。

これらは:

  • Visual Studio を使用して
  • Visual Studio コマンドラインの使用。
  • NuGetウェブサイトから直接ダウンロードします。
  • IronPDFのウェブサイトから直接ダウンロード。

3.2.1 Visual Studioの使用

Visual Studioソフトウェアには、NuGetパッケージマネージャーオプションを使用してパッケージを直接ソリューションにインストールする機能があります。 以下のスクリーンショットは、NuGetパッケージマネージャーの開き方を示しています。

NuGetウェブサイトからパッケージのリストを表示するための検索ボックスを提供します。 パッケージマネージャーでは、以下のスクリーンショットのように、IronOCRというキーワードを検索する必要があります。

上記の画像から、関連する検索アイテムのリストを取得します。 ソリューションにパッケージをインストールするために必要なオプションを選択する必要があります。

3.2.2 Visual Studio コマンドラインの使用

Visual Studioで、ツール-> NuGet パッケージマネージャー -> パッケージマネージャーコンソールに移動します。

パッケージマネージャーコンソールタブに次の行を入力してください:

Install-Package IronOcr

次に、パッケージが現在のプロジェクトにダウンロード/インストールされ、使用可能になります。

3.2.3 NuGetウェブサイトからの直接ダウンロード

3つ目の方法は、ウェブサイトから直接NuGetパッケージをダウンロードすることです。

  • 以下に移動します リンク.
  • 右側のメニューからダウンロードパッケージオプションを選択してください。
  • ダウンロードしたパッケージをダブルクリックしてください。 自動的にインストールされます。
  • 次に、ソリューションをリロードして、プロジェクトで使用を開始します。

3.2.4 IronOCRウェブサイトからの直接ダウンロード

クリックしてください リンク 最新版のパッケージをウェブサイトから直接ダウンロードするにはこちらをクリックしてください。ダウンロード後、以下の手順に従ってパッケージをプロジェクトに追加してください。

  • ソリューションウィンドウからプロジェクトを右クリックします。
  • その後、オプションのリファレンスを選択し、ダウンロードしたリファレンスの場所を参照してください。
  • 次に、「OK」をクリックしてリファレンスを追加します。

4.0 OCRイメージ

IronOCRとAsprise OCRの両方には、画像をテキスト検索へ変換するOCR技術があります。

アスプライスの使用

Asprise OCRライブラリを使用する場合は、次の手順に従います:

  1. Asprise OCRライブラリをインストールします。
  2. OCRプロセスを実行するためのコードを作成します。
  3. OCR出力を解析し、必要に応じて結果を処理します。

具体的な例やドキュメントについては、Aspriseの公式ウェブサイトを参照してください。

以下のコードは、Asprise OCRの基本的な使用方法を示しています。

using asprise_ocr_api;
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
Console.WriteLine("OCR Result: " + s);
// process more images here ...
ocr.StopEngine();
using asprise_ocr_api;
AspriseOCR.SetUp();
AspriseOCR ocr = new AspriseOCR();
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST);
string s = ocr.Recognize("C:\\path\\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT);
Console.WriteLine("OCR Result: " + s);
// process more images here ...
ocr.StopEngine();
Imports asprise_ocr_api
AspriseOCR.SetUp()
Dim ocr As New AspriseOCR()
ocr.StartEngine("eng", AspriseOCR.SPEED_FASTEST)
Dim s As String = ocr.Recognize("C:\path\img.jpg", -1, -1, -1, -1, -1, AspriseOCR.RECOGNIZE_TYPE_ALL, AspriseOCR.OUTPUT_FORMAT_PLAINTEXT)
Console.WriteLine("OCR Result: " & s)
' process more images here ...
ocr.StopEngine()
VB   C#

Asprise OCRは、次の画像形式に対応しています: GIF、PNG、JPEG、TIFF、PDF。 上記のセクションのサンプルOCRコードでは、入力は以下のようになります:

OCR出力はプレーンテキスト形式になります: もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。

Asprise OCRとバーコード認識

Windows上で高性能なロイヤリティフリーのOCRおよびバーコード認識

...

ISBN-l3、インターリーブド 2 オブ 5、コード 39、コード 128、PDF417、QRコード。

[[QRコード: www.asprise.com]]

[[CODE-128: Asprise]]. もちろんです!翻訳したいコンテンツを提供してください。それに従って正確な日本語訳を提供いたします。

以下の2行はバーコード情報の抽出を表しています。 バーコードの形式と内容の両方が ‘’ で囲まれています[[ ]]ペア。

4.2 IronOCRの使用

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage(@"3.png");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Console.ReadKey();
}
Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("3.png")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Console.ReadKey()
End Using
VB   C#

Tesseract 5 APIは、画像ファイルをテキストに変換することを可能にするものであり、上記に示されています。 上記のコード行でIron Tesseractのオブジェクトを作成しています。 また、複数の画像ファイルを追加できるようにする OcrInput オブジェクトも作成します。 コード内でOcrInputオブジェクトのメソッドaddを利用する際には、利用可能な画像パスを指定する必要があるかもしれません。 任意の枚数の画像を追加できます。 前に構築したIrontesseractオブジェクトの「Read」関数は、画像ファイルを解析して結果をOCR結果に抽出することで、画像を取得するために利用できます。 写真からテキストを抽出して文字列に変換することができます。

また、Tesseractを使用してマルチフレーム画像を追加することもできます。 「AddMultiFrameTiff」は、この操作用の異なるメソッドです。 Tesseractライブラリは画像の各フレームを読み取り、各フレームは別個のページとして扱われます。 このプロセスは画像の最初のフレームを読み取り、その後、次のフレームへと進行し、すべてのフレームがスキャンされるまで続行します。 このメソッドでサポートされているのはTiff画像形式のみです。

上記の画像はIronOCRの結果の出力であり、データを正確に編集可能なテキストに変換しました。

OCR PDFファイル 5.0

IronOCRとAsprise OCRはPDFファイルを編集可能なテキストに変換します。 Asprise OCRは、ユーザーにページの保存、画像の編集、ページの認識などのオプションを提供します。また、テキスト、ドキュメント、HTML形式などとして保存するオプションも提供します。IronOCRも、変換されたOCRファイルをHTML、テキスト、PDFなどとして保存することを可能にします。

5.1 Asprise OCRの使用

出力フォーマットを OUTPUT_FORMAT_PDF に設定する場合、対象となるPDF出力ファイルを次のように指定する必要があります:

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf
PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  "PROP_PDF_OUTPUT_FILE=ocr-result.pdf
PROP_PDF_OUTPUT_TEXT_VISIBLE=true");
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, "PROP_PDF_OUTPUT_FILE=ocr-result.pdf PROP_PDF_OUTPUT_TEXT_VISIBLE=true")
VB   C#

上記のコードでは、プロパティが1つの文字列内で区切り文字によって指定されています。 (キーと値が = で区切られている). また、プロパティをペアで個別に指定することもできます。

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF,
  AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf",
  AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, true);
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PDF, AspriseOCR.PROP_PDF_OUTPUT_FILE, "ocr-result.pdf", AspriseOCR.PROP_PDF_OUTPUT_TEXT_VISIBLE, True)
VB   C#

テキストを不可視または透明にするには、PROP_PDF_OUTPUT_TEXT_VISIBLE を「false」に設定するだけです。 標準のPDFおよびPDF/Aの両方がサポートされています。 Asprise OCRプロパティ概要を参照してください。 出力形式をOUTPUT_FORMAT_RTFに設定します。 次に、ほとんどのワードプロセッサで編集可能な .rtf ファイルを出力することができます。 (Microsoft Word、Libre Office、TextEdit など。).

ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\\test-image.png", -1, -1, -1, -1, -1,
  Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF,
  "PROP_RTF_OUTPUT_FILE=ocr-result.rtf");
ocr.Recognize("C:\test-image.png", -1, -1, -1, -1, -1, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_RTF, "PROP_RTF_OUTPUT_FILE=ocr-result.rtf")
VB   C#

OCRが完了したら、ワードプロセッサを使用してRTFファイルを表示または編集できます。

以下のメソッドを使用して、PDF入力ファイルでOCRを実行します:

5.2 IronOCRの使用

PDFファイルを管理するためにOCRInputを使用することもできます。 各ページのドキュメントは Iron Tesseract クラスによって読み取られます。 テキストはその後、ページから抽出されます。 以下の「AddPDF」という機能を使用して保護されたドキュメントを開くこともできます。この機能により、PDFをドキュメントリストに追加することができます。 (パスワードで保護されている場合). 以下のコードは、パスワードで保護されたPDFドキュメントを開く方法を示しています:

var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract(); // nothing to configure
using (var Input = new OcrInput())
{
    Input.AddPdf("example.pdf", "password");
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract() ' nothing to configure
Using Input = New OcrInput()
	Input.AddPdf("example.pdf", "password")
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

PDFドキュメントの単一ページからコンテンツを読み取り抽出するには、「Addpdfpage」を使用します。抽出したいテキストを指定するために必要なのは、ページ番号のみです。 「AddPdfPage」を使用すると、指定した多数のページからテキストを抽出することができます。 IEnumerable内で、複数のページを簡単に指定できます。 ファイルの場所と拡張子も含める必要があります。次のコード例でこれが示されています:

IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
IEnumerable<int> numbers = new List<int> {2,8,10 };
 var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    //single page
    Input.AddPdfPage("example.pdf",10);
    //Multiple page
    Input.AddPdfPages("example.pdf", numbers);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
    Result.SaveAsTextFile("ocrtext.txt");
}
Dim numbers As IEnumerable(Of Integer) = New List(Of Integer) From {2, 8, 10}
 Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	'single page
	Input.AddPdfPage("example.pdf",10)
	'Multiple page
	Input.AddPdfPages("example.pdf", numbers)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
	Result.SaveAsTextFile("ocrtext.txt")
End Using
VB   C#

SaveAsTextFile関数を使用すると、結果をテキストファイルとして保存でき、ファイルを出力ディレクトリパスにダウンロードすることができます。 また、SaveAsHocrFile を使用してファイルを HTML ファイルとして保存することもできます。

6.0 その他の機能

6.1 Asprise OCRの使用

Asprise OCRには、Draw Text Area、Draw Picture Area、Draw Table Area、Draw Recognize Areaなどの追加オプションがあります。これらすべてがユーザーのOCRのパフォーマンス向上に役立ちます。 アプリケーションはOCRを実行するだけでなく、PDFの結合、PDFの分割、PDFの編集などの操作も行うことができます。

6.2 IronOCRの使用

IronOCRには、スキャンされたドキュメントからバーコードやQRコードを読み取るためのユニークな機能が備わっています。 以下のコードは、指定された画像やドキュメントからバーコードを読み取る方法を示しています。

var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
var Ocr = new IronTesseract(); // nothing to configure
Ocr.Language = OcrLanguage.EnglishBest;
Ocr.Configuration.ReadBarCodes = true;
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;
using (var Input = new OcrInput())
{
    Input.AddImage("barcode.gif");
    var Result = Ocr.Read(Input);

    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Dim Ocr = New IronTesseract() ' nothing to configure
Ocr.Language = OcrLanguage.EnglishBest
Ocr.Configuration.ReadBarCodes = True
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5
Using Input = New OcrInput()
	Input.AddImage("barcode.gif")
	Dim Result = Ocr.Read(Input)

	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
VB   C#

上記のコードは、指定された画像やPDFドキュメントからバーコードを読み取るのに役立ちます。 それは、ページや画像から複数のバーコードを読み取ることができます。 バーコードを読み取るために、IronOCRには独自の設定であるOcr.Configuration.ReadBarCodesがあり、これがバーコードの読み取りを支援します。 デフォルト値はfalseに設定されています。

入力を読み取った後、データはOCRResultと呼ばれるオブジェクトに保存されます。 これは「Barcodes」というプロパティを持っており、リストとして利用可能なすべてのバーコードデータが含まれます。for-eachループを使用することで、バーコードの詳細を一つずつ取得できます。 また、バーコードをスキャンし、その値を読み取る操作を1つのプロセスで完了します。

それはまた、スレッドオプションもサポートします。 複数のOCRプロセスを一度に実行することができます。IronOCRは指定された領域から特定のエリアを認識することもできます。

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
} 
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    Input.Add("document.png", ContentArea);
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
} 
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	Input.Add("document.png", ContentArea)
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

以下は特定の領域でOCRを実行するためのサンプルコードです。 画像またはPDF内の矩形領域を指定するだけで十分です。 IronOCRのTesseractエンジンは、テキストを認識するのに役立ちます。

7.0 IronOCRおよびAsprise OCRのライセンスモデルと価格設定

IronOCRのライセンスモデルと価格

30日間返金保証: ライセンスを購入すると、ライセンスが機能しない場合に30日間の返金を受けることができます。

簡単な統合:IronOCRのプロジェクトおよび環境との統合は非常に簡単で、NuGetパッケージから1行のコードを書いて追加するだけで済みます。 または、ウェブからダウンロードして、環境に統合することもできます。

永久ライセンス: 各ライセンスは一度購入すると、更新の必要がありません。

無料サポートと製品アップデート:すべてのライセンスには、製品の背後にいるチームから1年間の無料製品アップデートとサポートが含まれます。 拡張機能をいつでも購入することが可能です。 拡張機能を表示できます。

即時ライセンス: 支払いが確認され次第、登録済みのライセンスキーが送信されます。

すべてのライセンスは永続的であり、開発、ステージング、および運用に適用されます。

ライトライセンス:

  • 1開発者
  • 1 つの場所
  • 1 プロジェクト
  • 永久ライセンス

    このパッケージは、組織内の単一のソフトウェア開発者が単一の場所でIron Softwareを利用できるようにします。 Iron Softwareは、単一のWebアプリケーション、イントラネットアプリケーション、またはデスクトップソフトウェアプログラムで使用できます。 ライセンスは譲渡不可能であり、組織外または代理店/クライアント関係外で共有することはできません。このライセンスタイプは、すべての他のライセンスタイプと同様に、OEMリディストリビューションおよび追加カバレッジの購入なしでのIron SoftwareをSaaSとして使用することを含め、契約で明示的に許可されていないすべての権利を明示的に除外します。

    価格: 年間 $749 から。

    Professional License

  • 10人の開発者
  • 10 個のロケーション
  • 10プロジェクト
  • 永久ライセンス

    このパッケージは、単一の場所で最大10人のソフトウェア開発者がIron Softwareを利用できるようにするものです。 Iron Softwareは、任意の数のウェブサイト、イントラネットアプリケーション、またはデスクトップソフトウェアアプリケーションに使用できます。ライセンスは譲渡不可能であり、組織外またはエージェンシー/クライアント関係を越えて共有することはできません。このライセンスタイプは、他のすべてのライセンスタイプと同様に、OEM再配布および追加のカバレッジを購入することなくIron SoftwareをSaaSとして利用することを含む、契約に明示的に規定されていないすべての権利を明示的に除外します。 このライセンスは、最大10個の単一プロジェクトに統合することができます。

    価格: 年間$999から。

    Unlimited License(無制限ライセンス):

  • 無制限の開発者
  • 無制限の場所
  • 無制限プロジェクト
  • 永久ライセンス

    これは、組織内の無制限の数のソフトウェア開発者が無制限の場所でIron Softwareを利用できることを許可します。 Iron Softwareは、任意の数のウェブサイト、イントラネットアプリケーション、またはデスクトップソフトウェアアプリケーションに使用できます。ライセンスは譲渡不可能であり、組織外またはエージェンシー/クライアント関係を越えて共有することはできません。このライセンスタイプは、他のすべてのライセンスタイプと同様に、OEM再配布および追加のカバレッジを購入することなくIron SoftwareをSaaSとして利用することを含む、契約に明示的に規定されていないすべての権利を明示的に除外します。

    価格: 年間$2999から。

    ロイヤリティフリーの再配布: これにより、さまざまな形でパッケージされた商業製品の一部としてIron Softwareを再配布することができます。 (ロイヤリティを支払う必要がなく) ベースライセンスでカバーされるプロジェクトの数に基づいて。 基本ライセンスがカバーするプロジェクト数に基づいて、SaaSソフトウェアサービス内でIron Softwareの展開を可能にします。

    価格: 年間$1599から。

Asprise OCRのライセンスモデルと価格設定

ライトライセンス:

  • 無制限エンドユーザー
  • テキストを認識する
  • 1次元バーコードの読み取り:UPC、EAN、Code39、Code128
  • テキスト、XML、PDF出力
  • 簡単なデプロイメント
  • 2つのOSのみをサポート
  • シート 1
  • サポート: なし

    価格: 年間 $7498 から開始します。

    スタンダードライセンス:

  • 無制限エンドユーザー
  • BMP、GIF、PNG、JPEG、TIFF、およびPDFの入力。
  • テキストを認識する
  • 1次元バーコードの読み取り:UPC、EAN、Code39、Code128
  • 2Dを読み取る: QRとData Matrixのみ
  • テキスト、XML、およびPDF出力
  • 簡単なデプロイメント
  • サポート: なし

    価格: 年間 $7998から開始

    エンタープライズライセンス:

  • 無制限エンドユーザー
  • BMP、GIF、PNG、JPEG、TIFF、およびPDFの入力。
  • テキストを認識する
  • 1次元バーコードの読み取り:UPC、EAN、Code39、Code128
  • 2D: QR、PDF 417、Data Matrix、Aztec
  • テキスト、XML、およびPDF出力
  • 簡単なデプロイメント
  • マルチスレッド、マルチプロセッシング

    価格: $12,998から開始。

    IronOCR Lite の一人の開発者向けパッケージに1年間のサポートが含まれており、費用は約 $749 です。これに対して、Asprise Lite の一人の開発者向けパッケージは技術サポートなしで $7498、技術サポート付きで $6296 です。 IronOCRのProfessional Licenseは、10人の開発者パッケージと1年間の技術サポートが含まれており、価格は$999です。一方、同等のAspriseライセンスは、10人の開発者パッケージと技術サポート無しで年間$37,998、技術リリースと更新、1年のサポートが含まれた場合の価格は$46,999.00となります。

IronOCRのLiteおよびProfessionalパッケージには、SaaSサービスまたはOEMと5年間のサポートオプションが含まれています。 Liteバージョンには、5年間のサポートとSaaSおよびOEMサービスを含む1つの開発者パッケージが含まれており、価格は$2897USDです。一方、AspriseはSaaSまたはOEMサービスとカスタマイズされたサポートオプションを提供しています。 IronOCR Professionalバージョンには、10人の開発者パッケージと1年間の有料サポートおよびSaaSとOEMサービスが含まれており、費用は$3,397です。一方、1年間のサポートなしの10人の開発者パッケージおよびSaaSとOEMサービスが含まれるAspriseバージョンの費用は$59,996.00です。

8.0 結論

.NET FrameworkコンテキストでのIronOCRは、単純で使いやすいTesseractを提供します。 多様な方法で写真およびPDFドキュメントをサポートします。 また、Tesseract OCRライブラリのパフォーマンスを向上させるためのいくつかの設定も提供しています。 さまざまな言語がサポートされており、単一の操作で多数の言語を処理することができます。 Tesseract OCRについて詳しく知るには、彼らのウェブサイトを訪れてください。

Aspriseは、人工知能エンジンを使用して画像およびPDFドキュメントを認識するソフトウェアアプリケーションです。 また、OCRプロセスのパフォーマンスを向上させるためのさまざまな設定を提供します。 さらに、複数の言語を選択するオプションが提供されています。 Aspriseにはページ変換の使用にいくつかの制限があります。 それぞれのオペレーティングシステムに対して異なる価格が設定されています。

IronOCRパッケージは、Aspriseと比較してより優れたライセンスサポートを提供します。Asprise OCRには、カスタマイズされた固定パッケージがあり、より高価です。IronOCRは$749から始まり、Asprise OCRは年間$7494から始まりますので、私たちの製品はコスト効率が高く、さらに多くの機能も提供しています。また、単一の価格で複数のプラットフォームをサポートしています。

では、何を待っているのですか? 無料トライアルはすべての方がご利用可能です。 以下のリンクから取得できます ライセンス 今すぐここで始めましょう。

< 以前
IronOCR と Leadtools OCR の比較 1. **性能**: - **IronOCR**:IronOCRは印刷されたテキストと手書きテキストの両方で優れた精度を示し、多言語サポートを提供します。 - **Leadtools OCR**:Leadtools OCRも高い精度を誇りますが、特定の言語やフォントのサポートに制限があります。 2. **使いやすさ**: - **IronOCR**:IronOCRは簡単に統合できるため、開発者にとって使いやすいです。また、.NET環境でシームレスに動作します。 - **Leadtools OCR**:Leadtools OCRも使いやすいインターフェースを提供しますが、利用に関するドキュメントを探すのが難しいことがあります。 3. **機能**: - **IronOCR**:多様なイメージフォーマットをサポートし、.NET環境で直接利用可能です。PDFやスキャンされた画像からテキストを抽出する機能も充実しています。 - **Leadtools OCR**:画像からのテキスト抽出に加え、バッチ処理や複合ドキュメントの処理など、高度な機能を提供します。 4. **価格**: - **IronOCR**:IronOCRは一連のライセンスオプション(Lite License、Plus License、Professional License、Unlimited License)を提供し、コストパフォーマンスに優れています。 - **Leadtools OCR**:Leadtools OCRの価格は機能やライセンスの範囲に応じて異なります。費用効果が高いとは言えない場合もあります。 5. **サポート**: - **IronOCR**:包括的なドキュメントと優れたカスタマーサポートが提供されており、問題解決が迅速に行えます。 - **Leadtools OCR**:サポートは充実していますが、応答時間が遅い場合があります。 総じて、IronOCRはその使いやすさ、性能、サポートの面で優れており、特に.NET環境での利用に最適です。Leadtools OCRも多機能で優れた製品ですが、特定のニーズに応じた詳細な比較検討が必要です。