他のコンポーネントと比較

IrisとIronOCRによるOCRソフトウェアの比較

Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

カンナパット・ウドンパント

2023年5月16日

共有:

OCR - 光学文字認識は、デジタルファイル内のテキストを検出することを可能にします。スキャンされた紙の書類は常にコンピューターによって画像ファイルとして保存されます。これらの画像ファイルに含まれるデータは、通常のテキストエディタやワープロソフトを使用しても、検索、編集、またはテキスト形式で保存することはできません。 OCR処理は、これらの画像を機械可読なテキストに変換し、ユーザーによるさらに処理できるようにします。

現代において、インターネット上で共有されるドキュメントはデジタル形式であり、ほとんどがPDFや画像の形式です。画像をテキストに変換するオンラインリソースがいくつか利用可能です。しかし、ほとんどの企業は自社のソフトウェアアプリケーションにこの機能を必要とします。これを念頭に置いて、ソフトウェアアプリケーションに組み込むためのOCRソリューションを提供する多くのライブラリがあります。

この記事では、C＃用の最も人気のある2つのOCR技術を比較します：

IronOCR
アイリスOCRソフトウェア

イントロダクション

IronOCR

IronOCR for .NETは、画像やPDFをスキャン、検索、読み取るためのC#ライブラリです。それは画像または PDF ファイルを入力として受け取り、最新の Tesseract 5 カスタムビルド .NET OCR エンジンを使用して、テキスト、構造化データ、または検索可能な PDF ドキュメントを出力します。そのTesseractは、125以上の言語に対応しており、.NET CoreおよびStandard 2.0から7までのクロスプラットフォームをサポートしています。

IronOCRは、C#開発者がIronTesseractクラスを使用することで、画像を自動的にテキストに変換できるユーザーフレンドリーなAPIです。それは速度、正確さ、使いやすさを優先します。また、トレーニング済みのモデルセットを用いてテキストを見つけるためにコンピュータビジョンAPIを支援します。

IronOCR のもう一つの強力な機能は、すべての画像ファイルからバーコードおよび QR コードをスキャンして、そのテキストを読み取ることができることです。 IronOCRのその他の重要な機能は以下の通りです。

機能

国際言語: 125以上の言語とカスタム言語サポートで高品質かつ高速なパフォーマンス
テキストとバーコードの読み取り: 複数の言語から同時にテキストと数字を読み取る
専門文書: レシート、小切手、請求書からのテキストを特に読み取ります。
多くの形式から読み取る: 画像 (PNG、JPG、GIF、TIFF、BMP)、System.Drawingオブジェクト、ストリーム、およびPDF文書（最適化されたターゲットDPI）
フィルター: フィルターウィザード、画像補正、画像の向き修正、画像の色調修正
シンプルなデータ出力: .NETのテキスト文字列、バーコード、QRデータ、画像

アイリスOCRソフトウェア

Iris OCR SDKは、画像内のテキストを編集可能なファイルに変換し、その他のテキスト認識サービスを提供するためのモジュール式ソフトウェアツールキットです。それは高性能で高精度な最速のプロフェッショナルOCRです。虹彩認識技術を使用することで、光学文字認識における最先端の技術を手に入れることができます。これには、最新のスキャンニング、AIベースの文書分類、データの整合性、およびデータ抽出が含まれます。

Iris OCRは、画像強化のための強力な画像クリーニングツールも提供する、機能豊富なSDKです。 C++、C#、J#、VB.NETのソフトウェアアプリケーションに簡単に統合できます。 IrisOCRは長期サポートを提供し、クロスプラットフォームで使用できるように設計されています。 OEMおよびSaaSアプリケーションにも対応しています。 Iris OCRは、柔軟な価格設定でグローバルソリューションを提供し、企業を支援します。

機能

入力フォーマット: イメージ (JPG, PNG, BMP, TIFF)、PDF (イメージ、テキスト)
前処理：画像の改善、フォームのクリーンアップ、パースペクティブの修正、品質評価
テキスト認識: 137以上の異なる言語（ヨーロッパ、アジア、中東、フォーム固有）でテキストを認識します
バーコード認識: 1Dおよび2Dバーコードの認識（PDF417、QRコード、Code 39、UPCなど）
出力形式: Office (DOCX, XLSX, PPT, RTF), PDF (イメージまたは検索可能なPDF), 画像形式 (JPG, PNG, BMP, TIFF), HTML, XML, TXT

インストール

Visual Studio プロジェクトの作成

このチュートリアルでは、最新バージョンのVisual Studio 2022を使用します。では、既にC#用にダウンロードしてインストール済みであると仮定します。そうでない場合は、Visual Studio のウェブサイトからダウンロードできます。

次に、両方のライブラリを使用するためのコンソールプロジェクトを作成する必要があります。プロジェクトを作成する手順に従ってください:

Visual Studio 2022 を開いてください。
「Create a New Project」をクリックしてください。
与えられたオプションからC# コンソールアプリケーションを選択し、[次へ]をクリックします。
新しいプロジェクトに名前と場所を設定してください。例：OCRプロジェクト
追加情報については、最も安定したバージョンである .NET 6.0 フレームワークを選択してください。
次に、「作成」をクリックすると、プロジェクトが指定した場所に作成されます。

IronOCRのインストール

IronOCRライブラリをインストールする方法はいくつかあります。

1. Visual Studio NuGet パッケージマネージャーの使用

NuGetは、プロジェクト内の依存関係をダウンロードしてインストールするためのパッケージマネージャーです。そのパッケージには、コンパイル済みコード（DLL）とマニフェストファイルが含まれています。以下の方法でアクセスしてください：

ツールタブをクリックしてください
NuGetパッケージマネージャーオプションを拡張する
ソリューションの NuGet パッケージを管理をクリックします
もしくは、Solution Explorer を右クリック
NuGet パッケージの管理をクリック

さて、NuGetパッケージマネージャーウィンドウが開きます。 IronOCRを検索して、インストールをクリックします。

2. NuGetウェブサイトからダウンロード

それはNuGet公式ウェブサイトから直接ダウンロードできます。

リンクをクリックしてください: ""。
ページの右側にあるダウンロードパッケージオプションをクリックしてください。
ダウンロードしたパッケージを開くと、インストールが開始されます。
最後にソリューションをリロードすると完了です。

以下の方法でIronOCRのウェブページからダウンロードしてください:

Iron Softwareのウェブサイトにアクセスし、IronOCR for .NETのウェブページに移動してください。下までスクロールして、「Download DLL」または「Download Windows installer」をクリックしてください。

IrisとIronOCRによるOCRソフトウェアの比較：図8

Zipファイルがダウンロードされました。プロジェクトファイルを抽出するか、Windowsインストーラーを実行してください。以下の手順に従って、プロジェクトに追加してください。

ソリューションエクスプローラーからVisual Studioのプロジェクトの依存関係を右クリックします。
次に、オプションの「Add Project Reference」を選択します。
ダウンロードしたDLLファイルの場所を参照します。
最後に、「OK」をクリックしてプロジェクト参照を追加します。

4. Visual Studioでコマンドプロンプトを使用する

Visual Studioの[ツール]タブに移動します。
NuGetパッケージマネージャーのオプションを拡張する。
パッケージマネージャーコンソールを選択し、次のコマンドを入力してください:

    Install-Package IronOcr

    Install-Package IronOcr

SHELL

これにより、プロジェクトにIronOCRが自動的にダウンロードおよびインストールされます。

5. 必要なIronOCR名前空間の追加

必要な名前空間は1つだけであり、機能にアクセスするためにソースコードファイルの先頭に追加する必要があります。

using IronOcr;

using IronOcr;

Imports IronOcr

$vbLabelText $csharpLabel

さて、プロジェクトでIronOCRを使用する準備が整いました。

Iris OCRのインストール

Iris OCRを使用する方法は多岐にわたります。小規模なビジネスやオフィス向けのソリューションをお探しの場合、OCRアプリを使用することができます。ソフトウェアはこのリンクからダウンロードできます。

中規模から大規模なビジネスソリューションをお探しの場合は、Irisチームに連絡してニーズに合わせた見積もりを取得する必要があります。 SDKやその他のドキュメントは、登録済みのお客様のみご利用いただけます。開発環境でSDKを使用するには、このフォームを使用してアクセスをリクエストする必要があります。

ここでは比較の目的でIris 17 OCRソフトウェアを使用します。それは基本的なレベルですべての機能を提供し、IronOCRと比較して使用することができます。次の手順に従って、Iris OCRソフトウェアをダウンロードおよびインストールしてください:

ソフトウェアをダウンロードしたら、セットアップウィザードを開くためにダブルクリックしてください。
「次へ」をクリックし、インストールモードを選択してください。
次に、読み取りたいテキストの言語を選択してください
「次へ」をクリックしてIris OCRをインストールします
ソフトウェアのインストールが開始されます。インストールが完了したら、「終了」をクリックし、Iris OCR ソフトウェアを開いてください。

すべて完了！それでは、比較に移りましょう。

比較

1. 画像からテキストへ

画像からデータを読み取る作業は非常に骨の折れる仕事です。コンテンツを抽出する際には、画像の解像度と品質が重要な役割を果たします。両方のライブラリは、画像からテキストを抽出するための光学文字認識機能を提供します。

1.1. IronOCRの使用

IronOCRは強力なIronTessaractクラスを使用して、開発者が画像ファイルの内容を非常に簡単に読み取ることができます。ここでは、PNGイメージを使用して画像ファイルからテキストを読み取ります。コードは次のとおりです。


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddImage("test-files/employmentapp.png");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddImage("test-files/employmentapp.png");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }

Dim OCR = New IronTesseract()
	Using Input = New OcrInput()
		Input.AddImage("test-files/employmentapp.png")
		Dim Result = OCR.Read(Input)
		Console.WriteLine(Result.Text)
	End Using

$vbLabelText $csharpLabel

入力画像

IrisのOCRソフトウェアとIronOCRの比較: 図13

出力

IrisによるOCRソフトウェアとIronOCRの比較: 図14 - 画像出力

IronOCRの出力は、提供された元の画像と一致します。コードはクリーンで、技術的な複雑さがなく理解しやすいです。

1.2. Iris OCRの使用

Iris OCRソフトウェアは、すべての紙文書をスキャンしてテキスト認識に使用することができます。 Iris OCR技術を使用してテキスト抽出は非常に簡単です。ホームメニュータブの「From File」から画像ファイルを選択してください。同じ画像を使用して、2つのソフトウェアの出力をテストおよび比較します。

Iris による OCR ソフトウェアと IronOCR の比較: 図 15

アップロードされた画像に画像補正を適用することができます。出力ファイルタブで、任意のフォーマットを出力として選択できます。複数の出力形式、例えばWord、Excel、PDF、テキストファイルなどを提供します。ファイルを任意の形式で保存し、抽出されたテキストを表示するために開いてください。

出力

IrisによるOCRソフトウェアとIronOCRの比較: 図16

二つのソフトウェアの出力には明確な違いがあることがわかります。 IronOCRはフォーマットと共に画像から正確なテキストを抽出しました。一方、Iris OCRは書式設定を保持しましたが、フルネームと電話番号が混乱しています。

バーコードおよびQRコードからテキストへ

2.1. IronOCRの使用

IronOCRは画像を読み取る際にユニークで有用な機能を提供します。つまり、バーコードやQRコードを読み取ることができます。バーコードを検出し、その値を簡単に表示できます。

そのためには、バーコード読み取りの設定を true にし、次に OCR の結果に含まれる各バーコードを反復処理します。バーコードを読み取るコードは以下のとおりです:


    var OCR = new IronTesseract();
    OCR.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput()){   
        input.AddImage("test-files/Barcode.png");   
        var Result = OCR.Read(input);   
        foreach (var Barcode in Result.Barcodes){
                Console.WriteLine(Barcode.Value);
        }
    }


    var OCR = new IronTesseract();
    OCR.Configuration.ReadBarCodes = true;
    using (var input = new OcrInput()){   
        input.AddImage("test-files/Barcode.png");   
        var Result = OCR.Read(input);   
        foreach (var Barcode in Result.Barcodes){
                Console.WriteLine(Barcode.Value);
        }
    }

Dim OCR = New IronTesseract()
	OCR.Configuration.ReadBarCodes = True
	Using input = New OcrInput()
		input.AddImage("test-files/Barcode.png")
		Dim Result = OCR.Read(input)
		For Each Barcode In Result.Barcodes
				Console.WriteLine(Barcode.Value)
		Next Barcode
	End Using

$vbLabelText $csharpLabel

入力画像

Iris製OCRソフトウェアとIronOCRの比較: 図17

出力

IrisによるOCRソフトウェアとIronOCRの比較: 図18

入力画像のすべてのバーコードが正常に読み取られ、その隠されたテキストが表示されます。

2.2. IRIS OCRの使用

Iris OCRは、画像またはPDFファイルからバーコードデータを抽出する機能も提供します。ただし、バーコードの場合、検出するバーコードのエリアを手動で選択する必要があります。ゾーンタブに移動し、認識するバーコードを選択します。

選択した領域を右クリックしてデータとしてコピーし、ワープロファイルに保存してデータを表示します。

IrisによるOCRソフトウェアとIronOCRの比較: 図19

この場合、Iris OCRソフトウェアは画像内のバーコードの背後にある隠しテキストを検出できません。

3. PDFからテキストへ

3.1. IronOCRの使用

PDFファイルの読み取りは、IronOCRで画像ファイルを読み取るほど簡単です。画像読み込みコードで、AddImage メソッドを AddPDF に変更するだけです。コードは次のようになります：


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddPdf("test-files/example.pdf");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }


    var OCR = new IronTesseract();
    using (var Input = new OcrInput()){
        Input.AddPdf("test-files/example.pdf");
        var Result = OCR.Read(Input);
        Console.WriteLine(Result.Text);
    }

Dim OCR = New IronTesseract()
	Using Input = New OcrInput()
		Input.AddPdf("test-files/example.pdf")
		Dim Result = OCR.Read(Input)
		Console.WriteLine(Result.Text)
	End Using

$vbLabelText $csharpLabel

出力

抽出されたテキストは、PDFファイルと同じフォーマットです。

Iris社のOCRソフトウェアとIronOCRの比較: 図20

3.2. IRIS OCRの使用

Irisソフトウェアを使用すると、PDFファイルの読み取りも非常に簡単です。それはすべてのデジタル形式をサポートしており、その中の一つにPDFがあります。 Iris OCRソフトウェアを使用して検索可能な形式を作成することもできます。 PDFは紙の文書であり、各ページは別々の画像ファイルとして扱われます。From Fileオプションを使用して紙の文書を開きます。抽出したいテキストのページ範囲を選択し、与えられたオプションから任意の編集可能な形式で保存します。

アイリスによるOCRソフトウェアとIronOCRの比較：図21

出力

IrisとIronOCRによるOCRソフトウェアの比較: 図22

ライセンス

IronOCRは開発目的には無料で使用できますが、商業利用にはライセンスが必要です。また、すべての機能をお試しいただける無料トライアルも提供しています。ライトパッケージは$749からの30日間の返金保証付きで開始します。 IronOCRは、1年間の製品サポートとアップデートを無料で提供し、その後は毎年$399の料金がかかります。すべてのライセンスは永久であり、一回限りの購入となり、隠れた料金はありません。 SaaSおよびOEM製品のロイヤリティフリー再配布カバレッジも、単回購入価格$1999で選択できます。ライセンスパッケージと価格プランの詳細については、こちらをご覧ください。

IrisとIronOCRによるOCRソフトウェアの比較: 図23

Irisは、10日間の無料試用版が利用可能なOCRソリューションです。プロバージョンは$99からで、協力バージョンは$199から始まります。SDKをプロダクションモードで使用するには、営業担当者から見積もりを取得する必要があります。C#または他の言語開発用にライセンスを取得したい場合は、こちらから見積もりを取得してください。プロバージョンと共同バージョンの詳細情報と比較は、こちらから確認できます。

Iris社とIronOCRによるOCRソフトウェアの比較: 図24

結論

IrisによるOCRソフトウェアとIronOCRの比較: 図25

IronOCRは、C#開発者に対して、私たちが知る限りあらゆるプラットフォーム上で最も高度なTesseract APIを提供します。 IronOCR は、Windows、Linux、Mac、Azure、AWS、および Lambda にデプロイでき、.NET Framework プロジェクトだけでなく、.NET Standard や .NET Core もサポートしています。我々はOCRスキャンの中でバーコードを読み取ることができ、さらにOCR結果をHTMLや検索可能なPDFとしてエクスポートすることもできます。

アイリスOCRソフトウェアはAI機能を備えており、WindowsおよびMacと互換性があります。そのSDKは、複数のプログラミング言語に対応しています。 Iris Proには、WindowsおよびMacに対応するIris OCR SDKの機能がGUIアプリケーションとして備わっています。画像やPDFからテキストを読み取り、他のフォーマットに出力することができます。数回のクリックだけで、Irisソフトウェアを使って、すべての紙のドキュメントをカスタマイズすることもできます。

IronOCRのライセンスは開発者ベースであり、製品を使用する開発者の人数に基づいてライセンスを購入する必要があります。 Iris OCR開発ライセンスはIrisのウェブサイトに公開されていません。ライセンス情報の見積もりをリクエストする必要があります。さらに、IronOCRのライセンスは一度の購入で、永久に使用することができます。

全体的に、どちらのソフトウェアもAI技術を用いたほとんどすべてのOCR機能を提供していますが、IronOCRにはIris OCRに対してわずかな優位性があります。速度、精度、および全体的な性能において、IronOCRは本番環境で優れています。高レベルなテキスト認識アプリケーションを作成するために、ほんの数行のコードを使用するだけです。 APIドキュメントは24時間365日利用可能であるため、開発者はこのライブラリを愛用し、OCRソリューションの第一選択としています。その完全な機能を無料トライアルでテストできます。

今、5つのIron製品を2つの価格で購入できます。詳細については、このリンクをご覧ください。

こちらからIronOCRをダウンロードしてお試しください。

カンナパット・ウドンパント

今すぐエンジニアリングチームとチャット

ソフトウェアエンジニア

ソフトウェアエンジニアになる前に、カンナパットは日本の北海道大学から環境資源学の博士号を取得しました。学位を取得する過程で、カンナパットはバイオプロダクション工学部に所属する車両ロボティクス研究所のメンバーにもなりました。2022年には、C#のスキルを活かしてIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。カンナパットは、IronPDFで使用されているコードの大部分を作成した開発者から直接学べることに価値を見いだしています。同僚との学び合いに加えて、Iron Softwareで働くことの社会的側面も楽しんでいます。コードやドキュメントを書いていない時には、カンナパットは通常、PS5でゲームをしたり、『The Last of Us』を再視聴したりしています。

< 以前
Google OCRとIronOCRの比較

次へ >
IronOCRとNanonets OCRの比較