フッターコンテンツにスキップ
他のコンポーネントと比較する

IrisによるOCRソフトウェアとIronOCRの比較

OCR(光学文字認識)は、デジタルファイル内のテキストを検出することを可能にします。 スキャンされた紙のドキュメントは、コンピュータによって常に画像ファイルとして保存されます。 これらの画像ファイル内のデータは、通常のテキストエディタやワード処理アプリケーションを使用しても、検索、編集、テキスト形式で保存することはできません。 OCR処理は、ユーザーによってさらに処理されるために、これらの画像を機械読取可能なテキストに変換するのに役立ちます。

この現代の時代、インターネット上で共有されるドキュメントは、デジタル形式であり、ほとんどがPDFまたは画像の形式です。 画像をテキストに変換するオンラインリソースが多数存在します。 しかし、ほとんどの企業は、この機能をソフトウェアアプリケーション内で必要とします。 これを念頭に置くと、ソフトウェア アプリケーションに埋め込むためのOCRソリューションを提供する多くのライブラリが存在します。

この記事では、C#向けの最も人気のある2つのOCRテクノロジーを比較します。

・IronOCR ・Iris OCR ソフトウェア

IronOCR

IronOCR for .NETは、画像とPDFをスキャン、検索、読み取るためのC#ライブラリです。 イメージまたはPDFファイルを入力として受け取り、最新のTesseract 5カスタムビルド.NET OCRエンジンを使用してテキスト、構造化データ、または検索可能なPDFドキュメントとして出力します。 そのTesseractは125言語以上対応しており、.NET Core、Standard、2.0から7までのクロスプラットフォームサポートがあります。

IronOCRは、C#開発者がIronTesseractクラスを使用して、画像を自動的にテキストに変換できるユーザーフレンドリーなAPIです。 スピード、正確さ、使いやすさを優先します。 また、トレーニング済みのモデルセットを使用してテキストを見つけるコンピュータ ビジョンAPIもサポートしています。

IronOCRのもう一つの強力な特徴は、すべての画像ファイルからバーコードおよびQRコードをスキャンし、そのテキストを読むことができることです。 IronOCRの他の重要な機能は以下の通りです。

特徴

国際言語: 125以上の言語とカスタム言語をサポートし、高速かつ高品質のパフォーマンス。 ・テキストとバーコードの読み取り: 複数の言語から同時にテキストと数字を読み取る。 ・専門書類: 領収書、小切手、請求書からのテキストを特に読み取る。 ・多くの形式からの読み取り: 画像(PNG、JPG、GIF、TIFF、BMP)、System.Drawing オブジェクト、ストリーム、およびPDF文書(最適化されたターゲットDPI)。 ・フィルター: フィルター ウィザード、画像補正、画像の向きを修正、画像の色を修正。 ・簡単なデータ出力: .NETテキスト文字列、バーコードおよびQRデータ、画像。

Iris OCR ソフトウェア

Iris OCR SDKは、アプリケーションが画像テキストを編集可能なファイルへ変換できるモジュラー ソフトウェア ツールキットで、他のテキスト認識サービスも提供します。 それは高性能と精度のある最速のプロフェッショナルOCRです。 Iris認識技術を使用すると、最新のスキャン、AIベースの文書分類、データ整合性、およびデータ抽出を含む、光学文字認識の最先端技術が得られます。

Iris OCRは多機能なSDKであり、画像改善のための強力な画像クリーニングツールも提供しています。 それはC++、C#、J#、およびVB.NETソフトウェア アプリケーションと簡単に統合できます。 IrisOCRは長期サポートを提供し、クロスプラットフォームで使用されるように設計されています。 それはまたOEMとSaaSアプリケーションをサポートしています。 Iris OCRは、柔軟な価格でグローバルなソリューションをビジネスに提供します。

特徴

入力形式: 画像(JPG、PNG、BMP、TIFF)、PDF(画像、テキスト)。 ・前処理: 画像改善、フォームクリーンアップ、パースペクティブ補正、品質評価。 ・テキスト認識: 137以上の異なる言語(ヨーロッパ、アジア、中東、フォーム特有)でのテキスト認識。 ・バーコード認識: 1Dおよび2Dバーコード認識(PDF417、QRコード、Code 39、UPCなど)。 ・出力形式: Office(DOCX、XLSX、PPT、RTF)、PDF(画像または検索可能なPDF)、画像形式(JPG、PNG、BMP、TIFF)、HTML、XML、TXT。

インストール

Visual Studio プロジェクトの作成

このチュートリアルでは、最新バージョンのVisual Studio 2022を使用します。 それで、C#用にすでにダウンロードおよびインストールしたと仮定します。 もしそうでない場合は、Visual Studioのウェブサイトからダウンロードできます。

次に、両方のライブラリを開始するためにコンソールプロジェクトを作成する必要があります。 次の手順でプロジェクトを作成します:

  • Visual Studio 2022を開きます。 ・新しいプロジェクトを作成をクリックします。

    Iris & IronOCRによるOCRソフトウェアの比較: 図1

・提供されたオプションからC# コンソール アプリケーションを選択し、次へをクリックします。

![Iris & IronOCRによるOCRソフトウェアの比較: 図2](/static-assets/ocr/blog/ocr-software-by-iris-alternatives/ocr-software-by-iris-alternatives-2.webp)
  • プロジェクトの名前と場所を設定します。 例: "OCRProject"。

    Iris & IronOCRによるOCRソフトウェアの比較: 図3

・追加情報として、安定したバージョンであるため、.NET 6.0 フレームワークを選択します。

![Iris & IronOCRによるOCRソフトウェアの比較: 図4](/static-assets/ocr/blog/ocr-software-by-iris-alternatives/ocr-software-by-iris-alternatives-4.webp)
  • "作成"をクリックすると、指定された場所にプロジェクトが作成されます。

IronOCRのインストール

IronOCRライブラリをインストールするには複数の方法があります。

1. Visual Studio NuGet パッケージ マネージャーの使用

NuGetはプロジェクトに依存関係をダウンロードおよびインストールするためのパッケージマネージャーです。 そのパッケージには、コンパイル済みのコード(DLL)およびマニフェスト ファイルが含まれています。以下の方法を使用してアクセスします。

・ツールタブをクリックします。

  • NuGetパッケージマネージャーオプションを展開します。
  • "ソリューション用のNuGetパッケージを管理"をクリックします。

    Iris & IronOCRによるOCRソフトウェアの比較: 図5

・または、ソリューション エクスプローラーを右クリックします。

  • "NuGetパッケージを管理"をクリックします。

    Iris & IronOCRによるOCRソフトウェアの比較: 図6

これで、NuGetパッケージマネージャーウィンドウが開きます。 IronOCRを検索し、インストールをクリック。

Iris & IronOCRによるOCRソフトウェアの比較: 図7

2. NuGet ウェブサイトからのダウンロード

NuGet公式ウェブサイトから直接ダウンロードできます。

  1. NuGetウェブサイトを訪問します。
  2. ページの右側にあるダウンロード パッケージ オプションをクリックします。
  3. ダウンロードしたパッケージを開くと、インストールが始まります。
  4. 最後にソリューションをリロードし、完了です。

3. IronOCRウェブページを使用したダウンロード

Iron Softwareのウェブサイトにアクセスし、.NET用のIronOCRのウェブページに移動します。 ページ下部にスクロールして、"DLLをダウンロード"または"Windowsインストーラーをダウンロード"をクリックします。

Iris & IronOCRによるOCRソフトウェアの比較: 図8

zipファイルがダウンロードされます。 プロジェクトファイルを抽出するか、Windowsインストーラを実行します。 それをプロジェクトに追加するための手順は以下の通りです:

  1. ソリューションエクスプローラーでプロジェクトの依存関係を右クリックします。
  2. 次に、プロジェクト参照の追加オプションを選択します。
  3. ダウンロードしたDLLファイルの場所に移動します。
  4. 最後に、OKをクリックしてプロジェクト参照を追加します。

4. Visual Studioのコマンド プロンプトを使用

  1. Visual Studioのツールタブに移動します。
  2. NuGetパッケージマネージャーオプションを展開します。
  3. パッケージマネージャーコンソールを選択し、以下のコマンドを入力します:

    Install-Package IronOcr

これにより、プロジェクトにIronOCRが自動的にダウンロードされてインストールされます。

5. 必要なIronOCRネームスペースの追加

必要なネームスペースは1つだけで、それをソースコードファイルの先頭に追加する必要があります。

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

これでプロジェクトでIronOCRを使用する準備が整いました。

Iris OCRのインストール

Iris OCRを使用する方法は多数あります。 小規模企業またはオフィス ソリューションをお探しの場合、OCRアプリを使用できます。このソフトウェアはこのリンクからダウンロードできます。

中・大規模のビジネス ソリューションを見つける場合は、Irisチームに連絡して、ニーズに応じた見積もりを取得する必要があります。 SDKとその他のドキュメントは、登録済みの顧客のみが利用できます。 開発環境でSDKを使用するには、このフォームを使用してアクセスをリクエストする必要があります。

ここでは比較のためにIris 17 OCRソフトウェアを使用します。 それはベースレベルですべての機能を提供し、IronOCRと比較することができます。 以下の手順に従って、Iris OCRソフトウェアをダウンロードしてインストールします。

  1. ソフトウェアをダウンロードしたら、ダブルクリックしてセットアップ ウィザードを開きます。

    Iris & IronOCRによるOCRソフトウェアの比較: 図9

  2. 次へをクリックし、インストール モードを選択します。
  3. 次に、どの言語からテキストを読み取るか選択します。

    Iris & IronOCRによるOCRソフトウェアの比較: 図10

  4. 次へをクリックし、Iris OCRをインストールします。

    Iris & IronOCRによるOCRソフトウェアの比較: 図11

  5. ソフトウェアのインストールが開始されます。 インストールが完了したら、完了をクリックしてIris OCRソフトウェアを開きます。

    Iris & IronOCRによるOCRソフトウェアの比較: 図12

すべて完了! 次に、比較本体に進みましょう。

比較

1. 画像からテキストへ

画像からデータを読み取ることは非常に面倒です。 画像の解像度と品質は、コンテンツの抽出時に重要な役割を果たします。 両方のライブラリは、画像からテキストを抽出するための光学文字認識機能を提供します。

1.1. IronOCRの使用

IronOCRの強力なIronTessaractクラスを使用すると、開発者は画像ファイルの内容を非常に簡単に読み取ることができます。 ここでは、PNG画像を使用して、画像ファイルからテキストを読み取りますが、コードは以下の通りです。

var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
' We use a using statement to ensure resources are freed after use
Using Input = New OcrInput()
	' Add the image from which you want to extract text
	Input.AddImage("test-files/employmentapp.png")
	' Perform OCR to read the text
	Dim Result = OCR.Read(Input)
	' Output the extracted text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel
入力画像

Iris & IronOCRによるOCRソフトウェアの比較: 図13

出力

Iris & IronOCRによるOCRソフトウェアの比較: 図14 - 画像出力

IronOCRの出力は、指定された元の画像と一致します。 コードはクリーンで技術的な詳細なしに理解しやすいです。

1.2. Iris OCRの使用

Iris OCRソフトウェアを使用すると、すべての紙のドキュメントをスキャンして、テキスト認識に使用できます。 Iris OCR技術を使用してテキストの抽出は非常に簡単です。 ホーム メニュー タブの"From File"から画像ファイルを選択します。 同じ画像を使用して、2つのソフトウェアの出力をテストし、比較します。

Iris & IronOCRによるOCRソフトウェアの比較: 図15

アップロードした画像に画像修正を適用できます。 出力ファイルタブでは、任意の形式を出力として選択できます。 Word、Excel、PDF、テキストファイルなど、複数の出力形式を提供します。任意の形式でファイルを保存し、抽出されたテキストを表示するために開きます。

出力

Iris & IronOCRによるOCRソフトウェアの比較: 図16

2つのソフトウェアの出力には明確な違いがあることがわかります。 IronOCRは、フォーマットを保持しながら画像から正確なテキストを抽出しました。 一方で、Iris OCRはフォーマットを保持しましたが、フルネームと電話番号が崩れています。

2. バーコードとQRコードからテキストへ

2.1. IronOCRの使用

IronOCRは画像を読む際にユニークで便利な機能を提供します、つまりバーコードやQRコードを読み取ることができます。 バーコードを検出し、その値を容易に表示できます。

そのためには、バーコード読み取り設定をtrueにして、OCR結果内の各バーコードを反復処理します。 バーコードを読むためのコードは以下に示されています:

var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Dim OCR = New IronTesseract()
OCR.Configuration.ReadBarCodes = True
' Using statement to automatically dispose of resources
Using input = New OcrInput()
	' Add the image to be processed
	input.AddImage("test-files/Barcode.png")
	' Read the OCR result
	Dim Result = OCR.Read(input)
	' Iterate through the barcodes detected and display their values
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
$vbLabelText   $csharpLabel
入力画像

Iris & IronOCRによるOCRソフトウェアの比較: 図17

出力

Iris & IronOCRによるOCRソフトウェアの比較: 図18

入力画像の3つのバーコードすべてが正常に読み取られ、その隠されたテキストが表示されました。

2.2. Iris OCRの使用

Iris OCRも、画像やPDFファイルからバーコードデータを抽出する機能を提供します。 ただし、バーコードの場合は、検出されるバーコード領域を手動で選択する必要があります。 ゾーンタブに移動して、認識されるバーコードを選択します。

選択された領域を右クリックしてデータとしてコピーし、それをWord処理ファイルに保存してデータを表示します。

Iris & IronOCRによるOCRソフトウェアの比較: 図19

この場合、Iris OCRソフトウェアは画像内にあるバーコードの背後に隠されたテキストを検出できません。

3. PDFからテキストへ

3.1. IronOCRの使用

PDFファイルを読むことは、IronOCRで画像を読むのと同じくらい簡単です。 画像読み込みコードでAddImageメソッドをAddPdfに変更するだけです。 コードは以下のようになります:

var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
' Using statement for resource management
Using Input = New OcrInput()
	' Add the PDF file to be processed
	Input.AddPdf("test-files/example.pdf")
	' Get the OCR results
	Dim Result = OCR.Read(Input)
	' Output the extracted text
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel
出力

抽出されたテキストはPDFファイルのフォーマットと同じです。

Iris & IronOCRによるOCRソフトウェアの比較: 図20

3.2. Iris OCRの使用

Irisソフトウェアを使用してPDFファイルを読むことも非常に簡単です。 それはすべてのデジタル形式をサポートし、PDFはその一つです。 Iris OCRソフトウェアを使用して検索可能な形式を作成することもできます。 PDFは紙のドキュメントであり、各ページは個別の画像ファイルとして扱われます。紙のドキュメントを From File オプションを使用して開きます。 テキストを抽出したいページ範囲を選択し、与えられたオプションから選択した任意の編集可能な形式で保存します。

Iris & IronOCRによるOCRソフトウェアの比較: 図21

出力

Iris & IronOCRによるOCRソフトウェアの比較: 図22

ライセンス

IronOCRは開発目的では無料ですが、商業的に使用するにはライセンスが必要です。 ニーズに適したすべての機能をテストするための無料トライアルも提供しています。 ライトパッケージは$799から始まり、30日間の返金保証が付いています。 IronOCRは1年分の商品サポートとアップデートを無料で提供し、その後は年間$399がかかります。 すべてのライセンスは永続的であり、一度購入するだけで隠れた費用はありません。 SaaSおよびOEM製品用のロイヤリティフリーの再配布カバレッジも選択でき、$1999の一度の購入で済みます。 ライセンスパッケージと価格プランの詳細についてはこちらをご覧ください。

Iris & IronOCRによるOCRソフトウェアの比較: 図23

Irisは10日間の無料バージョンを試用できるOCRソリューションです。 そのプロバージョンは$99から、協力版は$199から始まります。 SDKを本番モードで使用するには、営業担当者から見積もりを取得する必要があります。 C#や他の言語での開発用ライセンスが必要な場合はこちらから見積もりを取得してください。 プロと協力版の詳細や比較情報はこちらで確認できます。

Iris & IronOCRによるOCRソフトウェアの比較: 図24

結論

Iris & IronOCRによるOCRソフトウェアの比較: 図25

IronOCRは、C#開発者にとって、既知の中で最も高度なTesseract APIを提供します。どのプラットフォーム上でも利用可能です。 IronOCRは、Windows、Linux、Mac、Azure、AWS、およびLambdaに展開でき、.NET Frameworkプロジェクトだけでなく、.NET Standardおよび.NET Coreもサポートしています。 OCRスキャンでバーコードを読み取ったり、OCRをHTMLや検索可能なPDFとしてエクスポートしたりすることもできます。

Iris OCRソフトウェアはAI機能を備えており、WindowsとMacに対応しています。 そのSDKは複数のプログラミング言語で利用可能です。 Iris Proは、WindowsとMacのGUIアプリケーションとして、Iris OCR SDKの機能を搭載しています。 画像やPDFからテキストを読み取って、他の形式に出力することができます。 Irisソフトウェアを使用すると、ほんの数クリックで紙のドキュメントをすべてカスタマイズできます。

AWS Textractライセンスは、情報を抽出しデータを分析するための文書ページ数に基づいています。 Iris OCR開発ライセンスは、Irisウェブサイトで公開されていません。ライセンス情報を取得するには見積もりをリクエストする必要があります。 さらに、IronOCRライセンスは一度購入するだけであり、永久に使用できます。

全体として、両方のソフトウェアはAI技術を駆使してほとんどすべてのOCR機能を提供しますが、IronOCRはIris OCRに比べわずかに優位性があります。 速度、精度、全体的なパフォーマンスの点で、IronOCRは本番環境でより優れています。 高レベルの文字認識アプリケーションを作成するために、ほんの数行のコードを使用するだけです。 APIドキュメントは24時間年中無休で利用可能で、開発者にこのライブラリを気に入らせ、OCR ソリューションの第一選択肢としています。 そのフル機能を無料トライアルで試すことができます。

今、2つの価格で5つのIron製品を購入することができます。詳しくはこちらをご覧ください。

こちらからIronOCRをダウンロードして試してみてください。

ご注意Iris OCR ソフトウェアは、その所有者の登録商標です。 このサイトはIris OCRソフトウェアによる提携、承認、支援を受けていません。 すべての製品名、ロゴ、およびブランドは、それぞれの所有者の財産です。 比較は情報提供のみを目的としており、執筆時点で公開される情報に基づいています。

よくある質問

C#でOCRを使って画像をテキストに変換するにはどうすればよいですか?

IronOCRのReadメソッドを画像ファイルに使用すると、それらを機械可読テキストに変換できます。さまざまな画像形式と125以上の言語をサポートしています。

IronOCRライブラリはどの言語をサポートしていますか?

IronOCRは125以上の言語をサポートしており、テキストとバーコード認識のための広範な国際言語互換性を提供します。

OCRの結果を向上させるために画像品質を向上させる方法はありますか?

IronOCRには、画像のコントラスト、明るさ、解像度を自動的に調整してOCRの精度を向上させる組み込みの画像向上ツールが含まれます。

IronOCRはどの出力形式をサポートしていますか?

IronOCRはプレーンテキスト、PDF、およびXMLやJSONなどの構造化データ形式でテキストを出力できます。

購入前にIronOCRを試すことができますか?

はい、IronOCRは無料試用版を提供しており、開発者が商用ライセンスを購入する前にその機能とパフォーマンスを評価できます。

IronOCRのライセンスはどのように機能しますか?

IronOCRはシンプルなライセンスモデルを提供し、開発者ベースの永久ライセンスが一回購入で利用可能で、企業使用のオプションも含まれます。

IronOCRは本番環境に適していますか?

IronOCRはその速度、高精度、統合のしやすさ、そして堅牢な開発者サポートにより本番環境に非常に推奨されます。

IronOCRはバーコードとQRコードのスキャンをどのように行いますか?

IronOCRは組み込みのReadBarCodes機能を使用して画像からバーコードとQRコードをスキャンすることができ、設定で有効にすることができます。

IronOCRとIris OCRソフトウェアの主な違いは何ですか?

どちらも強力なOCR機能を提供しますが、IronOCRは使いやすさ、豊富なドキュメント、シンプルなライセンスで知られています。それに対して、Iris OCRはその速度と精度、モジュラーデザインで知られていますが、ライセンスの詳細については営業担当者に連絡が必要です。

IronOCRは.NET Core及び.NET Standardと統合可能ですか?

はい、IronOCRは.NET Coreと.NET Standardと完全に互換性があり、現代的な開発環境へのシームレスな統合を可能にします。

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。