フッターコンテンツにスキップ
他のコンポーネントと比較する

IrisによるOCRソフトウェアとIronOCRの比較

OCR - 光学文字認識はデジタルファイル内のテキストを検出することを可能にします。 スキャンされた紙の文書は、コンピュータによって常に画像ファイルとして保存されます。 これらの画像ファイル内のデータは、通常のテキストエディタやワードプロセッシングアプリケーションを使用しても検索、編集、またはテキスト形式で保存することはできません。 OCR処理は、これらの画像をユーザーによるさらなる処理のために機械可読テキストに変換するのを手助けします。

この現代では、インターネット上で共有される文書はデジタル形式であり、主にPDFや画像の形で提供されます。 画像をテキストに変換するオンラインリソースはたくさんあります。 しかし、多くの企業はこの機能をソフトウェアアプリケーションに組み込む必要があります。 これを念頭に置いて、ソフトウェアアプリケーションに組み込むためのOCRソリューションを提供する多くのライブラリがあります。

この記事では、C#の最も人気のあるOCR技術の2つを比較します:

  • IronOCR
  • Iris OCR Software

IronOCR

IronOCR for .NET は、画像とPDFをスキャン、検索、読み取るためのC#ライブラリです。 それは画像やPDFファイルを入力として取り、最新のTesseract 5カスタムビルド.NET OCRエンジンを使用して、テキスト、構造化データ、または検索可能なPDF文書を出力します。 そのTesseractは、125以上の言語で使用可能であり、.NET Core、Standardでのクロスプラットフォームサポートがあります(2.0から7まで)。

IronOCR は、C#開発者が IronTesseract クラスを使用するだけで、自動的に画像をテキストに変換できるユーザーフレンドリーなAPIです。 それはスピード、正確さ、および使いやすさを優先します。 また、コンピュータビジョンAPIが訓練済みのモデルセットを用いてテキストを見つけるのを助けます。

IronOCRのもう1つの強力な機能は、すべての画像ファイルからバーコードやQRコードをスキャンしてそのテキストを読み取ることができることです。 IronOCRのその他の重要な機能は以下の通りです。

特徴

  • 国際言語: 125以上の言語とカスタム言語のサポートで、高速かつ高品質のパフォーマンスを提供。
  • テキストとバーコードの読取り: 複数言語のテキストと数字を一度に読み取る。
  • 専門文書: 特に領収書、小切手、請求書からのテキストを読み取ります。
  • 多くの形式から読む: 画像(PNG, JPG, GIF, TIFF, BMP), System.Drawing オブジェクト, ストリーム, PDF文書 (最適化されたターゲットDPI)。
  • フィルター: フィルターウィザード、画像修正、画像の向きの修正、画像の色修正。
  • シンプルなデータ出力: .NETテキスト文字列、バーコード、QRデータ、画像。

Iris OCR Software

Iris OCR SDK は、画像テキストを編集可能なファイルに変換するモジュラーソフトウェアツールキットであり、他のテキスト認識サービスを提供します。 それは高性能と高精度を持つ最も高速なプロフェッショナルOCRです。 Iris認識技術を使用すると、最先端のスキャニング、AIを利用した文書分類、データ整合性、データ抽出を含む光学文字認識のための最も高度な技術が得られます。

Iris OCRは機能豊富なSDKであり、画像強化のための強力な画像クリーニングツールも提供します。 C++, C#, J#, VB.NETのソフトウェアアプリケーションと簡単に統合できます。 IrisOCRは長期的なサポートを提供し、クロスプラットフォームで使用するように設計されています。 OEMおよびSaaSアプリケーションもサポートしています。 Iris OCRは、グローバルなソリューションを柔軟な価格で提供することにより、企業を支援します。

特徴

  • 入力フォーマット: イメージ(JPG, PNG, BMP, TIFF), PDF (画像、テキスト)。
  • 事前処理: 画像強調、フォームのクリーンナップ、遠近修正、品質評価。
  • テキスト認識: 137以上の異なる言語を認識 (ヨーロッパ、アジア、中東、フォーム特定)。
  • バーコード認識: 1Dおよび2Dバーコード認識 (PDF417, QRコード, Code 39, UPC など)。
  • 出力フォーマット: オフィス文書(DOCX, XLSX, PPT, RTF), PDF(画像または検索可能なPDF), 画像フォーマット(JPG, PNG, BMP, TIFF), HTML, XML, TXT。

インストール

Visual Studio プロジェクトの作成

このチュートリアルでは、最新バージョンの Visual Studio 2022 を使用します。 したがって、すでにC#用にダウンロードしてインストールしていることを前提とします。 ない場合は、Visual Studioのウェブサイトからダウンロードできます。

これから、両方のライブラリを使用して開始するためにコンソールプロジェクトを作成する必要があります。 プロジェクトを作成する手順に従ってください:

  • Visual Studio 2022を開きます。
  • 新しいプロジェクトを作成をクリックします。

    Iris & IronOCR ソフトウェア比較: 図 1

  • 指定されたオプションから C# コンソール アプリケーションを選択し、[次へ] をクリックします。

    Iris & IronOCR ソフトウェア比較: 図 2

  • プロジェクトを名前と場所で設定します。 例:"OCRProject"。

    Iris & IronOCR ソフトウェア比較: 図 3

  • 追加情報として、最も安定したバージョンである .NET 6.0 フレームワークを選択します。

    Iris & IronOCR ソフトウェア比較: 図 4

  • これで、作成をクリックすると、プロジェクトは指定した場所に作成されます。

IronOCRのインストール

IronOCRライブラリをインストールするには複数の方法があります。

1. Visual Studio の NuGet パッケージ マネージャーを使用する

NuGetはプロジェクトに依存関係をダウンロードしてインストールするためのパッケージマネージャーです。 そのパッケージにはコンパイル済みのコード (DLL) およびマニフェスト ファイルが含まれています。次の方法を使用してアクセスします:

  • [ツール] タブをクリックします。
  • NuGetパッケージマネージャオプションを拡張します。
  • ソリューションのNuGetパッケージを管理をクリックします。

    Iris & IronOCR ソフトウェア比較: 図 5

  • または、[ソリューション エクスプローラー] を右クリックします。
  • NuGetパッケージの管理をクリックします。

    Iris & IronOCR ソフトウェア比較: 図 6

さて、NuGetパッケージマネージャーウィンドウが開きます。 IronOCRを検索してインストールをクリックします。

Iris & IronOCR ソフトウェア比較: 図 7

2. NuGet 公式サイトからのダウンロード

NuGet公式ウェブサイトから直接ダウンロードすることができます。

  1. NuGet ウェブサイト を訪問します。
  2. ページ右側のダウンロードパッケージオプションをクリックします。
  3. ダウンロードしたパッケージを開くとインストールが始まります。
  4. 最後にソリューションをリロードして完了です。

3. IronOCRのWebページを使用してダウンロード

Iron SoftwareのWebサイトにアクセスし、.NETのIronOCRのWebページに移動するだけです。 ページの下部までスクロールし、DLLをダウンロードまたはWindowsインストーラーをダウンロードをクリックします。

Iris & IronOCR ソフトウェア比較: 図 8

Zipファイルがダウンロードされます。 プロジェクトファイルを抽出するか、Windowsインストーラーを実行します。 プロジェクトに追加するには、以下の手順に従ってください。

  1. ビジュアルスタジオのソリューションエクスプローラーからプロジェクトの依存関係を右クリックします。
  2. 次に、プロジェクトリファレンスの追加オプションを選択します。
  3. ダウンロードしたDLLファイルの場所を参照します。
  4. 最後に、プロジェクト参照の追加をクリックしてOKを押します。

4. Visual Studioでコマンドプロンプトを使用する

  1. Visual Studioのツールタブに移動します。
  2. NuGetパッケージマネージャーオプションを拡張します。
  3. パッケージマネージャーコンソールを選択し、以下のコマンドを入力します:

    Install-Package IronOcr

これにより、プロジェクトにIronOCRが自動的にダウンロードおよびインストールされます。

5. 必要なIronOCRの名前空間の追加

機能にアクセスする必要があるソースコードファイルの上部に追加する必要のある唯一の名前空間があります。

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

さて、プロジェクトでIronOCRを使用する準備が整いました。

Iris OCRのインストール

Iris OCRを使用する方法は数多くあります。 小さなビジネスやオフィス用ソリューションをお探しの場合は、OCRアプリを使用できます。ソフトウェアはこのリンクからダウンロードできます。

中規模から大規模のビジネスソリューションを見つけたい場合は、Irisチームに連絡してニーズに応じた見積もりを取得する必要があります。 SDKやその他のドキュメンテーションは、登録者のみに提供されています。 開発環境でSDKを使用するには、このフォームを使用してアクセスをリクエストする必要があります。

ここでは、比較目的でIris 17 OCRソフトウェアを使用します。 すべての機能が基本レベルで提供されており、IronOCRと比較して使用できます。 Iris OCRソフトウェアをダウンロードしてインストールするための次のステップは次のとおりです:

  1. ソフトウェアがダウンロードされたら、ダブルクリックしてセットアップウィザードを開きます。

    Iris & IronOCR ソフトウェア比較: 図 9

  2. 次へをクリックし、インストールモードを選択します。
  3. 次に、テキストを読み取る言語を選択します。

    Iris & IronOCR ソフトウェア比較: 図 10

  4. 次へをクリックしてIris OCRをインストールします。

    Iris & IronOCR ソフトウェア比較: 図 11

  5. これでソフトウェアのインストールが始まります。 インストール完了後、終了をクリックしてIris OCRソフトウェアを開きます。

    Iris & IronOCR ソフトウェア比較: 図 12

すべて完了! さて次に比較に進みましょう。

比較

1. 画像からテキストへ

画像からデータを読み取るのはかなり面倒な作業です。 コンテンツを抽出する際には、画像の解像度と品質が重要な役割を果たします。 どちらのライブラリも、画像からテキストを抽出するための光学文字認識機能を提供します。

1.1. IronOCRの使用

IronOCRは、開発者が強力な IronTessaract クラスを使って画像ファイルの内容を読み取るのを非常に簡単にします。 ここでは、PNG画像を読み取るために使用します。コードは以下の通りです:

var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// We use a using statement to ensure resources are freed after use
using (var Input = new OcrInput())
{
    // Add the image from which you want to extract text
    Input.AddImage("test-files/employmentapp.png");
    // Perform OCR to read the text
    var Result = OCR.Read(Input);
    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
' We use a using statement to ensure resources are freed after use
Using Input = New OcrInput()
	' Add the image from which you want to extract text
	Input.AddImage("test-files/employmentapp.png")
	' Perform OCR to read the text
	Dim Result = OCR.Read(Input)
	' Output the extracted text to the console
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel
入力画像

Iris & IronOCR ソフトウェア比較: 図 13

出力

Iris & IronOCR ソフトウェア比較: 図 14 - 画像出力

IronOCRの出力は与えられたオリジナル画像に一致します。 コードは簡潔でわかりやすく、技術的なことは何もありません。

1.2. Iris OCRの使用

Iris OCRソフトウェアを使用すると、すべての紙文書をスキャンしてテキスト認識に利用できます。 テキスト抽出はIris OCR技術を使用すると非常に簡単です。 ホームメニュータブの「ファイルから」から画像ファイルを選択します。 同じ画像を使って2つのソフトウェアの出力をテストし比較します。

Iris & IronOCR ソフトウェア比較: 図 15

アップロードされた画像にイメージ修正を適用することができます。 出力ファイルタブでは、出力形式を任意の形式として選択できます。 Word、Excel、PDF、テキストファイルなどの複数の出力形式が提供されています。単にファイルを任意の形式で保存し、抽出されたテキストを表示するために開くことができます。

出力

Iris & IronOCR ソフトウェア比較: 図 16

2つのソフトウェアの出力に明確な違いがあることがわかります。 IronOCRは画像からフォーマットごとに正確なテキストを抽出しました。 一方で、Iris OCRはフォーマットを保持しましたが、フルネームと電話番号が混乱しています。

2. バーコードとQRコードからテキストへ

2.1. IronOCRの使用

IronOCRは、画像の読み取り時に唯一無二で役立つ機能を提供しています。つまり、バーコードやQRコードを読み取ることができます。 バーコードを検出し、その値を簡単に表示できます。

これを行うには、バーコード読み取り設定をtrueに設定し、OCR結果内の各バーコードを反復処理します。 バーコードを読み取るコードは以下に示します:

var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
var OCR = new IronTesseract();
OCR.Configuration.ReadBarCodes = true;
// Using statement to automatically dispose of resources
using (var input = new OcrInput())
{
    // Add the image to be processed
    input.AddImage("test-files/Barcode.png");
    // Read the OCR result
    var Result = OCR.Read(input);
    // Iterate through the barcodes detected and display their values
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
    }
}
Dim OCR = New IronTesseract()
OCR.Configuration.ReadBarCodes = True
' Using statement to automatically dispose of resources
Using input = New OcrInput()
	' Add the image to be processed
	input.AddImage("test-files/Barcode.png")
	' Read the OCR result
	Dim Result = OCR.Read(input)
	' Iterate through the barcodes detected and display their values
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
	Next Barcode
End Using
$vbLabelText   $csharpLabel
入力画像

Iris & IronOCR ソフトウェア比較: 図 17

出力

Iris & IronOCR ソフトウェア比較: 図 18

入力画像内の3つのバーコードすべてが正常に読み取られ、その隠されたテキストが表示されます。

2.2. Iris OCRの使用

Iris OCRも画像やPDFファイルからバーコードデータを抽出する機能を提供しています。 ただし、バーコードの場合は認識されるべきバーコード領域を手動で選択する必要があります。 ゾーンタブに移動して、認識するバーコードを選択します。

選択した領域を右クリックしてデータとしてコピーし、ワードプロセッシングファイルに保存してデータを表示します。

Iris & IronOCR ソフトウェア比較: 図 19

この場合、Iris OCRソフトウェアは、画像内のバーコードの背後に隠されたテキストを検出できません。

3. PDFからテキストへ

3.1. IronOCRの使用

IronOCRでは、PDFファイルの読み取りは画像の読み取りと同じくらい簡単です。 画像読み取りコードでAddImageメソッドをAddPdfに変更するだけで済みます。 コードは次の通りです:

var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
var OCR = new IronTesseract();
// Using statement for resource management
using (var Input = new OcrInput())
{
    // Add the PDF file to be processed
    Input.AddPdf("test-files/example.pdf");
    // Get the OCR results
    var Result = OCR.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
Dim OCR = New IronTesseract()
' Using statement for resource management
Using Input = New OcrInput()
	' Add the PDF file to be processed
	Input.AddPdf("test-files/example.pdf")
	' Get the OCR results
	Dim Result = OCR.Read(Input)
	' Output the extracted text
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel
出力

抽出されたテキストはPDFファイルと同じフォーマットで行われます。

Iris & IronOCR ソフトウェア比較: 図 20

3.2. Iris OCRの使用

PDFファイルの読み取りもIrisソフトウェアを使用すると非常に簡単です。 すべてのデジタル形式をサポートしており、PDFもその一つです。 Iris OCRソフトウェアを使用して検索可能なフォーマットを作成することができます。 PDFは紙の文書であり、各ページは別個の画像ファイルとして扱われます。ファイルからオプションを使用して紙の文書を開きます。 テキストを抽出するページ範囲を選択し、与えられたオプションから選択した任意の編集可能な形式で保存します。

Iris & IronOCR ソフトウェア比較: 図 21

出力

Iris & IronOCR ソフトウェア比較: 図 22

ライセンス

IronOCRは開発目的では無料ですが、商用利用にはライセンスが必要です。 すべての可能性を確認するための無料トライアルも提供されています。 Liteパッケージは$799から始まり、30日間の返金保証があります。 IronOCRは製品サポートと更新を1年間無料で提供し、その後は$399/年です。 すべてのライセンスは恒久的であり、一度の購入のみで隠れた料金はありません。 SaaSおよびOEM製品向けのロイヤリティフリー再配布も$1999の一度の購入でカバーされます。 ライセンスパッケージと価格プランの詳細についてはこちらをご覧ください。

Iris & IronOCR ソフトウェア比較: 図 23

Irisは、10日間の無料バージョンが利用可能なOCRソリューションです。 そのプロバージョンは$99から始まり、企業版は$199から始まります。プロダクションモードでそのSDKを使用するには、営業担当者から見積もりを取得する必要があります。C#または他の言語開発向けにライセンスを取得したい場合は、こちらから見積もりを取得してください。 プロと協力バージョンの詳細な比較はこちらから確認できます。

Iris & IronOCR ソフトウェア比較: 図 24

結論

Iris & IronOCR ソフトウェア比較: 図 25

IronOCRは、C#開発者にあらゆるプラットフォームで最も高度なTesseract APIを提供します。 IronOCRはWindows、Linux、Mac、Azure、AWS、Lambdaにインストールでき、_.NET Frameworkプロジェクトだけでなく、.NET Standardおよび.NET Core_もサポートしています。 また、OCRスキャンでバーコードを読み取り、OCRをHTMLとして、検索可能なPDFにエクスポートすることもできます。

Iris OCRソフトウェアは、AI機能を備え、WindowsおよびMacと互換性があります。 そのSDKは複数のプログラミング言語で利用可能です。 Iris Proは、WindowsとMacのGUIアプリケーション用にIris OCR SDKの機能を備えています。 画像やPDFからテキストを読み取り、他の形式で出力できます。 わずか数クリックでIrisソフトウェアを使用してすべての紙文書をカスタマイズすることもできます。

AWS Textractのライセンスは、情報を抽出しデータを分析する文書のページ数に基づいています。 Iris OCR開発ライセンスはIrisウェブサイトに掲載されていません。ライセンス情報を求める見積もりをリクエストする必要があります。 さらに、IronOCRのライセンスは一度の購入であり、一生使用できます。

全体的に、どちらのソフトウェアもAI技術を含むほぼすべてのOCR機能を提供しますが、IronOCRはIris OCRに比べてわずかに優れています。 速度、正確性、および全体的なパフォーマンスの点で、IronOCRは生産環境でより優れています。 高レベルのテキスト認識アプリケーションを作成するために、わずか数行のコードを使用します。 APIドキュメントは24時間利用可能で、開発者がこのライブラリを愛し、OCRソリューションの第一選択にします。 その全機能を無料トライアルでテストできます。

今、2の価格で5つのIron製品を購入できます。詳細については、このリンクをご覧ください。

ここからIronOCRをダウンロードして試してみてください。

ご注意Iris OCR Softwareはその所有者の登録商標です。 このサイトは、Iris OCR Softwareと提携していない、またはそれにより推奨または支持されているものではありません。 すべての製品名、ロゴ、およびブランドは各所有者の所有物です。 比較は情報提供のみを目的としており、執筆時点で公開されている情報を反映しています。

よくある質問

C#でOCRを使って画像をテキストに変換するにはどうすればよいですか?

IronOCRのReadメソッドを画像ファイルに使用すると、それらを機械可読テキストに変換できます。さまざまな画像形式と125以上の言語をサポートしています。

IronOCRライブラリはどの言語をサポートしていますか?

IronOCRは125以上の言語をサポートしており、テキストとバーコード認識のための広範な国際言語互換性を提供します。

OCRの結果を向上させるために画像品質を向上させる方法はありますか?

IronOCRには、画像のコントラスト、明るさ、解像度を自動的に調整してOCRの精度を向上させる組み込みの画像向上ツールが含まれます。

IronOCRはどの出力形式をサポートしていますか?

IronOCRはプレーンテキスト、PDF、およびXMLやJSONなどの構造化データ形式でテキストを出力できます。

購入前にIronOCRを試すことができますか?

はい、IronOCRは無料試用版を提供しており、開発者が商用ライセンスを購入する前にその機能とパフォーマンスを評価できます。

IronOCRのライセンスはどのように機能しますか?

IronOCRはシンプルなライセンスモデルを提供し、開発者ベースの永久ライセンスが一回購入で利用可能で、企業使用のオプションも含まれます。

IronOCRは本番環境に適していますか?

IronOCRはその速度、高精度、統合のしやすさ、そして堅牢な開発者サポートにより本番環境に非常に推奨されます。

IronOCRはバーコードとQRコードのスキャンをどのように行いますか?

IronOCRは組み込みのReadBarCodes機能を使用して画像からバーコードとQRコードをスキャンすることができ、設定で有効にすることができます。

IronOCRとIris OCRソフトウェアの主な違いは何ですか?

どちらも強力なOCR機能を提供しますが、IronOCRは使いやすさ、豊富なドキュメント、シンプルなライセンスで知られています。それに対して、Iris OCRはその速度と精度、モジュラーデザインで知られていますが、ライセンスの詳細については営業担当者に連絡が必要です。

IronOCRは.NET Core及び.NET Standardと統合可能ですか?

はい、IronOCRは.NET Coreと.NET Standardと完全に互換性があり、現代的な開発環境へのシームレスな統合を可能にします。

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。