IronOCRとLeadtools OCRの比較
OCRに関する情報をお探しの場合は、ここが最適な場所です。 このブログではOCR関連のソフトウェアについて論じ、それらがOCR関連のタスクにどのように適用されるかを検討します。 では、まず最初の質問です:OCRとは何ですか?
光学文字認識(OCR)は、光学スキャナーと特殊なソフトウェアを使用して、手書きまたは印刷されたテキストを識別しデジタルエンコードする技術です。 OCRソフトウェアを使用すると、コンピューターはテキストの静止画像を読み取り、それを編集可能で検索可能なデータに変換できます。
OCRは通常、OCRソフトウェアでドキュメントを開いてスキャンし、OCRソフトウェアでドキュメントを認識し、OCRで生成されたドキュメントをお好みの形式で保存するという3つのステップで構成されます。
今日は2つのOCRソフトウェアパッケージを取り上げ、その利点と欠点を比較するほか、C#でのSDKの統合とエクスポートについても説明します。 議論の対象となるソフトウェアパッケージは以下の通りです:
- LeadTools OCR
- IronOCR
1. LeadTools OCR
LEADTOOLS OCRは、LEAD Technologies Inc.が開発し公開する受賞歴のある開発ツールキットのラインから来ています。LEADTOOLSは、デスクトップ、サーバー、タブレット、およびモバイルアプリケーションにラスタ、ドキュメント、医療、マルチメディア、およびベクター画像を統合するための包括的なツールキットのコレクションです。 ファイル形式(150以上)、画像圧縮、画像処理、カラー変換、カラー処理、画像表示、特殊効果、スキャン/キャプチャ、共通ダイアログ、印刷、DICOM、PACS、OCR、バーコード、フォーム認識、PDF、ドキュメントクリーンアップ、注釈など、すべてがLEADTOOLSによってサポートされています。 LEADTOOLSツールキットを使用するアプリケーション開発者の指先には、何百万行ものコードが実質的に提供されています。 LEADTOOLS は、プログラミングのニーズに関係なく、最も強力な画像技術を提供するために構築されたツールセットです。
LEADTOOLSは、デスクトップ、サーバー、タブレット、およびモバイルシステムに認識、ドキュメント、医療、画像、マルチメディア技術を統合するための包括的なツールキットであり、独自の人工知能および機械学習アルゴリズムによって強化されています。 アプリを改善するために、30年以上の画像開発知識と150以上のファイルタイプのサポートをうまく活用してみませんか。
LEADTOOLS OCRクラスライブラリは、ドキュメント光学文字認識(OCR)技術をソフトウェアプログラムに迅速かつ効率的に組み込むためのプログラミングソフトウェアを提供します。 プログラマーはLEADTOOLS OCRクラスライブラリを使用して、ドキュメント画像上で文字認識を実行し、認識されたテキストを20以上のファイル形式に出力できます。
1.1. LeadTools OCR Features
Leadツールキットは、エンドユーザーと開発者のための受賞歴のあるマルチメディア技術のラインを提供し、幅広いクライアントを満足させるためのあらゆるタイプのOCR機能を実行することができます。
1.1.1. Multi-thread
Leadテクノロジーエンジンは、エンドユーザーに対してマルチスレッドおよびサーバーベースのOCR操作をサポートします。
1.1.2. Multiple OCR Documents
LeadTools Document SDKを使用すると、ユーザーはアプリケーション内で複数のOCRドキュメントを作成できます。 各ドキュメントには独自のページリストが含まれています。
1.1.3. Languages
受賞歴のあるLeadTools技術ラインは、40以上の異なる言語でサービスを提供し、OCRページを認識するときにどの言語を採用するか選択を許可します。
1.1.4. Dictionaries
LeadTools OCRは、エンドユーザーがすべてのサポートされている言語の辞書にアクセスすることを可能にする優れたドキュメントスキャナーアプリです。 さらに、一つのドキュメント内で複数の辞書にアクセスすることも可能です。
1.1.5. Document Management System
複雑なレイアウトを持つ書類やファクシミリ、コピーなど、さまざまな文書を認識してください。
1.1.6. Character Recognition
改善された精度と速度で、LEADTOOLS OCRアプリケーションは、画像上で光学文字認識(OCR)を実行し、写真からテキストを抽出し、画像を様々なドキュメント形式に変換できます。 画像からテキストを抽出してコピーすることで、テキストを修正し共有します。
1.1.7. Artificial Intelligence
Lead Technologiesは、AIを使用して同じ種類の文書上での認識を改善します。これはエンドユーザーにとって素晴らしいニュースです。
1.1.8. Zone Recognition
受賞歴のあるOCRツールキットラインからのLeadtools Document SDKは、より強力なゾーン認識ソフトウェアを使用して、ゾーン認識の全く新しいレベルに引き上げます。
- ドキュメントページはゾーンの有無にかかわらず表示できます。
- ゾーンはファイルからインポートおよびエクスポート可能です。
- ページを単一のゾーンとして認識します。
- 各ページ内で、手動で複数のゾーンを指定して識別します。
- 多層のゾーンを構築し、表、ルーラー、写真、テキストなどの領域を特定する際に自動領域セグメンテーションを使用します。
- 各ゾーンに対して、OMR、MRZ、MICRゾーンのようなさまざまな専門的な選択肢を提供します。
1.1.9. Cloud Services
これは、高容量でスケーラブルなWeb APIです。 その使いやすいインターフェースにより、強力なOCR、バーコード、MICR、ドキュメント変換をあらゆるプログラムに簡単に組み込むことができます。
注意:
NuGetの公式サイトでは、.NET開発者がLeadToolsよりもIronOCRを好んでいることが示されています。 LeadToolsには77.8 Kのダウンロードがありますが、一方でIronOCRは320 K以上のダウンロードがあります。
2. IronOCR
IronOCRは、.NETプラットフォームのプログラマーが画像やPDFドキュメントからテキストを検出し読み取ることを可能にするC#ソフトウェアライブラリです。 これは、世界で最も強力なTesseractエンジンを使用した純粋な.NET OCRパッケージです。IronOCRは、写真や低解像度処理でデジタルノイズや欠陥がある現実世界のグラフィックや不完全なドキュメントに取り組む際に優れています。 設定がほとんどまたはまったくなくても、Tesseract 5(および4と3)はWindows、macOS、Linux、Azure、AWS、Lambda、Mono、Xamarin Macでボックスからそのまま動作します。 取り扱うべきネイティブバイナリはありません。 フレームワークとコアは互換性があります。
IronOCRは他のどのOCRエンジンよりも多くの言語をサポートしており、プログラマーが意義深い画像作成を行い、そこからマルチメディアデータを抽出することを可能にします。 IronOCRは125の国際言語をサポートしていますが、標準でインストールされるのは英語だけです。
IronOCRツールキットが提供するサービスは、他のOCRエンジンよりも統合が簡単で、処理が容易で、よりインタラクティブです。.NET開発者にソリューションを提供し、デジタルに接続・制御し、文書を好きなように操作できるようにします。
2.1. IronOCRの機能
IronOCRは、ユーザーの技術的背景や使用しているハードウェアの複雑さに関わらず、統合、署名、エクスポート、グラフィックスの読み取り、画像からの詳細の抽出などの機能を提供する独自の機能セットを提供します。
2.1.1. Accuracy
IronOCR SDKは、99.8%という精度率で他のOCRライブラリを大幅に上回るため、OCRライブラリの作業精度を大幅に引き上げます。
2.1.2. Fixing Low Quality Scans and Images
IronOCRクラスは、C#開発者に微細な制御を提供します。 開発者にOCR(画像およびPDFからテキストへの変換)機能を提供し、それぞれのユニークなケースで微調整された性能を提供します。
現実の事例に取り組む際、速度と精度のバランスを完璧に取りながら変数を設定することで達成できるかもしれません。 バックグラウンドノイズをクリーン、コントラストを強化、解像度を強化、言語、戦略、回転および整列、カラー空間、暗い背景の白文字を検出し、入力画像タイプなどのオプションが利用可能です。
以下は低品質のスキャンを修正した後の画像例です:
修正前
修正後
2.1.3. Languages
IronOCRは、世界中の開発者を支援するために125以上の国際言語でソリューションを提供します。
2.1.4. OCR Text Extraction
Iron Tesseractは、さまざまな画像タイプおよびPDFファイルを読み取ることができます。 この機能は、伝統的な無料のTesseractエンジンでは不可能です。 スキャンが低品質である場合、OCR入力は関連するプロパティを自動的に修正することができます。
2.1.5. Image Optimization Filters
OCRInputクラスは、C#プログラマーに入力に関する詳細な制御を提供します。 開発者はその後、画像入力をスピードと精度のために前処理します。 これによりPhotoshopバッチスクリプトやImageMagickを使用してOCR用に写真を準備する標準的な方法が排除されます。
2.1.6. OCR Region of an Image
画像上でOCRを実行する際の速度と精度に関して、IronOCRはそれを新しいレベルに引き上げます。 IronOCRはエンドユーザーが画像内の特定の領域を選択してその領域でOCRを実行できるようにします。 その領域はContentAreasまたはCropAreasとして知られています。
2.1.7. OCRResult Class
IronOCRは、Tesseract 3、4、または5を使用してスキャンする各ページに対して、拡張された結果オブジェクトを返します。これには、位置データ、画像、テキスト、統計的信頼性、代替シンボルオプション、フォント名、フォントサイズ、装飾、フォントウエイトが含まれ、以下の項目に対して位置が示されます:
- ページ
- 段落
- テキスト行
- 単語
- 個々のキャラクター
- バーコード
2.1.8. Multiple Languages for 1 Document
IronOCRは、開発者が単一のドキュメントに対して複数の言語を使用することを可能にします。 この機能は、.NETサービスプロバイダーにとって非常に役立ちます。
注意:
IronOCRは、受賞歴のある製品ラインの一部です。この賞を受賞することで、Iron Softwareは本当に素晴らしいドキュメントスキャナーアプリを提供し、優れた認識能力と優れたドキュメント関連の変換および操作を提供していることを証明しています。
3. Visual Studioでの新プロジェクトの開始
Visual Studioソフトウェアを開き、ファイルメニューに移動して新しいプロジェクトを選択します。 次に、コンソールアプリケーションを選択します。
プロジェクト名を入力し、パスを適切なテキストボックスに選択します。 次に、作成ボタンをクリックし、以下のスクリーンショットに示されるように必要な.NETフレームワークを選択します:
Visual Studioプロジェクトは、選択されたアプリケーション用の構造を生成し、コンソール、Windows、およびウェブアプリケーションを選択した場合は、プログラム.csファイルが開かれ、コードを入力してアプリケーションをビルド/実行することができます。
次に、プログラムをテストするためにライブラリを追加できます。
4. IronOCRライブラリのインストール
IronOCRライブラリはいくつかの方法でダウンロードしてインストールできます。 以下のような方法です:
- Visual Studio NuGetパッケージマネージャーを使用する
- NuGetウェブページから直接ダウンロードする。
- IronOCRのWebページから直接ダウンロードする。
- Visual Studioのコマンドラインを使用する。
4.1. Visual Studio NuGetマネージャーを使用する
Visual Studio NuGetパッケージマネージャーを使用して、IronOCRをC#プロジェクトに統合できます。
- ツールを展開します。
- NuGetパッケージマネージャーを展開します。
- ソリューションのNuGetパッケージを管理をクリックします。
右側のプロジェクトボックスをチェックし、インストールをクリックします。
この方法を使用することで、開発者はIronOCRライブラリと開発者が選択した任意の言語パックをインストールできます。
4.2. NuGetウェブページから直接ダウンロード
IronOCRは、次の手順に従ってNuGetウェブサイトから直接ダウンロードできます:
- リンク"https://www.nuget.org/packages/IronOcr/"に移動します
- 右側のメニューからダウンロードパッケージオプションを選択します。
- ダウンロードしたパッケージをダブルクリックします。 自動的にインストールされます。
- 次に、ソリューションをリロードしてプロジェクト内でそれを使用し始めます。
4.3. IronOCRウェブページから直接ダウンロード
開発者はこのリンクを使用してIronOCRウェブサイトからIronOCRライブラリを直接ダウンロードできます。
- ソリューションウィンドウからプロジェクトを右クリックします。
- 次に、リファレンスオプションを選択し、ダウンロードしたリファレンスの場所をブラウズします。
- 次に、OKをクリックしてリファレンスを追加します。
4.4. Visual Studioコマンドラインを使用する
- Visual Studioで、ツール -> NuGetパッケージマネージャー -> パッケージマネージャーコンソールに進みます
- パッケージマネージャーコンソールタブに次の行を入力します:
Install-Package IronOcr
パッケージは現在のプロジェクトにダウンロード/インストールされ、使用する準備が整います。
5. LeadTools OCRのインストール
開発者は以下の3つの方法でLeadTools OCR SDKをダウンロードできます。 すべてを説明します。
- Visual Studio NuGetパッケージマネージャを使用します。
- NuGetウェブサイトを使用する。
- LeadToolsウェブサイトからダウンロードする。
5.1. Visual Studio NuGetマネージャーを使用する
Visual Studio NuGetパッケージマネージャーを使用して、C#プロジェクトにLeadTools OCRをインストールできます:
- ツールを展開します。
- NuGetパッケージマネージャーを展開します。
- ソリューションのNuGetパッケージを管理をクリックします。
その後、新しいウィンドウが表示されます; 検索バーにLeadTools OCRと入力します。
これらのステップに従うことで、開発者はLeadTools OCRライブラリと開発者が選択した任意の言語パックをインストールできます。
5.2. NuGetウェブサイトを使用する
LeadTools OCRは以下の指示に従ってNuGetウェブサイトから直接ダウンロードできます:
- リンク"https://www.nuget.org/packages/Leadtools.Ocr/"に移動します
- 右側のメニューからダウンロードパッケージオプションを選択します。
- ダウンロードしたパッケージをダブルクリックします。 自動的にインストールされます。
- 次に、ソリューションをリロードしてプロジェクト内でそれを使用し始めます。
5.3. LeadToolsウェブサイトからダウンロード
開発者は、LeadTools Document SDKをウェブサイトから直接ダウンロードできます。 単に彼らのウェブサイトに行き、OCRライブラリを含むパックの一つをダウンロードしてください。
6. マルチスレッドOCR
議論されている両方のソフトウェアがマルチスレッドOCRエンジンのためのサービスを提供しています。 このセクションでは、性能とスピードを見ていきます。
6.1. LeadToolsのマルチスレッドOCR
LeadToolsは各システムの物理コアに依存して、一度に複数のOCRインスタンスを実行することをサポートしています。 このLead Technologiesの機能は、.NET開発者に多くの時間を節約します。
// Create an instance of an OCR document from the engine
IOcrDocument ocrDocument = ocrEngineInstance.DocumentManager.CreateDocument();
// Add page, zone them, recognize them and save them to the final document
ocrDocument.Pages.AddPages(imageFileName, null);
ocrDocument.Recognize(null);
ocrDocument.Save(documentFileName, DocumentFormat.Pdf, null);
// Create an instance of an OCR document from the engine
IOcrDocument ocrDocument = ocrEngineInstance.DocumentManager.CreateDocument();
// Add page, zone them, recognize them and save them to the final document
ocrDocument.Pages.AddPages(imageFileName, null);
ocrDocument.Recognize(null);
ocrDocument.Save(documentFileName, DocumentFormat.Pdf, null);
' Create an instance of an OCR document from the engine
Dim ocrDocument As IOcrDocument = ocrEngineInstance.DocumentManager.CreateDocument()
' Add page, zone them, recognize them and save them to the final document
ocrDocument.Pages.AddPages(imageFileName, Nothing)
ocrDocument.Recognize(Nothing)
ocrDocument.Save(documentFileName, DocumentFormat.Pdf, Nothing)
6.2. IronOCRのマルチスレッドOCR
IronOCRのマルチスレッド機能を使用するのは簡単で、開発者にとって時間を節約できます。 Iron Tesseractは、利用可能なすべてのコアのスレッドを自動的に使用しようとし、メイン/GUIスレッドでの応答性を慎重に考慮します。
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.AddPdf("scan.pdf");
// Image processing is automatically multithreaded
Input.Deskew();
// OCR reading is automatically multi-threaded too
var Result = Ocr.Read(Input);
}
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.AddPdf("scan.pdf");
// Image processing is automatically multithreaded
Input.Deskew();
// OCR reading is automatically multi-threaded too
var Result = Ocr.Read(Input);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.AddPdf("scan.pdf")
' Image processing is automatically multithreaded
Input.Deskew()
' OCR reading is automatically multi-threaded too
Dim Result = Ocr.Read(Input)
End Using
7. 検索可能なPDFを作成
検索可能なPDFの作成は、すべてのC#開発者の夢です。 このセクションでは、IronOCR SDKとLead technologies OCR SDKの両方を使用してこのプロセスを説明します。
7.1. IronOCRを使用して検索可能なPDFを作成
IronOCRの素晴らしいドキュメントスキャナーアプリは、開発者が画像内のテキスト文字を検出し、それらを意味のあるPDFテキストに変換することによって、検索可能なPDFの作成を全く新しいレベルに引き上げます。 ユーザー用のコード例は以下にあります:
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.Add(@"images\page1.png");
Input.Add(@"images\page2.bmp");
Input.Add(@"images\page3.tiff");
Input.Deskew();
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
Input.Add(@"images\page1.png");
Input.Add(@"images\page2.bmp");
Input.Add(@"images\page3.tiff");
Input.Deskew();
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.Add("images\page1.png")
Input.Add("images\page2.bmp")
Input.Add("images\page3.tiff")
Input.Deskew()
Dim Result = Ocr.Read(Input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
7.2. LeadTools OCRを使用して検索可能なPDFを作成
Lead Technologiesは、受賞歴のあるソフトウェアラインから素晴らしいドキュメントスキャナーアプリを提供します。 ただし、エンドユーザーにとっては、IronOCRで使用されるコードよりも少し複雑です。
private void saveAsSearchablePDFToolStripMenuItem_Click(object sender, EventArgs e)
{
try
{
// Create a document
using (IOcrDocument ocrDocument = _ocrEngine.DocumentManager.CreateDocument(null, OcrCreateDocumentOptions.AutoDeleteFile))
{
// Create IOcrPage from loaded image
_ocrPage = _ocrEngine.CreatePage(_viewer.Image, OcrImageSharingMode.AutoDispose);
// Recognize Text
_ocrPage.Recognize(null);
// Add the page
ocrDocument.Pages.Add(_ocrPage);
// Save page as documentation
SaveFileDialog saveDlg = new SaveFileDialog();
saveDlg.InitialDirectory = @"C:\LEADTOOLS22\Resources\Images";
saveDlg.Filter = "Adobe Portable Document Format|*.pdf";
if (saveDlg.ShowDialog(this) != DialogResult.OK)
return;
ocrDocument.Save(saveDlg.FileName, DocumentFormat.Pdf, null);
MessageBox.Show($"OCR output saved to {saveDlg.FileName}");
}
}
catch (Exception ex)
{
MessageBox.Show(ex.ToString());
}
}
private void saveAsSearchablePDFToolStripMenuItem_Click(object sender, EventArgs e)
{
try
{
// Create a document
using (IOcrDocument ocrDocument = _ocrEngine.DocumentManager.CreateDocument(null, OcrCreateDocumentOptions.AutoDeleteFile))
{
// Create IOcrPage from loaded image
_ocrPage = _ocrEngine.CreatePage(_viewer.Image, OcrImageSharingMode.AutoDispose);
// Recognize Text
_ocrPage.Recognize(null);
// Add the page
ocrDocument.Pages.Add(_ocrPage);
// Save page as documentation
SaveFileDialog saveDlg = new SaveFileDialog();
saveDlg.InitialDirectory = @"C:\LEADTOOLS22\Resources\Images";
saveDlg.Filter = "Adobe Portable Document Format|*.pdf";
if (saveDlg.ShowDialog(this) != DialogResult.OK)
return;
ocrDocument.Save(saveDlg.FileName, DocumentFormat.Pdf, null);
MessageBox.Show($"OCR output saved to {saveDlg.FileName}");
}
}
catch (Exception ex)
{
MessageBox.Show(ex.ToString());
}
}
Private Sub saveAsSearchablePDFToolStripMenuItem_Click(ByVal sender As Object, ByVal e As EventArgs)
Try
' Create a document
Using ocrDocument As IOcrDocument = _ocrEngine.DocumentManager.CreateDocument(Nothing, OcrCreateDocumentOptions.AutoDeleteFile)
' Create IOcrPage from loaded image
_ocrPage = _ocrEngine.CreatePage(_viewer.Image, OcrImageSharingMode.AutoDispose)
' Recognize Text
_ocrPage.Recognize(Nothing)
' Add the page
ocrDocument.Pages.Add(_ocrPage)
' Save page as documentation
Dim saveDlg As New SaveFileDialog()
saveDlg.InitialDirectory = "C:\LEADTOOLS22\Resources\Images"
saveDlg.Filter = "Adobe Portable Document Format|*.pdf"
If saveDlg.ShowDialog(Me) <> DialogResult.OK Then
Return
End If
ocrDocument.Save(saveDlg.FileName, DocumentFormat.Pdf, Nothing)
MessageBox.Show($"OCR output saved to {saveDlg.FileName}")
End Using
Catch ex As Exception
MessageBox.Show(ex.ToString())
End Try
End Sub
8. 互換性
このセクションは、これらのソフトウェアパッケージが異なるプラットフォームをサポートするために提供するサービスについてです。 これらのソフトウェアパッケージは、さまざまなプラットフォームやオペレーティングシステムをサポートしています。
8.1 IronOCRの互換性
IronOCR .NET SDKは、C#プログラミング言語をサポートするほぼすべての.NETプラットフォームおよびオペレーティングシステムと互換性のある最高のOCR SDKです。 IronOCRはJPEG、JPG、TIFF、その他多数の画像形式もサポートしています。
.NET Languages:
- C#
- VB.NET
- F#
Platforms:
- .NET 5
- .NET Core 2x & 3x
- .NET Standard 2
- .NET Framework 4x
App Types:
- コンソール、ウェブ、およびデスクトップ
OS:
- Microsoft Windows
- Linux (Debian, CentOS, Ubuntu)
- Mac-OS
- Docker (Windows, Linux, Azure)
- Azure (VPS, Webapps, Websites, Functions)
IDEs:
- Microsoft Visual Studio
- Jetbrains ReSharper & Rider
8.2 LeadToolsの互換性
Lead Technologiesは、異なるプラットフォームへの製品やアプリケーションの統合をサポートするためのサポートも提供します。 Lead Technologiesは、ユーザーおよび開発者向けに優れたSDKサポートも提供します。
展開用オペレーティングシステム
- Windows
- Mac-OS 10.10
- iOS 8.0
- Android 4.0 +
コンポーネントタイプ
- .NET
- C#, VB, C++/CLI, XAML
- WinForms, WPF, Web Forms
- Webサービス
- iOS & mac-OS
- Android
- Linux
互換コンテナー
- Microsoft Visual Studio
- .NET Framework 4.5
- .NET Framework 4.0
- .NET Framework 3.5
- .NET Framework 3.0
- .NET Framework 2.0
9. ライセンス
上記で説明したいずれかのソフトウェアを使用するにはライセンスが必要です。 両方のソフトウェアセットは、環境にログインする前にライセンスを保有することを必要とします。 ログインしたら、そのソフトウェア技術の全く新しいレベルにアクセスし始めることができます。
9.1. LeadToolsのライセンス
LeadToolsはSDKライセンスで2つの重要なライセンスコンポーネントを提供しています:
- "開発ライセンス"はプログラマーに対してSDKを開発に使用することを許可します。
- "展開ライセンス"は、SDK再配布可能なファイルを使用して作成されたエンドユーザーアプリケーションを展開または配布することを顧客に許可します。
開発ライセンス
LEADTOOLSで開発するには、開発ライセンスが必要です。 開発ライセンスは、LEADから直接またはLEAD認定のリセラーまたは販売代理店を通じて購入できます。
開発ライセンスは、顧客にSDKを開発マシンにインストールし、SDKサンプルコードとドキュメントを使用して、アプリケーションに特定の再配布可能なライブラリとファイルを含めることにより、エンドユーザーアプリケーションを作成することを許可します。
展開ライセンス
SDKで開発されたエンドユーザーアプリケーション("エンドユーザーソフトウェア")の使用は、展開ライセンスによって管理されています。
アプリケーションの複製を禁止するエンドユーザーアプリケーションライセンス契約とは異なり、SDKライセンスはSDKの一部をコピーおよび再配布することを許可します。 LEADの知的財産を再現し、LEAD SDKを使用して作成されたエンドユーザーソフトウェアとともに展開するためには、LEADの顧客は必要な展開ライセンスを取得する必要があります。
9.1.2. 価格
LeadToolsは開発者向けに無料のライセンスを提供していません。 代わりに、包括的な開発者ベースのライセンスを提供しています。 Lead Technologies OCR SDKの価格構造はこちらでご覧ください。
9.2. IronOCRのライセンス
IronOCRは開発者ライセンスを無料で提供するライブラリです。 IronPDFも独自の価格構造を持っています; Liteバンドルは $799 から始まり、隠れた料金は一切ありません。 SaaSとOEM製品の再配布も可能です。 すべてのライセンスには、30日間の返金保証、1年間のソフトウェアサポートとアップグレード、開発/ステージング/本番の有効性、そして永久ライセンス(1回限りの購入)が付いています。 IronOCRの全価格構造とライセンスの詳細を見るには、こちらをご覧ください。
無償のサービスでSaaSおよびOEM製品の再配布を$1,599のワンタイム購入で得ることができます。
10. まとめと結論
10.1. まとめ
IronOCRは、Iron Tesseractと呼ばれる世界で最も強力なTesseractエンジンを使用する.NET SDKライブラリです。 125以上の国際言語をサポートしています。 IronOCRは素晴らしいドキュメントスキャナーアプリであり、多くの画像機能を備えています。たとえば、画像のOCR領域、画像からのテキスト抽出、低解像度の画像の修正、および画像の特定の領域でのOCR実行など、多くの関連機能があります。 IronOCRは速度と精度を提供することに注力しており、その精度率99.8%は他のOCR Tesseractよりも高いです。 IronOCRは、パフォーマンスの調整や入力画像の大幅な修正なしにそのまま動作します。 さらに、Iron Softwareの5つの製品すべてを2つの価格で購入することができます。 ウェブページを訪れるにはこちらをクリックしてください。
- IronPDF
- IronOCR
- IronXL
- Iron Barcode
- IronWebScraper
LeadTools OCRは、LeadToolsのツールキットで、ほとんどの認識機能を迅速かつ効率的に提供します。 プログラマーは、LEADTOOLS OCRクラスライブラリを使用してドキュメント画像の文字認識を実行し、20以上のファイル形式に認識テキストを出力できます。 そのライブラリは、ほとんどのプログラミング言語と、そこにあるほとんどのプラットフォームと統合できます。 その機能には以下が含まれます:
- マルチスレッド対応の高速で正確なOCR
- ラテン、キリル文字、東アジア、アラビア文字を含む広範なOCR言語文字セットサポート
- 検索可能なPDF、PDF/A、Word、XMLを含む40以上の出力形式へのOCR結果保存
- ページ全体およびゾーンOCR
- OCR結果を向上させるための組み込みおよびカスタムスペルチェッカ辞書
- スキャン画像からのOCR結果を向上させるための強力なドキュメント画像クリーンアップおよび前処理機能
10.2. 結論
IronOCRおよびLeadTools OCRは両方とも一流のツールであり、C#や.NETの開発者が望むすべての機能を提供します。 IronOCRは競合他社よりも使いやすく、コードが簡単です。 どちらのソフトウェアセットも継続的な費用を発生させませんが、IronOCRはLeadTools OCRライブラリよりもはるかに価格効率が良いです。 IronOCRはコンペティター他のどのライブラリよりも高精度を提供します。 IronOCRは125以上の言語に対する国際言語サポートを提供します。 一方、LeadToolsは40以上の言語のみサポートしています。 性能のさまざまな側面を考慮した上で、導き出せる唯一の結論は、IronOCRがLeadTools OCRよりもかなりの優位性を持っているということです。
よくある質問
低品質なスキャンの OCR 精度を向上させるにはどうすればよいですか?
IronOCR は、低解像度の画像の品質を向上させるために、バックグラウンドノイズのクリーン化、コントラストの強化、解像度の強化、暗い背景の白いテキストの検出などの機能を提供しています。これにより、OCR 精度が向上します。
このライブラリを使用して多言語の OCR ドキュメントを作成できますか?
はい、IronOCR は 125 以上の言語をサポートしており、開発者が複数の言語でドキュメントを処理および作成できるようにします。これにより、多言語 OCR アプリケーションに適しています。
この OCR ライブラリを使用するためのシステム要件は何ですか?
IronOCR は .NET プラットフォームと互換性があり、Windows、Linux、および macOS オペレーティングシステムで使用できます。Visual Studio や Jetbrains ReSharper & Rider などの開発環境ともうまく統合されます。
この OCR ライブラリは異なるドキュメント形式をどのように処理しますか?
IronOCR はさまざまな画像形式を処理し、それらをテキストまたは PDF ファイルに変換できます。これにより、検索可能な PDF やその他のドキュメントタイプを作成できます。
この OCR ライブラリの使用にはライセンス料がかかりますか?
IronOCR は、他の OCR ライブラリと比較してより費用効果の高い、わかりやすいライセンスモデルを提供し、いくつかの代替案が要求する別々の開発および展開ライセンスを回避します。
この OCR ツールの言語サポートは他と比べてどうですか?
IronOCR は 125 以上の言語をサポートしており、多くの他の OCR ツールよりもはるかに多く、広範な言語サポートを必要とするアプリケーションに最適です。
この OCR ライブラリが C# 開発者にとって他よりも良い選択となる理由は何ですか?
IronOCR は、99.8% の高い精度率、.NET プロジェクトへの簡単な統合、幅広い言語サポート、費用対効果の高いライセンスで知られており、C# 開発者により選ばれる選択肢となっています。
この OCR ライブラリはサーバーベースのアプリケーションで使用できますか?
はい、IronOCR はマルチスレッドをサポートしており、大量の OCR タスクを効率的に処理するサーバーベースのアプリケーションで利用できます。


