フッターコンテンツにスキップ
OCRツール

最高のOCRソフトウェア比較(長所と短所)

光学式文字認識(OCR)は、画像をテキストに変換する技術です。 これは、文書の変換、検索可能なPDFの作成、スキャンされた文書を編集可能なテキストに変換するなど、さまざまな目的で使用できます。

OCRは、ビジネス世界で働く人々にとって、仕事生活の重要な部分となっています。 これは、物理的な紙の文書をデジタル形式に変換したり、スキャンされた文書のページ番号やキーワード検索用語でインデックス付きファイルを作成したりするようなさまざまな方法で使用されています。

障害を持つ人々のためのアクセシビリティは、企業がOCR技術に頼るもう一つの理由です。 視力が悪い人や読むことができない人にとって、PDFのような書式がなく見出しにくいドキュメントを読むことの課題を考えてみてください。 OCRソフトウェアは、これらの文書を音声ファイルやHTMLやWordのようなテキストベースの形式に変換でき、アクセシビリティを大幅に向上させます。 テキスト形式は普遍的に受け入れられており、インターネットや電子メールでの情報共有を簡素化します。 これにより、視力が悪い人や読むことができない人が、自分の文書にアクセスできるようになります。

もし紙ベースの文書をデジタル化したい場合、画像からテキストを抽出したり、PDFファイルを編集可能な形式に変換できる適切なOCRソフトウェアを選ぶことが重要です。

目次

  • AWS Textract
    • AWS Textractの利点
    • AWS Textractの欠点
  • Adobe Acrobat Pro DC
    • Adobe Acrobat Pro DCの利点
    • Adobe Acrobat Pro DCの欠点
  • Nanonets
    • Nanonetsの利点
    • Nanonetsの欠点
  • SimpleOCR
    • SimpleOCRの利点
    • SimpleOCRの欠点 ・IronOCR ・IronOCRの利点 ・IronOCRの欠点
    • コード例
  • 結論

AWS Textract

最高のOCRソフトウェアの比較、図1: AWS Textract

AWS Textractは、深層学習を用いてさまざまなタイプの文書を編集可能な形式に変換するサービスです。 例えば、さまざまな企業の請求書のハードコピーを持っていて、それらの情報をデバイス上のスプレッドシートに保存すると仮定しましょう。この作業は通常手動で行われ、非効率的でミスを引き起こす可能性があります。 Textractはこれらの請求書を入力として取り込み、それを構造化された出力に変換することができます。 請求書をTextractにアップロードすることで、文書を解読してくれます。

AWS Textractの利点

  • 利用量に応じて支払いする請求方法であり、予算を意識した購入に役立ちます。
  • 追加の統合モデルを必要とせずに簡単に使用できます。
  • テスト用に無料トライアルを提供しています。

AWS Textractの欠点

  • 解像度や形式に応じて精度が変わります。
  • ユーザーデータでのトレーニングをサポートするべきですが、現在は対応していません。

Adobe Acrobat Pro DC

最高のOCRソフトウェアの比較、図2: Adobe Acrobat Pro DC

Adobe Acrobat Pro DCは、テキストを抽出し、スキャンされた文書を編集可能なPDFファイルに変換するのを支援するOCRソフトウェアです。 OCRツールに加えて、アプリから直接PDFを共有、署名、印刷、圧縮できます。Adobe Acrobat Pro DCは画像をテキストに変換し、コンピュータ上の適切なフォントと一致させることもできます。 コメントや編集などのさまざまな機能を提供し、ページの並べ替え、ファイルの結合、画像の変更ができます。

Adobe Acrobat Pro DCの利点

  • デスクトップ、ウェブ、モバイルで使用可能なマルチプラットフォームアプリケーション。
  • 複数の言語をサポートします。
  • バッチ処理を提供します。

Adobe Acrobat Pro DCの欠点

  • 一般ユーザーには高価です。
  • 実行するためには専用のハードウェアが必要です。

Nanonets

最高のOCRソフトウェアの比較、図3: Nanonets

NanonetsはAIベースのOCRソフトウェアで、人工知能と機械学習を使用してスキャンされた文書を編集可能で検索可能なPDFに変換します。 PDF文書をWordファイル形式に変換することができ、複数の言語をサポートしています。 Nanonetsは抽出されたデータを検証するために深層学習を使用し、より多くのデータが処理されると共に改善されます。

Nanonetsの利点

  • ウェブ対応デバイスからの入力データスキャンが可能です。
  • 複数の言語とファイル形式をサポートしています。

Nanonetsの欠点

  • 高価です。
  • ぼやけた画像や文書ではパフォーマンスの問題があります。

SimpleOCR: 無料のOCRソフトウェア

SimpleOCRは、スキャンされたテキスト画像を編集可能なテキスト文書に変換するためのシンプルなライブラリです。 無料のOCRオプションとして最もよく知られており、100以上の言語をサポートし、精度向上のためのデスペックル機能を備えています。

SimpleOCRの利点

  • バッチ処理をサポートしています。
  • 簡単なUIで簡単にナビゲーションできます。
  • 無料で使用可能です。

SimpleOCRの欠点

  • 結果の精度が不足することがあります。
  • 処理速度が遅いです。

IronOCR: .NET OCRライブラリ

最高のOCRソフトウェアの比較、図4: IronOCR

IronOCRは、OCRタスクのために設計された.NETライブラリで、開発者がテキストデータを簡単に処理できるようにします。 効率的に画像やPDF文書をテキストに変換し、自動文字認識を提供し、125の言語をサポートしています。 Windows、Mac、Linuxなどのプラットフォームと互換性があり、個人の開発利用には無料です。

利点

  • 簡単なインストールプロセス。
  • 外部アドオンが不要です。
  • 豊富な機能とカスタマイズを提供します。
  • Iron Softwareのウェブサイト上でのチュートリアルで良好なドキュメントされています。
  • 125の言語をサポートします。

欠点

商業利用は無料ではありません。

コード例

IronOCRのコード例を見てみましょう:

using IronOcr;
// Instantiate the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput(@"images\image.png"))
{
    // Deskew the image to correct any tilt
    Input.Deskew();
    // DeNoise the image if accuracy is below 97% (commented here by default)
    // Input.DeNoise();
    // Read the text from the image
    var Result = Ocr.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
using IronOcr;
// Instantiate the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput(@"images\image.png"))
{
    // Deskew the image to correct any tilt
    Input.Deskew();
    // DeNoise the image if accuracy is below 97% (commented here by default)
    // Input.DeNoise();
    // Read the text from the image
    var Result = Ocr.Read(Input);
    // Output the extracted text
    Console.WriteLine(Result.Text);
}
Imports IronOcr
' Instantiate the IronTesseract class
Private Ocr = New IronTesseract()

Using Input = New OcrInput("images\image.png")
	' Deskew the image to correct any tilt
	Input.Deskew()
	' DeNoise the image if accuracy is below 97% (commented here by default)
	' Input.DeNoise();
	' Read the text from the image
	Dim Result = Ocr.Read(Input)
	' Output the extracted text
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

上記のコードは、低品質の画像ファイルからテキストを抽出します。

using IronOcr;
// Instantiate the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // OCR entire document
    // Add a PDF using file path and optional password
    Input.AddPdf("example.pdf", "password");

    // Alternatively, OCR specific pages of a PDF
    Input.AddPdfPages("example.pdf", new[] { 1, 2, 3 }, "password");

    // Read and extract text from the input document
    var Result = Ocr.Read(Input);
    // Output the extracted text from the PDF
    Console.WriteLine(Result.Text);
}
using IronOcr;
// Instantiate the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // OCR entire document
    // Add a PDF using file path and optional password
    Input.AddPdf("example.pdf", "password");

    // Alternatively, OCR specific pages of a PDF
    Input.AddPdfPages("example.pdf", new[] { 1, 2, 3 }, "password");

    // Read and extract text from the input document
    var Result = Ocr.Read(Input);
    // Output the extracted text from the PDF
    Console.WriteLine(Result.Text);
}
Imports IronOcr
' Instantiate the IronTesseract class
Private Ocr = New IronTesseract()

Using Input = New OcrInput()
	' OCR entire document
	' Add a PDF using file path and optional password
	Input.AddPdf("example.pdf", "password")

	' Alternatively, OCR specific pages of a PDF
	Input.AddPdfPages("example.pdf", { 1, 2, 3 }, "password")

	' Read and extract text from the input document
	Dim Result = Ocr.Read(Input)
	' Output the extracted text from the PDF
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

上記のコードは、PDF文書全体や選択したページからのデータを抽出します。

結論

すべてのOCRソフトウェアオプションを比較した結果、IronOCRはこの記事で言及した他のオプションよりも優れていると結論付けました。 さまざまな機能で高度にカスタマイズ可能で、IronOCRは開発者と企業にとって効果的で手ごろな価格です。 IronOCRの価格設定に関する詳細は、このリンクで見つけることができます。

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。