OCRツール

初心者向けOCR写真チュートリアル

Kannaopat Udonpant
カンナパット・ウドンパント
2023年12月12日
共有:

イントロダクション

光学文字認識(OCR)技術は、デジタル世界でのテキストとのやり取り方法に革命をもたらしました。 OCRフォトツールは、画像をテキストに変換する機能を提供し、印刷されたノートをデジタル化することを容易にします。

この記事では、無料および有料の4つのオンラインOCRツールを紹介し、最後にIronOCRを紹介して、C#でOCRをプログラム的に実装する方法を示します。

Google Vision API (グーグルビジョンAPI)

Google Vision API は、Google が提供する画像からテキストへの変換ツールを作成するための強力なOCRソリューションを提供します。 それは画像およびPDFテキストの抽出をサポートし、複数の言語でテキストを認識することができます。

OCR Foto(初心者向けチュートリアル):図1

長所

  • 高精度
  • 言語サポート
  • 他のGoogle Cloudサービスとの統合。

欠点

  • APIキーが必要です
  • 特定の使用閾値を超えると完全に無料ではありません。

手順1 APIキーを取得

  • Google Cloud Consoleを訪問してください。
  • 新規プロジェクトを作成するか、既存のプロジェクトを選択します。
  • Cloud Vision APIを有効にして、APIキーを生成します。

ステップ 2 APIリクエストを作成

  • お好みのプログラミング言語やcURLのようなツールを使用して、HTTP POSTリクエストを行います。
  • リクエストペイロードに画像ファイルまたはURLを含めてください。
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"

ステップ3: 結果を解析する

  • APIレスポンスから認識されたテキストを抽出します。
{
  "responses": [
    {
      "textAnnotations": [
        {
          "description": "Hello World!",
          "boundingPoly": { /* bounding box coordinates */ }
        }
      ]
    }
  ]
}

2. Tesseract OCR

Tesseractは、Googleによって開発されたオープンソースのOCRエンジンです。 100以上の言語をサポートしており、その精度と柔軟性のために広く利用されています。 複数のファイル形式から画像を変換し、スキャン画像を編集可能なテキストに変換することもできます。

OCR写真(初心者向けチュートリアル):図2

長所

  • オープンソース
  • 高精度
  • コミュニティサポート

欠点

  • 統合には追加のツールが必要な場合があります
  • 最適な結果を得るために画像を前処理する必要があるかもしれません。

ステップ 1 Tesseractをインストールする

  • 公式GitHubリポジトリからTesseract OCRをダウンロードしてインストールします。
  • TesseractフォルダーをPath環境変数に追加して、ターミナル内のどこからでもアクセスできるようにします。

ステップ 2 画像にOCRを実行する

  • ターミナルを開き、画像が含まれるフォルダーに移動します。
  • 次のコマンドを実行してください:
tesseract path/to/your/image.jpg output.txt
tesseract path/to/your/image.jpg output.txt
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'tesseract path/@to/your/image.jpg output.txt
$vbLabelText   $csharpLabel

ステップ3 結果を表示

  • 生成されたテキストファイル(output.txt)を開いて、抽出されたテキストを確認してください。

ABBYY FineReader オンライン

ABBYY FineReader Onlineは、ユーザーがスキャンされたドキュメントや画像を編集可能な形式に変換できるクラウドベースのOCRサービスです。

このオンラインツールは、画像からテキストを抽出するための無料OCRベースのテキストコンバーターを提供します。

OCR写真(初級者向けチュートリアル):図3

長所

  • ユーザーフレンドリーな画像OCRツール
  • さまざまな入力形式をサポート
  • 文書の書式設定を保持

欠点

  • 限定無料使用
  • インターネット接続が必要です

ステップ1 ABBYY FineReader Onlineにアクセス

  • ABBYY FineReader Online のウェブサイトにアクセスしてください。
  • WindowsまたはMac用の無料トライアルをダウンロードしてください。
  • ソフトウェアをインストールし、指定された手順に従ってください。

ステップ2 画像をアップロード

  • 「ファイルを選択」ボタンをクリックし、画像をアップロードしてください。

ステップ3 画像の処理

  • 画像の処理を待ってください。 ツールは自動的にテキストを抽出します。

ステップ 4 テキスト編集

  • 抽出されたテキストを保存するか、エディタを使用して必要な修正を行ってください。
  • Word、Excel、Text形式で保存。

4. オンラインOCR

オンラインOCRは、オンラインで画像をテキストに変換するための複数言語をサポートするウェブベースのOCRサービスです。 ユーザーはデバイスから直接画像をアップロードするか、URLを提供することができます。

長所

  • シンプルなユーザーインターフェース
  • さまざまな入力形式をサポート
  • 制限付きで無料で使用可能

欠点

  • 限定無料機能
  • インターネット接続に依存

ステップ1 オンラインOCRにアクセス

オンラインOCRのウェブサイトに移動します。

ステップ2 画像をアップロード

「ファイルを選択」ボタンをクリックし、画像をアップロードしてください。

OCRフォト(初心者向けチュートリアル):図4

ステップ3 言語と出力形式を選択

画像内のテキストの言語と出力形式を選択してください。

OCR Foto (初心者向けチュートリアル): 図5

ステップ 4 OCRを開始

「Convert」ボタンをクリックしてOCRプロセスを開始します。

ステップ 5 テキストをダウンロード

処理が完了したら、提供されたリンクから抽出されたテキストをダウンロードしてください。

OCRフォト (初心者チュートリアル): 図6

C#でのIronOCR紹介

では、強力なOCRライブラリであるIronOCRについて詳しく見ていきましょう。IronOCRはC#向けのライブラリで、開発者が簡単にOCR機能を実装できるツールを提供します。 IronOCRは、Iron Softwareチームによって開発されたC#用の主要なOCRライブラリです。

IronOCR は、C# 開発者向けに特別に設計された頑強な光学式文字認識 (OCR) ライブラリとして際立っています。画像からの正確でシームレスなテキスト抽出のための強力な機能を提供します。

その信頼性と効率性で知られるIronOCRは、画像やドキュメントからのテキスト抽出に関する包括的なソリューションを求めるC#開発者の間で人気を集めています。

精度と多様性に重点を置くことで、IronOCRは文書管理システムからデータ抽出アプリケーションに至るまでのプロジェクトで選ばれるツールとなっています。

高度なOCRアルゴリズムを活用することで、IronOCRはJPEG、PNG、TIFFなどのさまざまな画像形式からテキストを正確に判読することに優れています。 その多用途性は多言語サポートにも及んでおり、多様な言語要件に対応するアプリケーションにとって貴重なツールとなります。

このライブラリは人気のある.NETフレームワークとシームレスに統合され、C#アプリケーション内でOCR機能の実装の効率化を図ります。

スキャンされたドキュメントや画像を扱う場合でも、IronOCRの包括的な機能により、開発者はOCR機能をプロジェクトに簡単に組み込むことができます。

IronOCRの詳細機能

  1. 高度なOCRアルゴリズム:IronOCRは単なる文字認識を超える高度なOCRアルゴリズムを採用しており、複雑なシナリオでも高精度を保証します。

  2. 画像フォーマットのサポート: 開発者は、JPEG、PNG、TIFFなどのさまざまな画像フォーマットに対応したIronOCRのサポートを活用し、多様なビジュアルコンテンツを柔軟に処理することができます。

  3. 多言語サポート: アプリケーションのグローバルな性質を認識して、IronOCRは多言語サポートを備えており、異なる言語のテキストを正確に抽出することができます。

  4. PDFテキスト抽出: IronOCRは画像に加えて、PDFドキュメントからテキストを抽出する機能を拡張し、ドキュメントがデジタル形式で保存されているシナリオでの適用性を向上させます。

  5. .NETフレームワークとの統合: IronOCRは人気のある.NETフレームワークとシームレスに統合し、C#開発者がプロジェクトにOCR機能を煩雑な設定なしで組み込むことを容易にします。

C#でIronOCRを使用したOCRの実装

以下は、C#でIronOCRを使用して画像からテキストを抽出する簡単な例です:

using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
Imports IronOcr
Private imageText As String = (New IronTesseract()).Read("images\image.png").Text
$vbLabelText   $csharpLabel

以下は、IronOCRを使用して画像ファイルからテキストを読み取る方法を示すシンプルなC#コードスニペットです。開発者は、特定の要件に基づいてOCRプロセスをさらにカスタマイズできます。

IronOCRの高度な機能に関する詳細情報については、ドキュメントページをご覧ください。

結論

OCR写真ツールは、画像からテキストコンテンツをデジタル化する上で重要な役割を果たします。 さまざまなオンラインツールが利便性を提供する一方で、IronOCRは開発者にとってC#アプリケーションにOCR機能を統合するための強力で柔軟なソリューションを提供します。

オンラインツールとプログラムで実装されたライブラリの選択は、精度の要件、カスタマイズの必要性、開発者がOCRプロセスに求めるコントロールのレベルなどの要因に依存します。

IronOCRは無料体験版を提供しています。 こちらからソフトウェアをダウンロードしてください。

Kannaopat Udonpant
カンナパット・ウドンパント
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、カンナパットは日本の北海道大学から環境資源学の博士号を取得しました。学位を取得する過程で、カンナパットはバイオプロダクション工学部に所属する車両ロボティクス研究所のメンバーにもなりました。2022年には、C#のスキルを活かしてIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。カンナパットは、IronPDFで使用されているコードの大部分を作成した開発者から直接学べることに価値を見いだしています。同僚との学び合いに加えて、Iron Softwareで働くことの社会的側面も楽しんでいます。コードやドキュメントを書いていない時には、カンナパットは通常、PS5でゲームをしたり、『The Last of Us』を再視聴したりしています。
< 以前
開発者向けの最高の無料OCRソフトウェア
次へ >
アラビア語テキスト認識ツール:精度の向上