フッターコンテンツにスキップ
OCRツール

OCR Foto(初心者向けチュートリアル)

光学文字認識(OCR)技術は、デジタルの世界でテキストを扱う方法を革命的に変えました。 OCRフォトツールは、画像をテキストに変換する能力を提供し、印刷されたメモをデジタル化しやすくします。

この記事では、無料および有料のオンラインOCRツールを4つ紹介し、プログラミング的にC#でOCRを実装する方法を解説するIronOCRの紹介で締めくくります。

1. グーグルビジョンAPI

グーグルビジョンAPIは、グーグルが提供する画像をテキストに変換する強力なOCRソリューションを提供します。 画像およびPDFのテキスト抽出をサポートし、複数の言語でテキストを認識できます。

OCRフォト(初心者向けチュートリアル):図1

長所

  • 高精度
  • 言語サポート
  • 他のGoogle Cloudサービスとの統合。

短所

  • APIキーが必要
  • 一定の使用閾値を超えると完全に無料ではありません。

ステップ1:APIキーを取得

  • Google Cloud Consoleを訪問します。
  • 新しいプロジェクトを作成するか、既存のプロジェクトを選択します。
  • Cloud Vision APIを有効化し、APIキーを生成します。

ステップ2:APIリクエストを行います

  • cURLや選択したプログラミング言語を使ってHTTP POSTリクエストを行います。
  • リクエストのペイロードに画像ファイルまたはURLを含めます。
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
SHELL

ステップ3:結果を解析

  • APIレスポンスから認識されたテキストを抽出します。
{
  "responses": [
    {
      "textAnnotations": [
        {
          "description": "Hello World!",
          "boundingPoly": { /* bounding box coordinates */ }
        }
      ]
    }
  ]
}

2. テッセラクトOCR

テッセラクトは、Googleによって開発されたオープンソースのOCRエンジンです。 100を超える言語をサポートし、その正確性と柔軟性で広く使用されています。 複数のファイル形式から画像を変換し、スキャンされた画像を編集可能なテキストに変換します。

OCRフォト(初心者向けチュートリアル):図2

長所

  • オープンソース
  • 高精度
  • コミュニティサポート

短所

  • 統合には追加のツールが必要な場合があります
  • 最適な結果を得るためには画像の前処理が必要な場合があります。

ステップ1:テッセラクトをインストール

  • 公式GitHubリポジトリからテッセラクトOCRをダウンロードしてインストールします。
  • ターミナルからアクセスできるように、PATH環境変数にテッセラクトフォルダを追加します。

ステップ2:画像でOCRを実行

  • ターミナルを開き、画像を含むフォルダに移動します。
  • 次のコマンドを実行します。
tesseract path/to/your/image.jpg output.txt
tesseract path/to/your/image.jpg output.txt
SHELL

ステップ3:結果を見る

  • 生成されたテキストファイル(output.txt)を開いて、抽出されたテキストを確認します。

3. ABBYYファインリーダーオンライン

ABBYYファインリーダーオンラインは、スキャンされた文書や画像を編集可能な形式に変換するクラウドベースのOCRサービスです。

このオンラインツールは、画像からのテキスト抽出作業を煩わしさなく行うOCRベースのテキストコンバーターを無料で提供します。

OCRフォト(初心者向けチュートリアル):図3

長所

  • ユーザーフレンドリーな画像OCRツール
  • 様々な入力形式をサポート
  • 文書の書式を保持

短所

  • 限られた無料利用
  • インターネット接続が必要

ステップ1:ABBYYファインリーダーオンラインを訪問

  • ABBYYファインリーダーオンラインのウェブサイトを訪問します。
  • WindowsまたはMac用の無料トライアルをダウンロードします。
  • ソフトウェアをインストールし、提供された手順に従います。

ステップ2:画像をアップロード

  • 「ファイルを選択」ボタンをクリックして画像をアップロードします。

ステップ3:画像を処理

  • 画像処理を待ちます。 ツールは自動的にテキストを抽出します。

ステップ4:テキストを編集

  • 抽出されたテキストを保存またはエディタを使用して必要な修正を行います。
  • Word、Excel、およびテキスト形式で保存します。

4. オンラインOCR

オンラインOCRは、複数の言語をサポートするオンラインの画像からテキストへ変換するサービスです。 ユーザーは、デバイスから直接画像をアップロードするか、URLを提供できます。

長所

  • シンプルなユーザーインターフェース
  • 様々な入力形式をサポート
  • 制限付きで無料使用可能

短所

  • 制限された無料機能
  • インターネット接続に依存

ステップ1:オンラインOCRを訪問

オンラインOCRのウェブサイトを訪問します。

ステップ2:画像をアップロード

「ファイルを選択」ボタンをクリックして画像をアップロードします。

OCRフォト(初心者向けチュートリアル):図4

ステップ3:言語と出力形式を選択

画像内のテキストの言語と出力形式を選択します。

OCRフォト(初心者向けチュートリアル):図5

ステップ4:OCRを開始

「変換」ボタンをクリックしてOCRプロセスを開始します。

ステップ5:テキストをダウンロード

プロセスが完了したら、提供されたリンクから抽出されたテキストをダウンロードします。

OCRフォト(初心者向けチュートリアル):図6

IronOCRの紹介 C#

さあ、C#用の強力なOCRライブラリであるIronOCRを詳しく見ていきましょう。開発者にOCR機能をシームレスに実装するためのツールを提供します。 IronOCRはIron Softwareチームによって開発された、C#のための主要なOCRライブラリです。

IronOCRは、特にC#開発者のために設計された強力な光学文字認識(OCR)ライブラリとして際立っており、画像からの正確でシームレスなテキスト抽出を可能にする強力な機能を備えています。

IronOCRはその信頼性と効率性で知られ、画像や文書からのテキスト抽出の包括的なソリューションを求めるC#開発者の間で人気を博しています。

正確さと多様性に焦点を当てたIronOCRは、文書管理システムからデータ抽出アプリケーションに至るまで、様々なプロジェクトに適した選択肢となっています。

IronOCRは高度なOCRアルゴリズムを活用してJPEG、PNG、TIFFを含む様々な画像形式からのテキストを正確に解読することに優れています。 その多様性は多言語サポートにまで及び、多様な言語のニーズに応じたアプリケーションにとって貴重なツールとなります。

このライブラリは人気のある.NETフレームワークとシームレスに統合され、C#アプリケーション内でOCR機能の実装を簡便化します。

スキャンされた文書や画像を扱う場合でも、IronOCRの包括的な機能により、開発者はプロジェクトにOCR機能を容易に取り込むことができます。

IronOCRの詳細な機能

  1. 高度なOCRアルゴリズム: IronOCRは基本的な文字認識を超える高度なOCRアルゴリズムを採用し、複雑なシナリオでも高精度を確保します。
  2. 画像形式のサポート: 開発者は、JPEG、PNG、TIFFなどの様々な画像形式をサポートするIronOCRの機能を活用でき、様々な視覚コンテンツの処理に柔軟性を提供します。
  3. 多言語サポート: アプリケーションの国際的な性質を認識し、IronOCRは多言語サポートを備え、異なる言語のテキストを正確に抽出できるようになっています。
  4. PDFテキスト抽出: 画像に加えて、IronOCRはPDF文書からのテキスト抽出の機能も拡張し、デジタル形式で保存された文書のシナリオにおいてその適用性を高めます。
  5. .NETフレームワークとの統合: IronOCRは人気のある.NETフレームワークとシームレスに統合され、簡便にC#開発者がプロジェクトにOCR機能を取り込むことができます。

IronOCRによるC#でのOCRの実装

以下はIronOCRを使用して画像からテキストを抽出する、C#の簡単な例です:

using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
Imports IronOcr ' Import the IronOcr namespace

' Create an instance of IronTesseract
Private ocr = New IronTesseract()

' Read text from the specified image file
Private imageText As String = ocr.Read("images\image.png").Text

' Output the extracted text
Console.WriteLine(imageText)
$vbLabelText   $csharpLabel

このシンプルなC#コードスニペットは、IronOCRを使用して画像ファイルからテキストを読み取る方法を示しています。開発者は特定の要件に基づいてOCRプロセスをさらにカスタマイズできます。

IronOCRの高度な機能に関する詳細情報は、ドキュメントページを参照してください。

結論

OCRフォトツールは、画像からテキストコンテンツをデジタル化する上で重要な役割を果たします。 様々なオンラインツールが便利さを提供する一方で、IronOCRはC#アプリケーションにOCR機能を統合するための強力で柔軟なソリューションを開発者に提供します。

オンラインツールとプログラム的に実装されたライブラリの選択は、精度要件やカスタマイズのニーズ、OCRプロセスに対する開発者の制御レベルなど、要因に応じて異なります。

IronOCRは無料トライアルを提供しています。 こちらからソフトウェアをダウンロードしてください。

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。