フッターコンテンツにスキップ
OCRツール

OCR Foto(初心者向けチュートリアル)

光学文字認識 (OCR) 技術は、デジタル世界でのテキストとのインタラクションの仕方を革命的に変えました。 OCR 写真ツールは画像をテキストに変換する能力を可能にし、印刷されたノートをデジタル化することを容易にします。

この記事では、無料および有料の4つのオンラインOCRツールを探り、C#でプログラム的に実装できるIronOCRの紹介を最後に行います。

1. Google Vision API

Google Vision API は、Googleによって提供される画像からテキストへのコンバーターを作成するための強力なOCRソリューションを提供します。 それは画像およびPDFのテキスト抽出をサポートし、複数の言語でのテキスト認識が可能です。

OCR写真 (初心者向けチュートリアル):図1

利点

  • 高い精度
  • 言語サポート
  • 他のGoogleクラウドサービスとの統合。

欠点

  • APIキーが必要
  • 一定の使用しきい値を超えると完全には無料でない。

ステップ1:APIキーの取得

  • Google Cloud Consoleにアクセスします。
  • 新しいプロジェクトを作成するか、既存のものを選択します。
  • Cloud Vision APIを有効にしてAPIキーを生成します。

ステップ2:APIリクエストの作成

  • cURLのようなツールやあなたの選択したプログラミング言語を使ってHTTP POSTリクエストを作成します。
  • リクエストのペイロードに画像ファイルまたはURLを含めます。
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
SHELL

ステップ3:結果の解析

  • API応答から認識されたテキストを抽出します。
{
  "responses": [
    {
      "textAnnotations": [
        {
          "description": "Hello World!",
          "boundingPoly": { /* bounding box coordinates */ }
        }
      ]
    }
  ]
}

2. Tesseract OCR

Tesseractは、Googleによって開発されたオープンソースのOCRエンジンです。 それは100以上の言語をサポートし、その精度と柔軟性で広く使用されています。 複数のファイルフォーマットから画像を変換し、スキャンされた画像を編集可能なテキストにさえ変換します。

OCR写真 (初心者向けチュートリアル):図2

利点

  • オープンソース
  • 高い精度
  • コミュニティサポート

欠点

  • 統合には追加のツールが必要な場合がある
  • 最適な結果のために画像の前処理が必要な場合がある。

ステップ1:Tesseractのインストール

  • 公式GitHubリポジトリからTesseract OCRをダウンロードしてインストールします。
  • Tesseractフォルダを環境変数PATHに追加して、ターミナルからアクセスできるようにします。

ステップ2:画像でOCRを実行

  • ターミナルを開き、画像が含まれているフォルダに移動します。
  • 次のコマンドを実行します:
tesseract path/to/your/image.jpg output.txt
tesseract path/to/your/image.jpg output.txt
SHELL

ステップ3:結果の閲覧

  • 生成されたテキストファイル (output.txt) を開いて抽出されたテキストを確認します。

3. ABBYY FineReader Online

ABBYY FineReader Onlineは、スキャンされたドキュメントや画像を編集可能なフォーマットに変換するクラウドベースのOCRサービスです。

このオンラインツールは、画像からのテキスト抽出を手間なく行うための無料利用可能なOCRベースのテキストコンバーターを提供します。

OCR写真 (初心者向けチュートリアル):図3

利点

  • 使いやすい画像OCRツール
  • 様々な入力フォーマットのサポート
  • ドキュメントのフォーマットを保持

欠点

  • 制限された無料利用
  • インターネット接続が必要

ステップ1:ABBYY FineReader Onlineにアクセス

  • ABBYY FineReader Onlineのウェブサイトに移動します。
  • Windows または Mac 用の無料トライアルをダウンロードします。
  • ソフトウェアをインストールし、提示された手順に従います。

ステップ2:画像アップロード

  • "ファイルを選択" ボタンをクリックして、画像をアップロードします。

ステップ3:画像の処理

  • 画像の処理を待ちます。 ツールはテキストを自動的に抽出します。

ステップ4:テキストの編集

  • 抽出したテキストを保存するか、必須の修正を行うためにエディターを使用します。
  • Word、Excel、およびテキストフォーマットで保存します。

4. Online OCR

Online OCR はオンラインの画像からテキストへの変換をサポートするWEBベースのOCRサービスで、複数の言語をサポートします。 ユーザーはデバイスから直接画像をアップロードするか、URLを提供できます。

利点

  • シンプルなユーザーインターフェース
  • 様々な入力フォーマットのサポート
  • 制限付きで無料で利用可能

欠点

  • 制限された無料機能
  • インターネット接続に依存

ステップ1:Online OCRにアクセス

Online OCRのウェブサイトに移動します。

ステップ2:画像アップロード

"ファイルを選択" ボタンをクリックし、画像をアップロードします。

OCR写真 (初心者向けチュートリアル):図4

ステップ3:言語と出力フォーマットを選択

画像のテキストの言語と出力フォーマットを選択します。

OCR写真 (初心者向けチュートリアル):図5

ステップ4:OCR開始

"変換" ボタンをクリックしてOCRプロセスを開始します。

ステップ5:テキストをダウンロード

プロセスが完了したら、提供されたリンクから抽出されたテキストをダウンロードします。

OCR写真 (初心者向けチュートリアル):図6

IronOCRのC#での紹介

さて、次はC#の強力なOCRライブラリであるIronOCRについて掘り下げ、OCR機能をシームレスに実装するためのツールを開発者に提供します。 IronOCRはIron Softwareチームによって開発されたC#用の主要なOCRライブラリです。

IronOCRは、特にC#開発者向けに設計された堅牢な光学文字認識(OCR)ライブラリとして際立っており、正確でシームレスな画像からのテキスト抽出のための強力な機能を提供します。

その信頼性と効率性で知られるIronOCRは、画像やドキュメントからのテキスト抽出のための包括的なソリューションを求めるC#開発者の間で人気を博しています。

正確さと多様性に重点を置いて、IronOCRはドキュメント管理システムからデータ抽出アプリケーションに至るまでのプロジェクトの優先する選択肢となっています。

先進的なOCRアルゴリズムを活用して、IronOCRはJPEGやPNG、TIFFを含むさまざまな画像形式から正確にテキストを解読することに優れています。 その多様性はマルチランゲージサポートに及び、多様な言語ニーズを満たすアプリケーションにとって貴重なツールとなっています。

このライブラリは人気のある.NETフレームワークとシームレスに統合され、C#アプリケーション内でのOCR機能の実装をスムーズに進めています。

スキャンされたドキュメントや画像を扱う場合も、IronOCRの包括的な機能は開発者がプロジェクトにOCR機能を簡単に組み込めるようにしています。

IronOCRの詳細な特徴

  1. 高度なOCRアルゴリズム: IronOCRは高度なOCRアルゴリズムを採用しており、基本的な文字認識を超えて複雑なシナリオでも高い精度を保証します。
  2. 画像フォーマットサポート: 開発者は、JPEG、PNG、TIFFなどのさまざまな画像形式のサポートを活用でき、多様なビジュアルコンテンツを扱う柔軟性を提供します。
  3. マルチランゲージサポート: アプリケーションのグローバルな性質を認識して、IronOCRは多言語サポートを備えており、異なる言語のテキストを正確に抽出します。
  4. PDFテキスト抽出: 画像に加えて、IronOCRはPDFドキュメントからのテキスト抽出の機能を拡張し、デジタル形式でドキュメントが保存されているシナリオでの適用性を高めます。
  5. .NETフレームワークとの統合: IronOCRは人気のある.NETフレームワークとシームレスに統合されており、C#開発者が広範な設定なしにプロジェクトにOCR機能を組み込むことを容易にします。

C#でのIronOCRによるOCRの実装

以下は、画像からテキストを抽出するためのIronOCRの使用例です:

using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
Imports IronOcr ' Import the IronOcr namespace

' Create an instance of IronTesseract
Private ocr = New IronTesseract()

' Read text from the specified image file
Private imageText As String = ocr.Read("images\image.png").Text

' Output the extracted text
Console.WriteLine(imageText)
$vbLabelText   $csharpLabel

この簡単なC#のコードスニペットは、IronOCRが画像ファイルからテキストを読み取る方法を示しています。開発者は特定の要件に基づいてOCRプロセスをさらにカスタマイズできます。

IronOCRの高度な機能の詳細情報はドキュメントページをご覧ください。

結論

OCR写真ツールは、画像からのテキスト内容のデジタル化において重要な役割を果たします。 さまざまなオンラインツールが利便性を提供する一方で、IronOCRは開発者にC#アプリケーションにOCR機能を統合するための強力で柔軟なソリューションを提供します。

オンラインツールとプログラム的に実装されたライブラリとの選択は、精度要件、カスタマイズのニーズ、および開発者がOCRプロセスに求める制御のレベルなどの要因によります。

IronOCRは無料トライアルを提供しており、必ずしも必要です。 ここからソフトウェアをダウンロードします。

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。