OCRツール

初心者向けOCR写真チュートリアル

公開済み 2023年12月12日
共有:

イントロダクション

光学文字認識 (OCR)(OCR (光学式文字認識))テクノロジーはデジタル世界におけるテキストとのインタラクションの方法を革命的に変えました。 OCRフォトツールは、画像をテキストに変換する機能を提供し、印刷された文書や手書きのメモをデジタル化することを容易にします。

この記事では、無料および有料の4つのオンラインOCRツールを紹介し、最後にIronOCRを紹介して、C#でOCRをプログラム的に実装する方法を示します。

Google Vision API (グーグルビジョンAPI)

Google Vision API (グーグルビジョンAPI)Google 提供の強力なOCRソリューションを使用して、画像からテキストへのコンバーターを作成します。 それは画像およびPDFテキストの抽出をサポートし、複数の言語でテキストを認識することができます。

OCRフォト (初級チュートリアル): 図1

長所

  • 高精度
  • 言語サポート
  • 他のGoogle Cloudサービスとの統合。

欠点

  • APIキーが必要です
  • 特定の使用閾値を超えると完全に無料ではありません。

手順1 APIキーを取得

  • ウェブサイトに訪問してくださいGoogle Cloud コンソール.
  • 新規プロジェクトを作成するか、既存のプロジェクトを選択します。
  • Cloud Vision APIを有効にして、APIキーを生成します。

ステップ 2 APIリクエストを作成

  • お好みのプログラミング言語やcURLのようなツールを使用して、HTTP POSTリクエストを行います。
  • リクエストペイロードに画像ファイルまたはURLを含めてください。
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"

ステップ3: 結果を解析する

  • APIレスポンスから認識されたテキストを抽出します。
{
  "responses": [
    {
      "textAnnotations": [
        {
          "description": "Hello World!",
          "boundingPoly": { /* bounding box coordinates */ }
        }
      ]
    }
  ]
}

2. Tesseract OCR

Tesseract OCR (Optical Character Recognition) とは、画像やPDFファイルからテキストを抽出するためのオープンソースのツールです。Tesseract OCRは、多言語のサポートと高精度なテキスト認識を特徴としており、非常に人気があります。

IronOCRはTesseract OCRを活用して、画像やPDFからテキストを抽出する機能を提供します。この高度なOCRライブラリを用いることで、開発者はC#プロジェクトに簡単にテキスト認識機能を組み込むことができます。

IronOCRなら、次のような特徴や機能を利用することができます:

  • OCRの精度の向上
  • 複数言語のサポート
  • 簡単なインテグレーション
  • 高速なテキスト抽出能力

IronOCR for .NETを使用することにより、従来のOCRソリューションを超える性能を簡単に実現できます。

テッセラクトは、Googleによって開発されたオープンソースのOCRエンジンです。 100以上の言語をサポートしており、その精度と柔軟性のために広く利用されています。 複数のファイル形式の画像を変換し、スキャンした手書き画像を編集可能なテキストに変換するのに役立ちます。

OCRフォト(初心者向けチュートリアル):図2

長所

  • オープンソース
  • 高精度
  • コミュニティサポート

欠点

  • 統合には追加のツールが必要な場合があります
  • 最適な結果を得るために画像を前処理する必要があるかもしれません。

ステップ 1 Tesseractをインストールする

  • 次のリンクからTesseract OCRをダウンロードしてインストールしてください。Official GitHub Repository.
  • TesseractフォルダーをPath環境変数に追加して、ターミナル内のどこからでもアクセスできるようにします。

ステップ 2 画像にOCRを実行する

  • ターミナルを開き、画像が含まれるフォルダーに移動します。
  • 次のコマンドを実行してください:
tesseract path/to/your/image.jpg output.txt
tesseract path/to/your/image.jpg output.txt
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'tesseract path/@to/your/image.jpg output.txt
VB   C#

ステップ3 結果を表示

  • 生成されたテキストファイルを開く(output.txt)抽出されたテキストを表示する。

ABBYY FineReader オンライン

ABBYY FineReader(アビー ファインリーダー)オンラインは、ユーザーがスキャンされた文書や画像を編集可能な形式に変換できるクラウドベースのOCRサービスです。

このオンラインツールは、画像からテキストを抽出するための無料OCRベースのテキストコンバーターを提供します。

OCRフォト(初心者向けチュートリアル):図3

長所

  • ユーザーフレンドリーな画像OCRツール
  • さまざまな入力形式をサポート
  • 文書の書式設定を保持

欠点

  • 限定無料使用
  • インターネット接続が必要です

ステップ1 ABBYY FineReader Onlineにアクセス

  • に移動しますABBYY FineReader オンラインウェブサイト。
  • WindowsまたはMac用の無料トライアルをダウンロードしてください。
  • ソフトウェアをインストールし、指定された手順に従ってください。

ステップ2 画像をアップロード

  • 「ファイルを選択」ボタンをクリックし、画像をアップロードしてください。

ステップ3 画像の処理

  • 画像の処理を待ってください。 ツールは自動的にテキストを抽出します。

ステップ 4 テキスト編集

  • 抽出されたテキストを保存するか、エディタを使用して必要な修正を行ってください。
  • Word、Excel、Text形式で保存。

4. オンラインOCR

オンラインOCRは、オンライン画像からテキストへの変換をサポートする多言語対応のWebベースのOCRサービスです。 ユーザーはデバイスから直接画像をアップロードするか、URLを提供することができます。

長所

  • シンプルなユーザーインターフェース
  • さまざまな入力形式をサポート
  • 制限付きで無料で使用可能

欠点

  • 限定無料機能
  • インターネット接続に依存

ステップ1 オンラインOCRにアクセス

に移動しますオンラインOCRウェブサイト。

ステップ2 画像をアップロード

「ファイルを選択」ボタンをクリックし、画像をアップロードしてください。

OCR写真(初心者向けチュートリアル):図4

ステップ3 言語と出力形式を選択

画像内のテキストの言語と出力形式を選択してください。

OCR Foto(初心者向けチュートリアル):図5

ステップ 4 OCRを開始

「Convert」ボタンをクリックしてOCRプロセスを開始します。

ステップ 5 テキストをダウンロード

処理が完了したら、提供されたリンクから抽出されたテキストをダウンロードしてください。

OCR写真(初心者向けチュートリアル):図6

C#でのIronOCR紹介

では、強力なOCRライブラリであるIronOCRについて詳しく見ていきましょう。IronOCRはC#向けのライブラリで、開発者が簡単にOCR機能を実装できるツールを提供します。 IronOCRは、Iron Softwareチームによって開発されたC#用の主要なOCRライブラリです。

IronOCR抜群の堅牢な光学文字認識(OCR)として際立っています(OCR (光学式文字認識))C# 開発者向けに特別に設計されたライブラリで、画像からの正確でシームレスなテキスト抽出のための強力な機能を提供します。

その信頼性と効率性で知られるIronOCRは、画像やドキュメントからのテキスト抽出に関する包括的なソリューションを求めるC#開発者の間で人気を集めています。

精度と多様性に重点を置くことで、IronOCRは文書管理システムからデータ抽出アプリケーションに至るまでのプロジェクトで選ばれるツールとなっています。

高度なOCRアルゴリズムを活用することで、IronOCRはJPEG、PNG、TIFFなどのさまざまな画像形式からテキストを正確に判読することに優れています。 その多用途性は多言語サポートにも及んでおり、多様な言語要件に対応するアプリケーションにとって貴重なツールとなります。

このライブラリは人気のある.NETフレームワークとシームレスに統合され、C#アプリケーション内でOCR機能の実装の効率化を図ります。

スキャンされたドキュメントや画像を扱う場合でも、IronOCRの包括的な機能により、開発者はOCR機能をプロジェクトに簡単に組み込むことができます。

IronOCRの詳細機能

  1. 高度なOCRアルゴリズム: IronOCRは基本的な文字認識を超えた高度なOCRアルゴリズムを採用しており、複雑なシナリオでも高い精度を確保します。

  2. 画像形式のサポート: 開発者は、JPEG、PNG、TIFFなどのさまざまな画像形式をサポートするIronOCRの機能を活用することができ、多様なビジュアルコンテンツを柔軟に扱うことができます。

  3. マルチ言語サポート: アプリケーションのグローバル性を認識して、IronOCRはマルチ言語サポートを備えており、異なる言語のテキストを正確に抽出することができます。

  4. PDFテキスト抽出: 画像に加えて、IronOCRはPDF文書からのテキスト抽出機能も拡張し、文書がデジタル形式で保存されているシナリオにおいてその適用性を高めます。

  5. .NETフレームワークとの統合: IronOCRは人気のある.NETフレームワークとシームレスに統合されるため、C#開発者が面倒な設定を行うことなく、プロジェクトにOCR機能を組み込むことが簡単にできます。

C#でIronOCRを使用したOCRの実装

以下は、C#でIronOCRを使用する簡単な例です画像からテキストを抽出する:

using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
Imports IronOcr
Private imageText As String = (New IronTesseract()).Read("images\image.png").Text
VB   C#

以下は、IronOCRを使用して画像ファイルからテキストを読み取る方法を示すシンプルなC#コードスニペットです。開発者は、特定の要件に基づいてOCRプロセスをさらにカスタマイズできます。

高度な機能に関する詳細情報については、IronOCR のウェブサイトをご覧ください。ドキュメントページ

結論

OCR写真ツールは、画像からテキストコンテンツをデジタル化する上で重要な役割を果たします。 さまざまなオンラインツールが利便性を提供する一方で、IronOCRは開発者にとってC#アプリケーションにOCR機能を統合するための強力で柔軟なソリューションを提供します。

オンラインツールとプログラムで実装されたライブラリの選択は、精度の要件、カスタマイズの必要性、開発者がOCRプロセスに求めるコントロールのレベルなどの要因に依存します。

IronOCRは以下を提供しています無料体験が必要です。 ソフトウェアをダウンロードしてください[以下の内容を日本語に翻訳します:

ここに

ご希望のイディオムや技術用語が追加されることによって、より適切な翻訳が提供できる場合もありますので、詳細なコンテキストを教えていただけると幸いです。](/csharp/ocr/).

< 以前
開発者向けの最高の無料OCRソフトウェア
次へ >
アラビア語テキスト認識ツール:精度の向上