フッターコンテンツにスキップ
OCRツール

Power Automate OCR(開発者向けチュートリアル)

光学式文字認識 (OCR) は、画像、スキャンされた文書、PDF からテキストをスキャンして、機械で読み取り可能なテキストに変換するテクノロジーです。 OCR を使用すると、コンピューターでさまざまな形式 (書籍、領収書、フォーム、写真など) を識別し、デジタル化して PDF データの抽出を自動化できます。 画像内の文字とそのパターンを分析し、テキストに対応させます。 この光学文字認識技術は、文書のデジタル化、PDF データの自動抽出と入力、請求書処理、スキャンした PDF の検索可能化などのアプリケーションで採用されています。

OCR は劇的に改善され、表や列などのレイアウトの理解が複雑なさまざまな言語を認識して読み取ることができるようになりました。 高度な OCR 機能ソフトウェアでは、画像の前処理技術も使用されます。 これらにはノイズ除去やコントラスト調整が含まれ、低品質の画像を読み取る際の OCR ソフトウェアの精度が向上します。 最も人気のある OCR ツールは、高い精度と柔軟性を備えた Tesseract OCR エンジン、Power Automate、IronOCR の 3 つです。 OCR は、企業、研究者、開発者にとって、ドキュメントの管理とテキスト認識をアウトソーシングするために欠かせないツールとなっています。

Microsoft Power Automate OCR とは何ですか?

Microsoft Power Automateによる光学式文字認識: この機能を使用すると、企業は画像、スキャンしたドキュメント、PDF からテキストを抽出し、簡単に編集でき、機械で読み取り可能な形式に変換する作業を自動化できます。 Microsoft Power Platform の一部である Power Automate デスクトップおよびオンラインを使用すると、ユーザーはコーディング能力を必要とせずにフローを作成できます。 ワークフローに OCR を統合することで、面倒なデータ入力を自動化し、請求書を処理し、ドキュメントをデジタル化することができます。

これにより時間が節約され、エラーが最小限に抑えられます。 これはまさに、Power Automate の OCR 機能でさまざまな形式や言語をサポートできる強力な検索ツールです。 AI Builder を使用して構築されており、複数の業界でのテキスト認識の使用をサポートします。 Excel、SharePoint、OneDrive などの他の Microsoft サービスとシームレスに統合され、ドキュメントのスキャンから保存、共有まで、エンドツーエンドの自動化を可能にします。 これにより、組織は効率性を高め、ドキュメント管理を合理化し、活動における運用精度を高めることができます。

Power Automate に OCR を導入するメリット

Power Automate で OCR を実装すると、次の利点があります。

時間と労力の節約:ドキュメントのテキスト抽出を自動化することで、手動でのデータ入力にかかる時間と労力を大幅に節約できます。

コスト効率が高い:ユーザーフレンドリーでアクセスしやすいため、高価なカスタム ソフトウェア ソリューションが不要になります。

統合: Microsoft Power Automate は、SharePoint、OneDrive、さらには Excel などの他の Microsoft 365 サービスとのシームレスな統合を提供します。

スケーラビリティ:一度に数千のドキュメントを処理できるため、大規模な企業に適しています。

エラーの削減:データ入力プロセスを自動化すると、人為的エラーの可能性が最小限に抑えられます。

Power AutomateでOCRを使う方法

Power Automateは、AI BuilderやOneDriveなど、様々な接続を介してOCR機能をサポートしています。Power Automateオンラインまたはデスクトップを使用してOCR対応ワークフローを作成する手順については、以下のステップバイステップガイドをご覧ください。

1. Power Automateをセットアップする

まず、Power Automate アカウントにログインするか、アカウントがない場合はサインアップしてください。 Power Automate は Microsoft 365 の一部であるため、Office 365 または Dynamics 365 を使用している場合は既にアクセスできます。

2. 新しい流れを作る

[作成] タブを開き、[インスタント フロー] をクリックして、手動で開始できる新しいフローを作成します。

フローに名前を付けます。 たとえば、"承認前"という名前を付け、次のトリガーを選択します: フォルダー (SharePoint または OneDrive) にファイルが作成されたとき、またはフローを手動でトリガーします。

以下に示すような新しい Power Automation フローが作成されます。

! Power Automate OCR (開発者向けチュートリアル): 図 5 - 新しい自動化フロー

3. OneDriveまたはSharePointにファイルをアップロードする

ドキュメント (画像または PDF) を OneDrive for Business または SharePoint にアップロードするアクションを追加します。 このアクションにより、OCR プロセスがトリガーされ、データが抽出されます。 このデモでは、SharePoint ドキュメント ライブラリを使用します。

! Power Automate OCR (開発者向けチュートリアル): 図 6 - ファイルのアップロード

4. AIビルダーのOCRアクションを活用する

AI Builder を利用して、"画像からテキストを抽出する"アクションを開発します。 AI Builder は、Power Automate の機械学習と深く統合された機能であり、ユーザーが画像や PDF からテキストを簡単に識別できるようにする事前トレーニング済みの OCR モデルを備えています。

! Power Automate OCR (開発者向けチュートリアル): 図 7 - AI ビルダー

テキストを抽出する画像ファイルを選択します。

! Power Automate OCR (開発者向けチュートリアル): 図 8 - 画像の選択

5. 抽出されたデータの処理

OCR によってテキストが抽出されると、さらに処理することができます。 例えば:

抽出したテキストを Excel 形式で保存します。 "行を追加"アクションを使用して、抽出したテキストを Excel ファイルに挿入します。

テキストを電子メールで渡す: "電子メールの送信"アクションを使用して、抽出されたテキストを指定された受信者に転送します。

データベースに保存:コネクタを使用して、データを SQL Server、SharePoint リスト、またはその他のデータベースにプッシュして保存します。

IronOCRとは何ですか?

IronOCR は、画像、PDF、スキャンから OCR を使用してテキストを正確に抽出できる強力な .NET OCR ライブラリです。 他のライブラリでは画像品質が低かったり、画像にノイズがあったりしてテキスト認識が困難な場合に優れており、125 を超える言語をサポートしているため、多言語の使用例に最適です。 IronOCR には、言語の自動検出、画像の前処理、ノイズ除去、傾き補正、元のレイアウトを維持しながらドキュメントを検索可能な PDF に変換するなどの高度な機能が含まれています。

! Power Automate OCR (開発者向けチュートリアル): 図 9 - IronOCR

この製品は、シンプルな.NETプロジェクトAPIを介して簡単に組み込むことができるため、開発者は開発中のアプリケーションにOCR機能を実装できます。このライブラリは、ドキュメントのデジタル化、データ入力の自動化ワークフロー、そしてエンタープライズレベルのアプリケーションにおける高精度かつスケーラビリティの高いテキスト抽出タスクに特に役立ちます。 使いやすさと強力な OCR 機能が強みです。

IronOCRの特徴

  • 低解像度の画像やノイズの多いスキャンされた文書からでも、優れたテキスト抽出精度を実現します。
  • 125 以上の言語をサポートし、さまざまな言語環境で使用できるように自動言語検出機能を備えています。
  • ノイズ低減、スキュー補正、コントラスト強調、シャープ化などの画像前処理ツールを提供し、不完全な画像のパフォーマンスを向上させます。
  • スキャンしたドキュメントまたは画像を元のレイアウトのまま完全に検索可能な PDF に変換し、全文検索可能な PDF を作成します。
  • レイアウトと書式設定を保持し、ソース ドキュメントの構造、フォント、書式を維持します。これは、表や列を含む複雑なドキュメントに不可欠です。
  • バッチ処理: 1 回の操作で複数の画像またはドキュメントをバッチ処理できるため、大量のドキュメント処理をサポートします。
  • .NET との簡単な統合: .NET アプリケーションとの簡単な統合を可能にするシンプルな API をサポートしているため、開発者は大きな労力をかけずに OCR を実装できます。

OCRを実行するためのサンプルコード

using IronOcr;

class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine
        var Ocr = new IronTesseract();

        // Set language
        Ocr.Language = OcrLanguage.English;

        // Path to the image file
        var inputFile = @"path\to\your\image.png";

        // Read the image and perform OCR
        using (var Input = new OcrInput(inputFile))
        {
            // Perform OCR
            var Result = Ocr.Read(Input);

            // Display the extracted text in the console
            Console.WriteLine("Extracted Text:");
            Console.WriteLine(Result.Text);
        }
    }
}
using IronOcr;

class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine
        var Ocr = new IronTesseract();

        // Set language
        Ocr.Language = OcrLanguage.English;

        // Path to the image file
        var inputFile = @"path\to\your\image.png";

        // Read the image and perform OCR
        using (var Input = new OcrInput(inputFile))
        {
            // Perform OCR
            var Result = Ocr.Read(Input);

            // Display the extracted text in the console
            Console.WriteLine("Extracted Text:");
            Console.WriteLine(Result.Text);
        }
    }
}
Imports IronOcr

Friend Class Program
	Shared Sub Main(ByVal args() As String)
		' Initialize Iron Tesseract OCR engine
		Dim Ocr = New IronTesseract()

		' Set language
		Ocr.Language = OcrLanguage.English

		' Path to the image file
		Dim inputFile = "path\to\your\image.png"

		' Read the image and perform OCR
		Using Input = New OcrInput(inputFile)
			' Perform OCR
			Dim Result = Ocr.Read(Input)

			' Display the extracted text in the console
			Console.WriteLine("Extracted Text:")
			Console.WriteLine(Result.Text)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

結論

IronOCR と Power Automate OCR はどちらもテキスト認識に非常に強力ですが、Power Automate OCR がサポートする単純なケースを超えた本格的な OCR 機能を必要とする開発者や企業にとって、IronOCR のソリューションははるかに堅牢で多用途です。 Power Automate の OCR エンジンはシンプルなワークフロー向けに設計されており、追加のサブスクリプションが必要になる場合があります。

対照的に、IronOCR は、低品質の入力画像を扱う場合でも高品質の結果を提供することで際立っています。 フォーマットとレイアウトが適切に保持された 125 以上の言語をサポートします。 複雑なドキュメント処理や大規模なバッチ操作の機能は、高度な画像前処理オプションによって十分にサポートされています。 .NET アプリケーションでは高度にカスタマイズ可能です。

Power Automate OCR は、Microsoft エコシステム内での小規模な自動化や統合には十分ですが、IronOCR は最高の精度と制御に優れており、複数の形式に対応する検索可能な PDF 作成などの機能をサポートしています。

プラットフォームの制約がなく、電力消費が重要でカスタマイズ可能な OCR ソリューションを求めている組織には、 IronOCRが推奨されます。 Iron Software は、開発者向けにさまざまなライブラリ オプションを提供しています。 詳細については、ライブラリ スイートのページをご覧ください。

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。