OCRツール

Power Automate OCR(開発者チュートリアル)

公開済み 2024年12月15日
共有:

イントロダクション

光学式文字認識(OCR)は、画像、スキャンした文書、およびPDF文書から印刷や手書きのテキストをスキャンし、それを機械読み取り可能なテキストに変換する技術です。 OCR (光学式文字認識)コンピュータが書籍、領収書、フォーム、写真などのさまざまな形式を識別できるようにし、PDFデータ抽出のためにデジタル化および自動化が可能になります。 それは画像内の文字やパターンを分析し、それらをテキストに対応させます。 この光学文字認識技術は、文書のデジタル化、自動PDFデータの抽出および入力、請求書処理、スキャンしたPDFを検索可能にするアプリケーションで使用されます。

OCRは劇的に進化し、テーブルやカラムなど、現代の複雑なレイアウト理解を伴う様々な言語を認識して読み取ることができます。 高度なOCR機能を持つソフトウェアは、画像の前処理技術も使用します。 それにはノイズ除去とコントラスト調整が含まれており、低品質な画像を読み取る際のOCRソフトウェアの精度を向上させます。 最も人気のあるOCRツールのうち3つは、Tesseract OCRエンジン、Power Automate、そして高精度かつ柔軟性を持つIronOCRです。 OCRは、企業、研究者、開発者が文書の管理やテキストの認識を外部委託するために不可欠なツールとなっています。

Microsoft Power Automate OCRとは何ですか?

光学文字認識 byMicrosoft Power Automateこの機能を使用することで、企業は画像、スキャンした文書、およびPDFからテキストを抽出し、簡単に編集できる機械可読形式に自動化する能力を身につけることができます。 Microsoft Power Platformの一部であるPower Automateは、デスクトップおよびオンラインで、ユーザーが必ずしもコーディング能力を必要とせずにフローを作成する能力を提供します。 彼らは、ワークフローにOCRを統合することにより、面倒なデータ入力を自動化し、請求書を処理し、文書をデジタル化することができます。

壊れた画像 Pixabayから追加、ファイルから選択、またはここに画像をドラッグアンドドロップしてください。

これにより、彼らの時間を節約し、エラーを最小限に抑えることができます。 それは確かに強力な検索ツールであり、AI Builderを使用して構築されたPower AutomateのOCR機能で多くの異なるフォーマットと言語のサポートを提供するために使用でき、複数の業界でのテキスト認識の使用をサポートしています。 これはExcel、SharePoint、OneDriveを含む他のMicrosoftサービスとシームレスに統合され、ドキュメントのスキャンから、保存や共有に至るまで、エンドツーエンドの自動化を開始することができます。 この点において、組織は効率を向上させ、文書管理を合理化し、業務の正確性を高めることができます。

Power AutomateでOCRを実装することの利点

Power AutomateでOCRを実装することには、次の利点があります。

時間と労力の節約: ドキュメントのテキスト抽出の自動化により、手動でデータを入力する場合に消費される時間と労力を大幅に節約できます。

コスト効果: ユーザーフレンドリーでアクセスしやすいため、高価なカスタムソフトウェアソリューションの必要性はほとんど、またはまったくありません。

統合: Microsoft Power Automateは、SharePoint、OneDrive、Excelなど、他のMicrosoft 365サービスとのシームレスな統合を提供します。

スケーラビリティ: 一度に数千のドキュメントを処理できる能力により、その有用性は大規模な企業にとって適しています。

エラーの削減: データ入力プロセスを自動化することで、人為的なエラーが発生する可能性は最小限に抑えられます。

Power AutomateでOCRを使用する方法

Power Automateは、AI BuilderやOneDriveを含むいくつかの異なる接続を通じてOCR機能をサポートしています。ここでは、Power Automateオンラインを取得する方法のステップバイステップガイド、またはPower Automateデスクトップを使用してOCR対応のワークフローを作成する方法を紹介します。

1. Power Automate を設定する

開始するには、Power Automate アカウントにログインするか、アカウントを持っていない場合はサインアップします。 Power AutomateはMicrosoft 365の一部であり、Office 365またはDynamics 365を使用している場合は既にアクセスできます。

壊れた画像 Pixabayから追加、ファイルから選択、またはここに画像をドラッグアンドドロップしてください。

2: 新しいフローを作成する

「作成」タブを開き、「インスタント フロー」をクリックして手動で開始できる新しいフローを作成します。

壊れた画像 Pixabayから追加、ファイルから選択、またはここに画像をドラッグアンドドロップしてください。

フローに名前を付けてください。 たとえば、それを「承認前」と名付け、次のトリガーを選択します:フォルダーにファイルが作成されたとき。(SharePointまたはOneDrive)または手動でフローをトリガーします。

壊れた画像 Pixabayから追加、ファイルから選択、またはここに画像をドラッグアンドドロップしてください。

以下のような新しいPowerオートメーションフローが作成されました。

Power Automate OCR(開発者チュートリアル):図 5 - 新しい自動化フロー

3: OneDriveまたはSharePointにファイルをアップロード

ドキュメントをアップロードするアクションを追加します(画像またはその他のPDFファイル)OneDrive for Business または SharePoint に。 このアクションは、データを抽出するためにOCRプロセスをトリガーします。 このデモでは、SharePoint ドキュメントライブラリを使用しています。

Power Automate OCR(開発者チュートリアル):図6 - ファイルをアップロード

4. AIビルダーのOCRアクションを活用する

AI Builderを活用して、画像からテキストを抽出するアクションを開発します。 AI Builderは、Power Automateにおける機械学習の深く統合された機能であり、ユーザーが画像やPDFからテキストを簡単に識別できるようにする、事前にトレーニングされたOCRモデルを備えています。

Power Automate OCR(開発者チュートリアル): 図7 - AI Builder

テキストを抽出するための画像ファイルを選択します。

Power Automate OCR(開発者チュートリアル): 図8 - 画像を選択

5. 抽出したデータの処理

OCRで言語データがテキストとして抽出されると、それをさらに処理することができます。 例えば:

抽出したテキストを Excel形式で保存します: 行を追加する操作を使用して、抽出したテキストをExcelファイルに追加します。

テキストをメールで送信する: アクションを使用して、抽出したテキストを特定の受信者に転送するメールを送信します。

データベースに保存: コネクタを使用してデータをSQL Server、SharePointリスト、または他のデータベースにプッシュして保存します。

IronOCRとは何ですか?

IronOCRは、画像、PDF、およびスキャンからOCRで正確にテキストを抽出する強力な.NET OCRライブラリです。 画質が悪い画像やノイズの多い画像で他のライブラリがテキスト認識に失敗する場合において、その効力を発揮します。また、125以上の言語をサポートしており、多様性のある多言語使用ケースに最適です。 IronOCRは、自動言語検出や画像前処理のノイズ除去、傾き補正など、多くの高度な機能をカプセル化しています。これは、すべてのスタイルや構造詳細、画像からテキストへの変換、PDFからテキストへの変換、検索可能なPDFを含む同じレイアウトのドキュメントのようです。

Power Automate OCR(開発者チュートリアル): 図9 - IronOCR

製品は、.NET プロジェクトの簡単な API を介して容易に組み込むことができ、開発者は開発するアプリケーションで OCR を活用できます。このライブラリは、ドキュメントのデジタル化、データ入力の自動化されたワークフロー、および高精度でスケーラブルなエンタープライズレベルのアプリケーション用のテキスト抽出タスクに便利です。 そのライブラリの強みは、使いやすさを発見し、強力なOCR機能を提供するときにあります。

IronOCR の機能

  • 低解像度の画像やノイズの多いスキャンドキュメントからでも、抽出するテキストの精度が卓越しています。
  • 125以上の言語をサポートし、自動言語検出により、多様な言語環境でのOCRを可能にします。
  • 画像の前処理には、ノイズ除去、傾き補正、コントラスト強調、シャープ化などのツールが必要です。これらはすべて、不完全な画像のパフォーマンスを向上させます。
  • 全文検索可能なPDFを作成する。 スキャンされた紙の文書や画像は、検索や整理を容易にするために、元のレイアウトを保持したまま、完全に検索可能なPDFに変換されます。
  • レイアウトとフォーマットを保持: このツールは、テーブルや列のような複雑でデジタル化に伴い保持しなければならないレイアウトの構造、フォント、およびフォーマットを維持します。
  • バッチ処理: これにより、複数の画像やドキュメントを一度の操作でバッチ処理できます。 この技術は、大量の文書処理をサポートします。
  • .NETとの簡単な統合: シンプルなAPIをサポートしているため、.NETアプリケーションに簡単に統合でき、開発者が大規模な努力を払うことなくOCRの実装が容易になります。

    OCR を実行するためのサンプルコード

using IronOcr;
class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine variable
        var Ocr = new IronTesseract();
        // Add multiple languages
        Ocr.Language = OcrLanguage.English;
        // Image file path
        var inputFile = @"path\to\your\image.png";
        // Read the image and perform OCR
        using (var input = new OcrInput(inputFile))
        {
            // Perform OCR
            var result = Ocr.Read(input);
            // Display the result
            Console.WriteLine("Text:");
            Console.WriteLine(result.Text);
        }
    }
}
using IronOcr;
class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine variable
        var Ocr = new IronTesseract();
        // Add multiple languages
        Ocr.Language = OcrLanguage.English;
        // Image file path
        var inputFile = @"path\to\your\image.png";
        // Read the image and perform OCR
        using (var input = new OcrInput(inputFile))
        {
            // Perform OCR
            var result = Ocr.Read(input);
            // Display the result
            Console.WriteLine("Text:");
            Console.WriteLine(result.Text);
        }
    }
}
Imports IronOcr
Friend Class Program
	Shared Sub Main(ByVal args() As String)
		' Initialize Iron Tesseract OCR engine variable
		Dim Ocr = New IronTesseract()
		' Add multiple languages
		Ocr.Language = OcrLanguage.English
		' Image file path
		Dim inputFile = "path\to\your\image.png"
		' Read the image and perform OCR
		Using input = New OcrInput(inputFile)
			' Perform OCR
			Dim result = Ocr.Read(input)
			' Display the result
			Console.WriteLine("Text:")
			Console.WriteLine(result.Text)
		End Using
	End Sub
End Class
VB   C#

結論

IronOCRとPower Automate OCRの両方がテキスト認識に関して非常に強力であるにもかかわらず、IronOCRは開発者や企業がPower Automate OCRによってサポートされるシンプルなケースを超える本格的なOCR機能を必要とする場合に、はるかに堅牢で柔軟なソリューションを提供します。 対照的に、Power AutomateのOCRエンジンはシンプルなワークフローのために構築されており、追加のサブスクリプションが必要になる可能性があります。

対照的に、IronOCRは低品質の入力画像を扱う場合でも、非常に高品質な結果を提供する点で際立っています。 125以上の言語をサポートし、強力なフォーマットとレイアウトの保持が可能です。 その複雑なドキュメント処理と大規模なバッチ操作は、高度な画像前処理機能に適しています。 それでも、時には.NETアプリケーションで非常にカスタマイズ可能です。

Power Automate OCRは、より小規模なオートメーションやMicrosoftに厳密に構築された統合には十分ですが、IronOCRはユーザーが持つコントロール量、最大精度、さらには複数の形式をサポートする検索可能なPDF作成などの機能により、群を抜いて優れています。

プラットフォームの制約がなく、電力重視でカスタマイズ可能なOCRソリューションを求めている組織では、IronOCR. Iron Softwareは、開発者にさまざまな種類のライブラリを提供していますライブラリスイートページ詳細については。

次へ >
EasyocrとTesseractの比較(OCR機能の比較)